Wintersemester 2023/24
© 2023 Prof. Dr. Rüdiger W. Braun
B_{n,p}(k) =
\begin{pmatrix}
n \\ k
\end{pmatrix}
\cdot p^k \cdot (1-p)^{n-k} $$
Bestimmte Fische erkranken mit 15% Wahrscheinlichkeit an einem Parasiten.
Wir beobachten 47 Fische. Mit welcher Wahrscheinlichkeit erkranken genau 5 Fische?
from scipy import stats
P = stats.binom(47, 0.15)
P.pmf(5)
0.12643265696974557
Die interessantere Frage ist: Mit welcher Wahrscheinlichkeit erkranken höchstens 5 Fische?
$$k$$ | $$B_{47, 0.15}(k)$$ |
---|---|
0 | 0.00048 |
1 | 0.00399 |
2 | 0.01621 |
3 | 0.04292 |
4 | 0.08331 |
5 | 0.12643 |
$$\sum$$ | 0.27335 |
P.cdf
erhält man die kumulierten Werte der Binomialverteilung"cdf": cumulative function
P = stats.binom(47, 0.15) # an dieser Stelle redundant
P.cdf(5)
0.273346361465445
Wir haben die orange Fläche im Bild ausgerechnet.
Mit welcher Wahrscheinlichkeit erkranken mindesten 6 Fische?
P = stats.binom(47, 0.10)
P.cdf(5)
0.6714311028538673
B_{27,\,0.75}(14) =
\begin{pmatrix}
27 \\
14
\end{pmatrix}
\cdot 0.75^{14} \cdot 0.25^{13}
= 0.005326
\end{equation*}
sind 14 von 27 Bakterien $L$-Bakterien\sum_{k=0}^{14} B_{27,\,0.75}(k)
\end{equation*}P = stats.binom(27, 0.75)
P.cdf(14)
0.0077756082665356736
Gegenfrage
P = stats.binom(70, 0.80)
P.cdf(49) # muss kleiner als 0.10 sein
0.030308084751943774
P = stats.binom(65, 0.80)
P.cdf(49)
0.21541354210671845
P = stats.binom(68, 0.80)
P.cdf(49) # muss kleiner 0.1 sein
0.07269329945304003
P = stats.binom(67, 0.80)
P.cdf(49) # muss kleiner 0.1 sein
0.10773154689999606
Wir brauchen 68 Tiere
Geht auch grafisch mit seaborn
import seaborn as sns
import numpy as np
k = np.arange(50, 80)
P = stats.binom(k, 0.80)
B = P.cdf(49)
ax = sns.scatterplot(x=k, y=B)
ax.grid(True)
Der Erwartungswert ist derjenige Wert, den man im Mittel beobachten würde, wenn man das Experiment sehr oft wiederholt.
Bei einer Lotterie ist der Erwartungswert der Betrag, bei dem die Lotterie fair wäre, bei dem also weder der Spieler noch der Betreiber langfristig Geld verdienen würde.
Klasse | Ziffern | Gewinn $$ k $$ | $$P(X=k)$$ | $$ k \cdot P(X=k) $$ |
---|---|---|---|---|
I | 7 | 177777.00€ | 0.0000001 | 0.018€ |
II | 6 | 77777.00€ | 0.0000010 | 0.078€ |
III | 5 | 7777.00€ | 0.0000100 | 0.078€ |
IV | 4 | 777.00€ | 0.0001000 | 0.078€ |
V | 3 | 77.00€ | 0.0010000 | 0.077€ |
VI | 2 | 17.00€ | 0.0100000 | 0.170€ |
VII | 1 | 5.00€ | 0.1000000 | 0.500€ |
$\sum$ | 0.998€ |
E(X) = \sum_k P(X=k) \cdot k
\end{equation*}Sei $ X $ die Augenzahl eines fairen Würfels. \begin{align*} E(X) &= \frac 16 \cdot 1 + \frac 16 \cdot 2 + \frac 16 \cdot 3 + \frac 16 \cdot 4 + \frac 16 \cdot 5 + \frac 16 \cdot 6 \\ &= \frac{21}6 = \frac72 = 3.5 \end{align*}
Im Mittel zeigt ein fairer Würfel $ 3.5 $ Augen
E(X) &= 0.000\,000\,1 \cdot J + 0.000\,001 \cdot 77\,777 \\
&\qquad {} + 0.000\,01 \cdot 7\,777 + 0.000\,1 \cdot 777 \\
&\qquad {} + 0.001 \cdot 77 + 0.01 \cdot 17 + 0.1 \cdot 5 \\
&= 0.000\,000\,1 \cdot J + 0.980
\end{align*}J = \frac{1.52}{0.000\,000\,1} = 15\,200\,000
\end{equation*}Die Varianz einer Zufallsvariablen $X$ ist definiert als \begin{equation*} \text{Var}(X) = \sum_{k=0}^\infty (k-\mu)^2 \cdot P(X=k) \end{equation*} wobei $ \mu = E(X) $.
Die Standardabweichung oder Streuung von $X$ ist definiert als die Wurzel aus der Varianz \begin{equation*} \sigma = \sqrt{\text{Var}(X)} \end{equation*}
\begin{align*}
\text{Var}(X)
&= \left(1 - \frac72\right)^2 \cdot \frac16 + \left(2 -
\frac72\right)^2 \cdot \frac16 + \left(3 - \frac72\right)^2
\cdot \frac16\\
&\qquad{} + \left(4 - \frac72\right)^2 \cdot \frac16 + \left(5
- \frac72\right)^2 \cdot \frac16 + \left(6 - \frac72\right)^2
\cdot \frac16 \\
&= \frac{35}{12} \\
&= 2.91667
\end{align*}
\begin{equation*}
\sigma = \sqrt{\frac{35}{12}}
= 1.7078
\end{equation*}
Datensatz | Modell |
---|---|
arithmetisches Mittel | Erwartungswert |
empirische Varianz | Varianz |
Stichprobenstreuung | Streuung |
Die Zufallsvariable $X$ sei binomialverteilt gemäß $B_{n,p}$. Dann \begin{align*} E(X) &= n \cdot p \\ \text{Var}(X) &= n \cdot p \cdot (1-p) \end{align*}
Zwei diskrete Zufallsvariable $X$ und $Y$ sind stochastisch unabhängig, wenn für alle möglichen Werte $k$ und $m$ \begin{equation*} P(X=k, Y=m) = P(X=k) \cdot P(Y=m) \end{equation*}
Die Unabhängigkeit muss durch die Versuchsplanung gesichert werden
Produktformel für den Erwartungswert: $X$ und $Y$ seien unabhängige Zufallsvariable. Dann \begin{equation*} E(X \cdot Y) = E(X) \cdot E(Y) \end{equation*}
Summenformel für die Varianz: $X$ und $Y$ seien unabhängige Zufallsvariable. Dann \begin{equation*} \text{Var}(X + Y) = \text{Var}(X) + \text{Var}(Y) \end{equation*}
import pandas as pd
import numpy as np
p = 0.15 # Das weiß die Experimentatorin nicht
P = stats.binom(1, p)
P.rvs(10).sum()
1
P.rvs(40).sum()
4
P.rvs(100).sum()
12
P.rvs(1000).sum()
141