Wintersemester 2023/24
St. Nikolaus 2023
© 2023 Prof. Dr. Rüdiger W. Braun
obwohl prinzipiell mehrere Szenarien möglich sind
"klar" und "unklar" bemisst sich nach dem Signifikanzniveau
Generell sind vier Ausgänge des Experiments möglich
Das Pestizid schädigt L-Bakterien nicht mehr als R-Bakterien und das Experiment beantwortet die Frage mit nein
🟢 Korrekte Antwort
Das Pestizid schädigt L-Bakterien nicht mehr als R-Bakterien und das Experiment beantwortet die Frage mit ja
🔴 Falsche Antwort
Das Pestizid schädigt L-Bakterien mehr als R-Bakterien und das Experiment beantwortet die Frage mit nein
🔴 Falsche Antwort
Das Pestizid schädigt L-Bakterien mehr als R-Bakterien und das Experiment beantwortet die Frage mit ja
🟢 Korrekte Antwort
Was soll im Fall unklarer Datenlage die Antwort sein?
Durch die Auswahl der Stichprobe kommt Zufall ins Spiel. Falsche Antworten sind unvermeidbar.
bei unklarer Datenlage wird also die Nullhypothese beibehalten
Die Priorität liegt auf der Vermeidung des Fehlers 1. Art. Diese Asymmetrie ist ein entscheidendes Merkmal der Testtheorie.
$H_0$ wird beibehalten | $H_0$ wird abgelehnt | |
---|---|---|
$H_0$ trifft zu | richtige Entscheidung | Fehler 1. Art |
$H_1$ trifft zu | Fehler 2. Art | richtige Entscheidung |
Wo kamen diese Zahlen her:
from scipy import stats
P = stats.binom(27, 0.75)
P.cdf(15) # cumulative distribution function
0.021622275992339908
Zum Vergleich:
P.cdf(16)
0.05277727837539943
Diese Fehlerwahrscheinlichkeit ist höher als das Signifikanzniveau $\alpha=0.05$
Wir hätte ich den Wert 15 finden können ausgehend von $\alpha=0.05$
P.ppf(0.05) # percent point function
16.0
Das ist das kleinste $k$, dessen Wert über 0.05 liegt
$n=27$ und $p_0=0.75$ und $H_0=\{p\ge p_0\}$ und $\alpha=0.05$
Die Nullhypothese wird abgelehnt, wenn 15 oder weniger Erfolge beobachtet werden
Angenommen, das Pestizid senkt den Anteil von L-Bakterien auf 50%, mit welcher Wahrscheinlichkeit wird unser Test diesen Rückgang entdecken?
Fehlerwahrscheinlichkeit zweiter Art für den Bakterientest
Q = stats.binom(27, 0.5)
1 - Q.cdf(15)
0.22103416919708252
Die orangefarbenen Balken zeigen Fehlentscheidungen
P
ist die Binomialverteilung $B_{n,p_0}$P.cdf(c-1)
$\le\alpha$ und P.cdf(c)
$>\alpha$P = stats.binom(27, 0.75)
alpha = 0.05
c = P.ppf(alpha)
c
16.0
P
ist die Binomialverteilung $B_{n,p_0}$P.cdf(c-1)
$<1-\alpha$ und P.cdf(c)
$\ge1-\alpha$Bevorzugen sie das aromatisierte Gemüse mit höherer Wahrscheinlichkeit als vorher?
soll zum Signifikanzniveau $\alpha = 0.05$ beantwortet werden
P = stats.binom(38, 0.11)
alpha = 0.05
P.ppf(1-alpha)
8.0
P.cdf(8)
0.9801967881175796
P.cdf(7)
0.9484147640607011
Also $c=8$
Wenn 9 oder mehr Fische das aromatisierte Futter bevorzugen, dann wird die Nullhypothese, dass das neue Futter nicht besser angenommen wird als das alte, abgelehnt
Wenn die Nullhypothese trotzdem gilt, dann machen wir mit Wahrscheinlichkeit
1 - P.cdf(8)
0.019803211882420402
den Fehler erster Art
Q = stats.binom(38, 0.15)
Q.cdf(8)
0.8942848027814655
und die Power gleich
1 - Q.cdf(8)
0.1057151972185345
Orangefarbene Balken zeigen Fehlentscheidungen
Wie knapp wurde das vorgeschriebene Signifikanzniveau eingehalten bzw. verfehlt?
Software gibt immer den $p$-Wert aus
res = stats.binomtest(9, 38, 0.11, alternative="greater")
res
BinomTestResult(k=9, n=38, alternative='greater', statistic=0.23684210526315788, pvalue=0.01980321188242038)
res.pvalue
0.01980321188242038
res.statistic == 9/38
True
Der Begriff der Teststatistik spielt erst bei den später zu besprechenden Tests eine Rolle
oder mit stats.binomtest