Aufgabenbeispiele von Tests

Durch Aktualisieren des Browsers (z.B. mit Taste F5) kann man neue Beispielaufgaben sehen


Hypothesen-Test linksseitig

Beispiel:

Ein Basketballspieler behauptet, er habe bei Freiwürfen eine Trefferwahrscheinlichkeit von p=0,25. Sein Trainer glaubt, dass er sich dabei überschätzt. Um das zu überprüfen, muss der Basketballspieler 30 mal werfen. In welchem Intervall müssen die Treffer liegen, dass sich der Trainer auf einem Signifikanzniveau von 5% bestätigt sieht? Wie hoch bleibt dabei die Irrtumswahrscheinlichkeit, dass der Trainer aufgrund des Signifikanztests die Trefferwahrscheinlichkeit irrtümlicherweise als niedriger annimmt?

Lösung einblenden
kP(X≤k)
00.0002
10.002
20.0106
30.0374
40.0979
50.2026
60.3481
70.5143
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≥ 0.25 zu verwerfen. Der Test soll bestätigen, dass p<0.25 ist, also ist es ein linksseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(30,0.25,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 3 weniger als 5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.25 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p<0.25 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0374 =3.74% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H0: [0;3]

Nicht-Ablehnungsbereich von H0: [4;30]

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [0;3], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [4;30], so muss die Nullhypothese beibehalten werden.

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Hypothesen-Test rechtsseitig

Beispiel:

Einem partystarken 12-Klässler wird von einem nicht ganz vorurteilsfreien Lehrer vorgeworfen, nichts auf die Klassenarbeit gelernt haben. Diese findet in Form eines Multiple Choice-Tests mit 96 Aufgaben statt, bei der genau eine der vier Antwortmöglichkeiten richtig ist. In welchem Bereich muss nun die Anzahl der richtigen Antworten liegen, damit er auf einem Signifikanzniveau von 5% die Behauptung des Lehrers widerlegen kann.

Lösung einblenden
kP(X≤k)
......
260.7264
270.7971
280.8552
290.9006
300.9344
310.9584
320.9747
330.9852
340.9917
350.9955
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≤ 0.25 zu verwerfen. Der Test soll bestätigen, dass p>0.25 ist, also ist es ein rechtsseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.

Das heißt, dass der Nicht-Ablehnungsbereich von H0 (hier blau eingefärbt) auf der linken Seite mindestens 1-0.05= 0.95 Wahrscheinlichkeit auf sich vereinen muss.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(96,0.25,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 31 erstmals mindestens 95% der Gesamt-Wahrscheinlichkeit ausmachen.

Nicht-Ablehnungsbereich von H0: [0;31]

Dies bedeutet für den eigentlich gesuchten Ablehnungsbereich H0 dass dieser erst bei 32 Treffern beginnt.

Ablehnungsbereich von H0: [32;96]

Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.25 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p>0.25 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0416 =4.16% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [32;96], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [0;31], so muss die Nullhypothese beibehalten werden.

11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Hypothesen-Test rechtsseitig

Beispiel:

Ein defektes Kopiergerät, welches viele fehlerhafte Kopien produzierte, wurde repariert. Die mit der Reparatur beauftrage Firma behauptet, dass die Ausschussquote jetzt nur noch höchstens 0,08 beträgt. Um diese Behauptung (Nullhypothese) auf dem Signifikanzniveau von 5% zu testen, werden 500 Kopien angefertigt. Ermittle die zugehörige Entscheidungsregel.

Lösung einblenden
kP(X≤k)
......
450.8189
460.8575
470.8899
480.9165
490.9378
500.9545
510.9674
520.977
530.9841
540.9892
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≤ 0.08 zu verwerfen. Der Test soll bestätigen, dass p>0.08 ist, also ist es ein rechtsseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.

Das heißt, dass der Nicht-Ablehnungsbereich von H0 (hier blau eingefärbt) auf der linken Seite mindestens 1-0.05= 0.95 Wahrscheinlichkeit auf sich vereinen muss.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(500,0.08,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 50 erstmals mindestens 95% der Gesamt-Wahrscheinlichkeit ausmachen.

Nicht-Ablehnungsbereich von H0: [0;50]

Dies bedeutet für den eigentlich gesuchten Ablehnungsbereich H0 dass dieser erst bei 51 Treffern beginnt.

Ablehnungsbereich von H0: [51;500]

Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.08 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p>0.08 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0455 =4.55% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [51;500], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [0;50], so muss die Nullhypothese beibehalten werden.

30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Fehler 2. Art

Beispiel:

Ein Großhändler beklagt sich, dass gelieferte LED-Leuchtmittel mit einer Wahrscheinlichkeit von p=0,26 bereits nach wenigen Stunden defekt werden. Die herstellende Firma glaubt das nicht und hält die Ausschussquote für viel geringer. Deswegen führt sie einen Test mit 93 Leuchtmitteln durch. Als Signifikanzniveau für diesen Test wird 5% festgelegt. a) In welchem Bereich muss die Anzahl der defekten LED-Leuchtmittel liegen, damit die Firma die Aussage des Großhändlers widerlegt? b) In Wirklichkeit liegt die Ausfallwahrscheinlickeit der Leuchtmittel nur bei p=0,12. Wie groß ist nun die Wahrscheinlichkeit, dass bei dem Test trotzdem die Anzahl der defekten Leuchtmittel nicht in den Ablehnungsbereich gefallen ist und somit - irrtümlicherweise - die falsche Nullhypothese nicht verworfen wurde?

Lösung einblenden
kP(X≤k)
......
110.0007
120.0017
130.0039
140.0084
150.0166
160.0308
170.0533
180.0868
190.1331
200.1934
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≥ 0.26 zu verwerfen. Der Test soll bestätigen, dass p<0.26 ist, also ist es ein linksseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(93,0.26,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 16 weniger als 5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.26 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p<0.26 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0308 =3.08% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H0: [0;16]

Nicht-Ablehnungsbereich von H0: [17;93]

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [0;16], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [17;93], so muss die Nullhypothese beibehalten werden.

11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

In dieser Aufgabe ist ja aber H0:p=0.26 falsch, weil ja in Wirklichkeit p=0.12 ist.

Gesucht ist nun die Wahrscheinlichkeit, dass bei dem Test die Trefferanzahl nicht in den Ablehnungsbereich gefallen ist, sondern in den Bereich von 17 bis 93, so dass H0 (irrtümlicherweise) nicht verworfen wurde.

Diese Wahrscheinlichkeit (mit dem richtigen p=0.12) beträgt nun: P0.1293 (X17) =1- P0.1293 (X16) ≈ 1-0.9498 ≈ 0.0502

Mit 5.02% Wahrscheinlichkeit landet also das Ergebnis des Test im Nicht-Ablehnungsbereich (im Histogramm oben: blauer Bereich), so dass die falsche Nullhypothese nicht verworfen wird.

zweiseitiger Test

Beispiel:

Ein Roulettetisch scheint ungleichmäßig zu laufen. Ein Spieler bezweifelt deswegen, dass die vorgegebene Wahrscheinlichkeit der grünen Null von p= 1 37 wirklich stimmt. Diese Vermutung soll durch einen zweiseitigen Test mit 140 Drehungen des Roulettes untermauert werden. Die maximale Irrtumswahrscheinlichkeit α soll dabei 5% betragen.
In welchen Bereichen muss die Häufigkeit der grünen Null bei der Stichprobe liegen, um die Nullhypothese p= 1 37 statistisch untermauert ablehnen zu können? Wie groß ist in diesem Fall die Irrtumswahrscheinlichkeit?

Lösung einblenden
kP(X≤k)
00.0216
10.1055
20.2676
30.4746
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p = 1 37 zu verwerfen. Der Test soll bestätigen, dass p< 1 37 oder p> 1 37 ist, es ist ein zweiseitiger Hypothesentest.

Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken und auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieser beiden Bereiche gerade noch kleiner als das Signifikanzniveau 5% ist.

Dazu teilen wir das Signifikanzniveau 5% gerecht auf 2.5% auf der linken und 2.5% auf der rechten Seite.

Linke Seite:

Schaut man dazu die kumulierte Binomialverteilung an (TI: binomcdf mit n=140 und p= 1 37 ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 0 gerade noch weniger als 2.5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Damit haben wir den linken Teil des Ablehnungsbereichs

kP(X≤k)
......
60.9134
70.9629
80.9857
90.995
100.9984
......

Rechte Seite:

Auch am rechten Rand darf der Ablehnungsbereich höchstens 2.5% Gesamtwahrscheinlikeit auf sich vereinen, das bedeutet, dass der gesamte Bereich links vom rechten Ablehnungsbereich mindestens 1 - 0.025 = 0.975 als Wahrscheinlichkeit haben muss.

In der Tabelle links erkennt man, dass bei k=8 erstmals P 1 37 140 (Xk) ≥ 0.975 ist (links in der Tabelle in blau dargestellt). Das bedeutet, dass das Intervall von 9 bis 140 das größte ist, das am rechten Rand eine Gesamtwahrscheinlichkeit von unter 2.5% hat.

Der Ablehnungsbereich auf der rechten Seite ist somit von 9 bis 140.

Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in eines dieser beiden Intervalle, so wäre das bei Gültigkeit der Nullhypothese H0: p= 1 37 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p≠ 1 37 als statistisch abgesichert betrachten darf.

Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von P 1 37 140 (X0) = 0.0216 auf der linken Seite und P 1 37 140 (X9) = 1-0.9857 = 0.0143 auf der rechten Seite.
Insgesamt ist somit die Irrtumswahrscheinlichkeit PIrr = 0.0216 + 0.0143 = 0.0358 =3.58% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H0: [0;0] und [9;140]

Nicht-Ablehnungsbereich von H0: [1;8]

Entscheidungsregel: Fällt die Anzahl der Treffer in einen der Ablehnungsbereiche von H0: [0;0] oder [9;140], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [1;8], so muss die Nullhypothese beibehalten werden.

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Fehler 1. Art beurteilen

Beispiel:

Eine große Handelskette überlegt, ob sie eine Kunden-App entwickeln und einführen soll. Die Finanzabteilung hat dabei herausgefunden, dass sich die Entwicklung und Bewerbung solch einer App nur dann rechnet, wenn sich auch mindestens 35% der Kunden die App aufs Smartphone installiert. Deswegen beschließt die Geschäftsführung einen Hypothesentest in Form einer Befragung von 600 Kunden durchzuführen. Dabei soll das Risiko auf 18% begrenzt werden, dass aufgrund des Tests die App entwickelt wird, obwohl sich diese Investition wirtschaftlich nicht lohnen wird.

Entscheide dich, welche der angebotenen Nullhypothesen für diesen Test verwendet werden muss.

Lösung einblenden

Wir betrachten jede der 4 möglichen Nullhypothesen im Detail:

1. Der Prozentsatz der Kunden, die die App installieren, beträgt höchstens 35%

ok

Wenn die Nullhypothese H0: " ... höchstens 35%", also p ≤ 0.35 lautet, soll ja der Test "bestätigen", dass p > 0.35 ist - also ist es ein rechtsseitiger Hypothesentest.

Das bedeutet, dass die Wahrscheinlichkeit eines Ergebnisses des Test im rechten (orangen) Ablehnungsbereich kleiner als das Signifikanzniveau α = 18% sein muss, falls die Nullhypothese H0: p ≤ 0.35 doch stimmen sollte.

Die Wahrscheinlichkeit, p ≤ 0.35 abzulehnen, obwohl es stimmt, ist somit kleiner als 18%

In diesem Fall würde das bedeuten, dass die Wahrscheinlichkeit p ≤ 0.35 irrtümlicherweise abzulehnen, damit p > 0.35 anzunehmen (obwohl dies falsch ist), und somit die App zu entwickeln und zu bewerben, obwohl die Kosten nie wieder eingebracht werden, weil zu wenige Kunden die App installieren werden, auf unter 18% begrenzt werden könnte.

Mit dieser Nullhypothese kann also ein Test die gegebenen Vorgaben erfüllen.

191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236

2. Der Prozentsatz der Kunden, die die App installieren, beträgt mindestens 35%

error

Wenn die Nullhypothese H0: " ... mindestens 35%", also p ≥ 0.35 lautet, soll ja der Test "bestätigen", dass p < 0.35 ist - also ist es ein linksseitiger Hypothesentest.

Das bedeutet, dass die Wahrscheinlichkeit eines Ergebnisses des Test im linken (orangen) Ablehnungsbereich kleiner als das Signifikanzniveau α = 18% sein muss, falls die Nullhypothese H0: p ≥ 0.35 doch stimmen sollte.

Die Wahrscheinlichkeit, p ≥ 0.35 abzulehnen, obwohl es stimmt, ist somit kleiner als 18%.

In diesem Fall würde das bedeuten, dass die Wahrscheinlichkeit p ≥ 0.35 irrtümlicherweise abzulehnen, damit p < 0.35 anzunehmen (obwohl dies falsch ist), und somit die App gar nicht zu entwickeln, obwohl dies wirtschaftlich sinnvoll wäre, auf unter 18% begrenzt werden könnte.

Mit dieser Nullhypothese würde man also ein anderes Risiko absichern, als das im Aufgabentext geforderte.

183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228

3. Der Prozentsatz der Kunden, die die App installieren, beträgt höchstens 18%

error

Die Nullhypothese H0: " ... höchstens 18%", also p ≤ 0.18 macht keinen Sinn, weil die 18%" ja die maximale Irrtumswahrscheinlichkeit angibt, also wie groß höchstens die Wahrscheinlichkeit ist, dass einen das Ergebnis des Hypothesentests zu einer falschen Annahme führt.

In der Nullhypothese muss es doch aber um die eigentlich angezweifelte Wahrscheinlichkeit p=35% gehen, also den Prozentsatz der Kunden, die die App installieren werden.

4. Der Prozentsatz der Kunden, die die App installieren, beträgt mindestens 18%

error

Die Nullhypothese H0: " ... mindestens 18%", also p ≥ 0.18 macht keinen Sinn, weil die 18%" ja die maximale Irrtumswahrscheinlichkeit angibt, also wie groß höchstens die Wahrscheinlichkeit ist, dass einen das Ergebnis des Hypothesentests zu einer falschen Annahme führt.

In der Nullhypothese muss es doch aber um die eigentlich angezweifelte Wahrscheinlichkeit p=35% gehen, also den Prozentsatz der Kunden, die die App installieren werden.