Aufgabenbeispiele von Tests

Durch Aktualisieren des Browsers (z.B. mit Taste F5) kann man neue Beispielaufgaben sehen


Hypothesen-Test linksseitig

Beispiel:

Ein Basketballspieler behauptet, er habe bei Freiwürfen eine Trefferwahrscheinlichkeit von p=0,8. Sein Trainer glaubt, dass er sich dabei überschätzt. Um das zu überprüfen, muss der Basketballspieler 20 mal werfen. In welchem Intervall müssen die Treffer liegen, dass sich der Trainer auf einem Signifikanzniveau von 5% bestätigt sieht? Wie hoch bleibt dabei die Irrtumswahrscheinlichkeit, dass der Trainer aufgrund des Signifikanztests die Trefferwahrscheinlichkeit irrtümlicherweise als niedriger annimmt?

Lösung einblenden
kP(X≤k)
......
70
80.0001
90.0006
100.0026
110.01
120.0321
130.0867
140.1958
150.3704
160.5886
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≥ 0.8 zu verwerfen. Der Test soll bestätigen, dass p<0.8 ist, also ist es ein linksseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(20,0.8,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 12 weniger als 5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.8 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p<0.8 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0321 =3.21% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H0: [0;12]

Nicht-Ablehnungsbereich von H0: [13;20]

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [0;12], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [13;20], so muss die Nullhypothese beibehalten werden.

7
8
9
10
11
12
13
14
15
16
17
18
19
20
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Hypothesen-Test rechtsseitig

Beispiel:

Ein Basketballspieler behauptet, er habe bei Freiwürfen seine bisherige Trefferwahrscheinlichkeit von p=0,5 inzwischen verbessert. Sein Trainer glaubt ihm sich das nicht. Um seine Verbesserung zu überprüfen, wird ein Signifikanz-Test mit 74 Würfen des Basketballspieler vereinbart. Dabei soll die Irrtumswahrscheinlichkeit berechnet werden können, dass man aufgrund des Test eine höhere Treffer-Quote annimmt, obwohl dies in Wirklichkeit gar nicht der Fall ist. In welchem Intervall müssen die Treffer liegen, damit sich der Spieler auf einem Signifikanzniveau von 5% bestätigt sieht? Wie hoch bleibt dabei die Irrtumswahrscheinlichkeit.

Lösung einblenden
kP(X≤k)
......
390.7193
400.792
410.8523
420.8997
430.9349
440.9597
450.9763
460.9867
470.993
480.9965
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≤ 0.5 zu verwerfen. Der Test soll bestätigen, dass p>0.5 ist, also ist es ein rechtsseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.

Das heißt, dass der Nicht-Ablehnungsbereich von H0 (hier blau eingefärbt) auf der linken Seite mindestens 1-0.05= 0.95 Wahrscheinlichkeit auf sich vereinen muss.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(74,0.5,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 44 erstmals mindestens 95% der Gesamt-Wahrscheinlichkeit ausmachen.

Nicht-Ablehnungsbereich von H0: [0;44]

Dies bedeutet für den eigentlich gesuchten Ablehnungsbereich H0 dass dieser erst bei 45 Treffern beginnt.

Ablehnungsbereich von H0: [45;74]

Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.5 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p>0.5 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0403 =4.03% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [45;74], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [0;44], so muss die Nullhypothese beibehalten werden.

24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Hypothesen-Test rechtsseitig

Beispiel:

Die Kursstufenschüler Maxi und Noah verbringen ihr Pausen leidenschaftlich gerne mit einem Bäckertüten-Mülleimer-Contest. Dabei geht es darum, eine zusammengeknüllte Bäckertüte in den an der entferntesten Ecke stehenden Altpapierbehälter zu treffen. Der interessiert zuschauende Mathelehrer rät ihnen doch etwas näher an den Mülleimer ran zu gehen, weil sie eh höchstens jedes zehnte mal treffen. Empfindlich in ihre Macho-Ehre verletzt, beschließen sie darauf hin ein Test mit 43 Würfen durchzuführen, der die absurd niedrige vom Lehrer behauptete Trefferquote auf einem Signifikanzniveau von 0,1% widerlegen soll. In welchem Bereich müsste die Trefferzahl liegen, um über den Mathelehrer statistisch belegt zu triumphieren zu können? Wie hoch ist dann die Irrtumswahrscheinlichkeit, dass die Trefferqutoe von höchstens 10% fälschlicherweise abgelehnt wurde?

Lösung einblenden
kP(X≤k)
......
60.8667
70.9393
80.9756
90.9913
100.9972
110.9992
120.9998
131
141
151
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≤ 0.1 zu verwerfen. Der Test soll bestätigen, dass p>0.1 ist, also ist es ein rechtsseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 0.1% ist.

Das heißt, dass der Nicht-Ablehnungsbereich von H0 (hier blau eingefärbt) auf der linken Seite mindestens 1-0.001= 0.999 Wahrscheinlichkeit auf sich vereinen muss.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(43,0.1,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 11 erstmals mindestens 99.9% der Gesamt-Wahrscheinlichkeit ausmachen.

Nicht-Ablehnungsbereich von H0: [0;11]

Dies bedeutet für den eigentlich gesuchten Ablehnungsbereich H0 dass dieser erst bei 12 Treffern beginnt.

Ablehnungsbereich von H0: [12;43]

Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.1 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p>0.1 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0008 =0.08% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [12;43], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [0;11], so muss die Nullhypothese beibehalten werden.

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Fehler 2. Art

Beispiel:

Ein spielsüchtiger 12-Klässler möchte nachweisen, dass ein bestimmter Würfel gezinkt ist und zu selten eine 6 kommt. Dazu macht er einen Signifikanztest mit 64 Würfen und einem Signifikanzniveau von 0,1%. a) In welchem Bereich muss die Anzahl der 6er liegen, damit er die Spielbank verklagen kann. b) In Wirklichkeit ist der Würfel tatsächlich manipuliert und würfelt nur mit der Wahrscheinlichkeit von 14% eine sechs. Wie groß ist nun die Wahrscheinlichkeit, dass bei dem Test trotzdem die Anzahl der Sechsen nicht in den Ablehnungsbereich gefallen ist und somit - irrtümlicherweise - die falsche Nullhypothese nicht verworfen wurde?

Lösung einblenden
kP(X≤k)
00
10.0001
20.0008
30.0037
40.0124
50.0332
60.0743
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≥ 1 6 zu verwerfen. Der Test soll bestätigen, dass p< 1 6 ist, also ist es ein linksseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 0.1% ist.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(64, 1 6 ,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 2 weniger als 0.1% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p= 1 6 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p< 1 6 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0008 =0.08% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H0: [0;2]

Nicht-Ablehnungsbereich von H0: [3;64]

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [0;2], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [3;64], so muss die Nullhypothese beibehalten werden.

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

In dieser Aufgabe ist ja aber H0:p= 1 6 falsch, weil ja in Wirklichkeit p=0.14 ist.

Gesucht ist nun die Wahrscheinlichkeit, dass bei dem Test die Trefferanzahl nicht in den Ablehnungsbereich gefallen ist, sondern in den Bereich von 3 bis 64, so dass H0 (irrtümlicherweise) nicht verworfen wurde.

Diese Wahrscheinlichkeit (mit dem richtigen p=0.14) beträgt nun: P0.1464 (X3) =1- P0.1464 (X2) ≈ 1-0.0042 ≈ 0.9958

Mit 99.58% Wahrscheinlichkeit landet also das Ergebnis des Test im Nicht-Ablehnungsbereich (im Histogramm oben: blauer Bereich), so dass die falsche Nullhypothese nicht verworfen wird.

zweiseitiger Test

Beispiel:

Ein Würfel wirkt etwas unwuchtig, so als ob nicht alle Bereiche des Körpers gleich schwer wären. Deswegen wird vermutet, dass die Wahrscheinlichkeit, eine Sechs mit diesem Würfel zu würfeln, p ≠ 1 6 sein müsste. Diese Vermutung soll durch einen zweiseitigen Test mit 78 mal würfeln untermauert werden. Die maximale Irrtumswahrscheinlichkeit α soll dabei 0,1% betragen.
In welchen Bereichen muss die Anzahl der gewürfelten Sechser bei der Stichprobe liegen, um die Nullhypothese p= 1 6 statistisch untermauert ablehnen zu können?
Wie groß ist in diesem Fall die Irrtumswahrscheinlichkeit?

Lösung einblenden
kP(X≤k)
......
20.0001
30.0005
40.002
50.0065
60.0175
......

Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p = 1 6 zu verwerfen. Der Test soll bestätigen, dass p< 1 6 oder p> 1 6 ist, es ist ein zweiseitiger Hypothesentest.

Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken und auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieser beiden Bereiche gerade noch kleiner als das Signifikanzniveau 0.1% ist.

Dazu teilen wir das Signifikanzniveau 0.1% gerecht auf 0.05% auf der linken und 0.05% auf der rechten Seite.

Linke Seite:

Schaut man dazu die kumulierte Binomialverteilung an (TI: binomcdf mit n=78 und p= 1 6 ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 3 gerade noch weniger als 0.05% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Damit haben wir den linken Teil des Ablehnungsbereichs

kP(X≤k)
......
230.9985
240.9994
250.9998
260.9999
271
......

Rechte Seite:

Auch am rechten Rand darf der Ablehnungsbereich höchstens 0.05% Gesamtwahrscheinlikeit auf sich vereinen, das bedeutet, dass der gesamte Bereich links vom rechten Ablehnungsbereich mindestens 1 - 0.0005 = 0.9995 als Wahrscheinlichkeit haben muss.

In der Tabelle links erkennt man, dass bei k=25 erstmals P 1 6 78 (Xk) ≥ 0.9995 ist (links in der Tabelle in blau dargestellt). Das bedeutet, dass das Intervall von 26 bis 78 das größte ist, das am rechten Rand eine Gesamtwahrscheinlichkeit von unter 0.05% hat.

Der Ablehnungsbereich auf der rechten Seite ist somit von 26 bis 78.

Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in eines dieser beiden Intervalle, so wäre das bei Gültigkeit der Nullhypothese H0: p= 1 6 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p≠ 1 6 als statistisch abgesichert betrachten darf.

Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von P 1 6 78 (X3) = 0.0005 auf der linken Seite und P 1 6 78 (X26) = 1-0.9998 = 0.0002 auf der rechten Seite.
Insgesamt ist somit die Irrtumswahrscheinlichkeit PIrr = 0.0005 + 0.0002 = 0.0007 =0.07% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H0: [0;3] und [26;78]

Nicht-Ablehnungsbereich von H0: [4;25]

Entscheidungsregel: Fällt die Anzahl der Treffer in einen der Ablehnungsbereiche von H0: [0;3] oder [26;78], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [4;25], so muss die Nullhypothese beibehalten werden.

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Fehler 1. Art beurteilen

Beispiel:

Eine große Handelskette überlegt, ob sie eine Kunden-App entwickeln und einführen soll. Die Finanzabteilung hat dabei herausgefunden, dass sich die Entwicklung und Bewerbung solch einer App nur dann rechnet, wenn sich auch mindestens 60% der Kunden die App aufs Smartphone installiert. Deswegen beschließt die Geschäftsführung einen Hypothesentest in Form einer Befragung von 900 Kunden durchzuführen. Dabei soll das Risiko auf 20% begrenzt werden, dass aufgrund des Tests die App entwickelt wird, obwohl sich diese Investition wirtschaftlich nicht lohnen wird.

Entscheide dich, welche der angebotenen Nullhypothesen für diesen Test verwendet werden muss.

Lösung einblenden

Wir betrachten jede der 4 möglichen Nullhypothesen im Detail:

1. Der Prozentsatz der Kunden, die die App installieren, beträgt mindestens 60%

error

Wenn die Nullhypothese H0: " ... mindestens 60%", also p ≥ 0.6 lautet, soll ja der Test "bestätigen", dass p < 0.6 ist - also ist es ein linksseitiger Hypothesentest.

Das bedeutet, dass die Wahrscheinlichkeit eines Ergebnisses des Test im linken (orangen) Ablehnungsbereich kleiner als das Signifikanzniveau α = 20% sein muss, falls die Nullhypothese H0: p ≥ 0.6 doch stimmen sollte.

Die Wahrscheinlichkeit, p ≥ 0.6 abzulehnen, obwohl es stimmt, ist somit kleiner als 20%.

In diesem Fall würde das bedeuten, dass die Wahrscheinlichkeit p ≥ 0.6 irrtümlicherweise abzulehnen, damit p < 0.6 anzunehmen (obwohl dies falsch ist), und somit die App gar nicht zu entwickeln, obwohl dies wirtschaftlich sinnvoll wäre, auf unter 20% begrenzt werden könnte.

Mit dieser Nullhypothese würde man also ein anderes Risiko absichern, als das im Aufgabentext geforderte.

508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553

2. Der Prozentsatz der Kunden, die die App installieren, beträgt höchstens 20%

error

Die Nullhypothese H0: " ... höchstens 20%", also p ≤ 0.2 macht keinen Sinn, weil die 20%" ja die maximale Irrtumswahrscheinlichkeit angibt, also wie groß höchstens die Wahrscheinlichkeit ist, dass einen das Ergebnis des Hypothesentests zu einer falschen Annahme führt.

In der Nullhypothese muss es doch aber um die eigentlich angezweifelte Wahrscheinlichkeit p=60% gehen, also den Prozentsatz der Kunden, die die App installieren werden.

3. Der Prozentsatz der Kunden, die die App installieren, beträgt mindestens 20%

error

Die Nullhypothese H0: " ... mindestens 20%", also p ≥ 0.2 macht keinen Sinn, weil die 20%" ja die maximale Irrtumswahrscheinlichkeit angibt, also wie groß höchstens die Wahrscheinlichkeit ist, dass einen das Ergebnis des Hypothesentests zu einer falschen Annahme führt.

In der Nullhypothese muss es doch aber um die eigentlich angezweifelte Wahrscheinlichkeit p=60% gehen, also den Prozentsatz der Kunden, die die App installieren werden.

4. Der Prozentsatz der Kunden, die die App installieren, beträgt höchstens 60%

ok

Wenn die Nullhypothese H0: " ... höchstens 60%", also p ≤ 0.6 lautet, soll ja der Test "bestätigen", dass p > 0.6 ist - also ist es ein rechtsseitiger Hypothesentest.

Das bedeutet, dass die Wahrscheinlichkeit eines Ergebnisses des Test im rechten (orangen) Ablehnungsbereich kleiner als das Signifikanzniveau α = 20% sein muss, falls die Nullhypothese H0: p ≤ 0.6 doch stimmen sollte.

Die Wahrscheinlichkeit, p ≤ 0.6 abzulehnen, obwohl es stimmt, ist somit kleiner als 20%

In diesem Fall würde das bedeuten, dass die Wahrscheinlichkeit p ≤ 0.6 irrtümlicherweise abzulehnen, damit p > 0.6 anzunehmen (obwohl dies falsch ist), und somit die App zu entwickeln und zu bewerben, obwohl die Kosten nie wieder eingebracht werden, weil zu wenige Kunden die App installieren werden, auf unter 20% begrenzt werden könnte.

Mit dieser Nullhypothese kann also ein Test die gegebenen Vorgaben erfüllen.

526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571