Aufgabenbeispiele von Tests
Durch Aktualisieren des Browsers (z.B. mit Taste F5) kann man neue Beispielaufgaben sehen
Hypothesen-Test linksseitig
Beispiel:
Ein Basketballspieler behauptet, er habe bei Freiwürfen eine Trefferwahrscheinlichkeit von p=0,8. Sein Trainer glaubt, dass er sich dabei überschätzt. Um das zu überprüfen, muss der Basketballspieler 20 mal werfen. In welchem Intervall müssen die Treffer liegen, dass sich der Trainer auf einem Signifikanzniveau von 5% bestätigt sieht? Wie hoch bleibt dabei die Irrtumswahrscheinlichkeit, dass der Trainer aufgrund des Signifikanztests die Trefferwahrscheinlichkeit irrtümlicherweise als niedriger annimmt?
| k | P(X≤k) |
|---|---|
| ... | ... |
| 7 | 0 |
| 8 | 0.0001 |
| 9 | 0.0006 |
| 10 | 0.0026 |
| 11 | 0.01 |
| 12 | 0.0321 |
| 13 | 0.0867 |
| 14 | 0.1958 |
| 15 | 0.3704 |
| 16 | 0.5886 |
| ... | ... |
Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≥ 0.8 zu verwerfen. Der Test soll bestätigen, dass p<0.8 ist, also ist es ein linksseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.
Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(20,0.8,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 12 weniger als 5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.8 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p<0.8 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0321 =3.21% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)
Ablehnungsbereich von H0: [0;12]
Nicht-Ablehnungsbereich von H0: [13;20]
Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [0;12], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [13;20], so muss die Nullhypothese beibehalten werden.
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)
Hypothesen-Test rechtsseitig
Beispiel:
Ein Basketballspieler behauptet, er habe bei Freiwürfen seine bisherige Trefferwahrscheinlichkeit von p=0,5 inzwischen verbessert. Sein Trainer glaubt ihm sich das nicht. Um seine Verbesserung zu überprüfen, wird ein Signifikanz-Test mit 74 Würfen des Basketballspieler vereinbart. Dabei soll die Irrtumswahrscheinlichkeit berechnet werden können, dass man aufgrund des Test eine höhere Treffer-Quote annimmt, obwohl dies in Wirklichkeit gar nicht der Fall ist. In welchem Intervall müssen die Treffer liegen, damit sich der Spieler auf einem Signifikanzniveau von 5% bestätigt sieht? Wie hoch bleibt dabei die Irrtumswahrscheinlichkeit.
| k | P(X≤k) |
|---|---|
| ... | ... |
| 39 | 0.7193 |
| 40 | 0.792 |
| 41 | 0.8523 |
| 42 | 0.8997 |
| 43 | 0.9349 |
| 44 | 0.9597 |
| 45 | 0.9763 |
| 46 | 0.9867 |
| 47 | 0.993 |
| 48 | 0.9965 |
| ... | ... |
Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≤ 0.5 zu verwerfen. Der Test soll bestätigen, dass p>0.5 ist, also ist es ein rechtsseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.
Das heißt, dass der Nicht-Ablehnungsbereich von H0 (hier blau eingefärbt) auf der linken Seite mindestens 1-0.05= 0.95 Wahrscheinlichkeit auf sich vereinen muss.
Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(74,0.5,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 44 erstmals mindestens 95% der Gesamt-Wahrscheinlichkeit ausmachen.
Nicht-Ablehnungsbereich von H0: [0;44]
Dies bedeutet für den eigentlich gesuchten Ablehnungsbereich H0 dass dieser erst bei 45 Treffern beginnt.
Ablehnungsbereich von H0: [45;74]
Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.5 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p>0.5 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0403 =4.03% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)
Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [45;74], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [0;44], so muss die Nullhypothese beibehalten werden.
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)
Hypothesen-Test rechtsseitig
Beispiel:
Die Kursstufenschüler Maxi und Noah verbringen ihr Pausen leidenschaftlich gerne mit einem Bäckertüten-Mülleimer-Contest. Dabei geht es darum, eine zusammengeknüllte Bäckertüte in den an der entferntesten Ecke stehenden Altpapierbehälter zu treffen. Der interessiert zuschauende Mathelehrer rät ihnen doch etwas näher an den Mülleimer ran zu gehen, weil sie eh höchstens jedes zehnte mal treffen. Empfindlich in ihre Macho-Ehre verletzt, beschließen sie darauf hin ein Test mit 43 Würfen durchzuführen, der die absurd niedrige vom Lehrer behauptete Trefferquote auf einem Signifikanzniveau von 0,1% widerlegen soll. In welchem Bereich müsste die Trefferzahl liegen, um über den Mathelehrer statistisch belegt zu triumphieren zu können? Wie hoch ist dann die Irrtumswahrscheinlichkeit, dass die Trefferqutoe von höchstens 10% fälschlicherweise abgelehnt wurde?
| k | P(X≤k) |
|---|---|
| ... | ... |
| 6 | 0.8667 |
| 7 | 0.9393 |
| 8 | 0.9756 |
| 9 | 0.9913 |
| 10 | 0.9972 |
| 11 | 0.9992 |
| 12 | 0.9998 |
| 13 | 1 |
| 14 | 1 |
| 15 | 1 |
| ... | ... |
Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≤ 0.1 zu verwerfen. Der Test soll bestätigen, dass p>0.1 ist, also ist es ein rechtsseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 0.1% ist.
Das heißt, dass der Nicht-Ablehnungsbereich von H0 (hier blau eingefärbt) auf der linken Seite mindestens 1-0.001= 0.999 Wahrscheinlichkeit auf sich vereinen muss.
Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(43,0.1,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 11 erstmals mindestens 99.9% der Gesamt-Wahrscheinlichkeit ausmachen.
Nicht-Ablehnungsbereich von H0: [0;11]
Dies bedeutet für den eigentlich gesuchten Ablehnungsbereich H0 dass dieser erst bei 12 Treffern beginnt.
Ablehnungsbereich von H0: [12;43]
Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p=0.1 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p>0.1 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0008 =0.08% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)
Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [12;43], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [0;11], so muss die Nullhypothese beibehalten werden.
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)
Fehler 2. Art
Beispiel:
Ein spielsüchtiger 12-Klässler möchte nachweisen, dass ein bestimmter Würfel gezinkt ist und zu selten eine 6 kommt. Dazu macht er einen Signifikanztest mit 64 Würfen und einem Signifikanzniveau von 0,1%. a) In welchem Bereich muss die Anzahl der 6er liegen, damit er die Spielbank verklagen kann. b) In Wirklichkeit ist der Würfel tatsächlich manipuliert und würfelt nur mit der Wahrscheinlichkeit von 14% eine sechs. Wie groß ist nun die Wahrscheinlichkeit, dass bei dem Test trotzdem die Anzahl der Sechsen nicht in den Ablehnungsbereich gefallen ist und somit - irrtümlicherweise - die falsche Nullhypothese nicht verworfen wurde?
| k | P(X≤k) |
|---|---|
| 0 | 0 |
| 1 | 0.0001 |
| 2 | 0.0008 |
| 3 | 0.0037 |
| 4 | 0.0124 |
| 5 | 0.0332 |
| 6 | 0.0743 |
| ... | ... |
Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p ≥ zu verwerfen. Der Test soll bestätigen, dass p< ist, also ist es ein linksseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 0.1% ist.
Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(64,,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 2 weniger als 0.1% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H0: p= so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p< als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0008 =0.08% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)
Ablehnungsbereich von H0: [0;2]
Nicht-Ablehnungsbereich von H0: [3;64]
Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H0: [0;2], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [3;64], so muss die Nullhypothese beibehalten werden.
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)
In dieser Aufgabe ist ja aber H0:p= falsch, weil ja in Wirklichkeit p=0.14 ist.
Gesucht ist nun die Wahrscheinlichkeit, dass bei dem Test die Trefferanzahl nicht in den Ablehnungsbereich gefallen ist, sondern in den Bereich von 3 bis 64, so dass H0 (irrtümlicherweise) nicht verworfen wurde.
Diese Wahrscheinlichkeit (mit dem richtigen p=0.14) beträgt nun: =1- ≈ 1-0.0042 ≈ 0.9958
Mit 99.58% Wahrscheinlichkeit landet also das Ergebnis des Test im Nicht-Ablehnungsbereich (im Histogramm oben: blauer Bereich), so dass die falsche Nullhypothese nicht verworfen wird.
zweiseitiger Test
Beispiel:
Ein Würfel wirkt etwas unwuchtig, so als ob nicht alle Bereiche des Körpers gleich schwer wären. Deswegen wird vermutet, dass die Wahrscheinlichkeit, eine Sechs mit diesem Würfel zu würfeln, p ≠ sein müsste. Diese Vermutung soll durch einen zweiseitigen Test mit 78 mal würfeln untermauert werden. Die maximale Irrtumswahrscheinlichkeit α soll dabei 0,1% betragen.
In welchen Bereichen muss die Anzahl der gewürfelten Sechser bei der Stichprobe liegen, um die Nullhypothese p= statistisch untermauert ablehnen zu können?
Wie groß ist in diesem Fall die Irrtumswahrscheinlichkeit?
| k | P(X≤k) |
|---|---|
| ... | ... |
| 2 | 0.0001 |
| 3 | 0.0005 |
| 4 | 0.002 |
| 5 | 0.0065 |
| 6 | 0.0175 |
| ... | ... |
Dieser Hypothesentest wird gemacht um die Nullhypothese H0: p = zu verwerfen. Der Test soll bestätigen, dass p< oder p> ist, es ist ein zweiseitiger Hypothesentest.
Wir suchen somit den Ablehnungsbereich der Nullhypothese H0 auf der linken und auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieser beiden Bereiche gerade noch kleiner als das Signifikanzniveau 0.1% ist.
Dazu teilen wir das Signifikanzniveau 0.1% gerecht auf 0.05% auf der linken und 0.05% auf der rechten Seite.
Linke Seite:
Schaut man dazu die kumulierte Binomialverteilung an (TI: binomcdf mit n=78 und p=), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 3 gerade noch weniger als 0.05% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Damit haben wir den linken Teil des Ablehnungsbereichs
| k | P(X≤k) |
|---|---|
| ... | ... |
| 23 | 0.9985 |
| 24 | 0.9994 |
| 25 | 0.9998 |
| 26 | 0.9999 |
| 27 | 1 |
| ... | ... |
Rechte Seite:
Auch am rechten Rand darf der Ablehnungsbereich höchstens 0.05% Gesamtwahrscheinlikeit auf sich vereinen, das bedeutet, dass der gesamte Bereich links vom rechten Ablehnungsbereich mindestens 1 - 0.0005 = 0.9995 als Wahrscheinlichkeit haben muss.
In der Tabelle links erkennt man, dass bei k=25 erstmals ≥ 0.9995 ist (links in der Tabelle in blau dargestellt). Das bedeutet, dass das Intervall von 26 bis 78 das größte ist, das am rechten Rand eine Gesamtwahrscheinlichkeit von unter 0.05% hat.
Der Ablehnungsbereich auf der rechten Seite ist somit von 26 bis 78.
Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in eines dieser beiden Intervalle, so wäre das bei Gültigkeit der Nullhypothese H0: p= so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p≠ als statistisch abgesichert betrachten darf.
Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von
=
0.0005 auf der linken Seite und
= 1-0.9998
= 0.0002 auf der rechten Seite.
Insgesamt ist somit die Irrtumswahrscheinlichkeit
PIrr = 0.0005 + 0.0002 = 0.0007
=0.07% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)
Ablehnungsbereich von H0: [0;3] und [26;78]
Nicht-Ablehnungsbereich von H0: [4;25]
Entscheidungsregel: Fällt die Anzahl der Treffer in einen der Ablehnungsbereiche von H0: [0;3] oder [26;78], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H0: [4;25], so muss die Nullhypothese beibehalten werden.
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)
Fehler 1. Art beurteilen
Beispiel:
Eine große Handelskette überlegt, ob sie eine Kunden-App entwickeln und einführen soll. Die Finanzabteilung hat dabei herausgefunden, dass sich die Entwicklung und Bewerbung solch einer App nur dann rechnet, wenn sich auch mindestens 60% der Kunden die App aufs Smartphone installiert. Deswegen beschließt die Geschäftsführung einen Hypothesentest in Form einer Befragung von 900 Kunden durchzuführen. Dabei soll das Risiko auf 20% begrenzt werden, dass aufgrund des Tests die App entwickelt wird, obwohl sich diese Investition wirtschaftlich nicht lohnen wird.
Entscheide dich, welche der angebotenen Nullhypothesen für diesen Test verwendet werden muss.
Wir betrachten jede der 4 möglichen Nullhypothesen im Detail:
1. Der Prozentsatz der Kunden, die die App installieren, beträgt mindestens 60%
Wenn die Nullhypothese H0: " ... mindestens 60%", also p ≥ 0.6 lautet, soll ja der Test "bestätigen", dass p < 0.6 ist - also ist es ein linksseitiger Hypothesentest.
Das bedeutet, dass die Wahrscheinlichkeit eines Ergebnisses des Test im linken (orangen) Ablehnungsbereich kleiner als das Signifikanzniveau α = 20% sein muss, falls die Nullhypothese H0: p ≥ 0.6 doch stimmen sollte.
Die Wahrscheinlichkeit, p ≥ 0.6 abzulehnen, obwohl es stimmt, ist somit kleiner als 20%.
In diesem Fall würde das bedeuten, dass die Wahrscheinlichkeit p ≥ 0.6 irrtümlicherweise abzulehnen, damit p < 0.6 anzunehmen (obwohl dies falsch ist), und somit die App gar nicht zu entwickeln, obwohl dies wirtschaftlich sinnvoll wäre, auf unter 20% begrenzt werden könnte.
Mit dieser Nullhypothese würde man also ein anderes Risiko absichern, als das im Aufgabentext geforderte.
2. Der Prozentsatz der Kunden, die die App installieren, beträgt höchstens 20%
Die Nullhypothese H0: " ... höchstens 20%", also p ≤ 0.2 macht keinen Sinn, weil die 20%" ja die maximale Irrtumswahrscheinlichkeit angibt, also wie groß höchstens die Wahrscheinlichkeit ist, dass einen das Ergebnis des Hypothesentests zu einer falschen Annahme führt.
In der Nullhypothese muss es doch aber um die eigentlich angezweifelte Wahrscheinlichkeit p=60% gehen, also den Prozentsatz der Kunden, die die App installieren werden.
3. Der Prozentsatz der Kunden, die die App installieren, beträgt mindestens 20%
Die Nullhypothese H0: " ... mindestens 20%", also p ≥ 0.2 macht keinen Sinn, weil die 20%" ja die maximale Irrtumswahrscheinlichkeit angibt, also wie groß höchstens die Wahrscheinlichkeit ist, dass einen das Ergebnis des Hypothesentests zu einer falschen Annahme führt.
In der Nullhypothese muss es doch aber um die eigentlich angezweifelte Wahrscheinlichkeit p=60% gehen, also den Prozentsatz der Kunden, die die App installieren werden.
4. Der Prozentsatz der Kunden, die die App installieren, beträgt höchstens 60%
Wenn die Nullhypothese H0: " ... höchstens 60%", also p ≤ 0.6 lautet, soll ja der Test "bestätigen", dass p > 0.6 ist - also ist es ein rechtsseitiger Hypothesentest.
Das bedeutet, dass die Wahrscheinlichkeit eines Ergebnisses des Test im rechten (orangen) Ablehnungsbereich kleiner als das Signifikanzniveau α = 20% sein muss, falls die Nullhypothese H0: p ≤ 0.6 doch stimmen sollte.
Die Wahrscheinlichkeit, p ≤ 0.6 abzulehnen, obwohl es stimmt, ist somit kleiner als 20%
In diesem Fall würde das bedeuten, dass die Wahrscheinlichkeit p ≤ 0.6 irrtümlicherweise abzulehnen, damit p > 0.6 anzunehmen (obwohl dies falsch ist), und somit die App zu entwickeln und zu bewerben, obwohl die Kosten nie wieder eingebracht werden, weil zu wenige Kunden die App installieren werden, auf unter 20% begrenzt werden könnte.
Mit dieser Nullhypothese kann also ein Test die gegebenen Vorgaben erfüllen.
