Mathebattle EduRandomtasks

Hypothesen-Test linksseitig

Beispiel:

Ein Basketballspieler behauptet, er habe bei Freiwürfen eine Trefferwahrscheinlichkeit von p=0,5. Sein Trainer glaubt, dass er sich dabei überschätzt. Um das zu überprüfen, muss der Basketballspieler 25 mal werfen. In welchem Intervall müssen die Treffer liegen, dass sich der Trainer auf einem Signifikanzniveau von 5% bestätigt sieht? Wie hoch bleibt dabei die Irrtumswahrscheinlichkeit, dass der Trainer aufgrund des Signifikanztests die Trefferwahrscheinlichkeit irrtümlicherweise als niedriger annimmt?

Lösung einblenden

k	P(X≤k)
...	...
2	0
3	0.0001
4	0.0005
5	0.002
6	0.0073
7	0.0216
8	0.0539
9	0.1148
10	0.2122
11	0.345
...	...

Dieser Hypothesentest wird gemacht um die Nullhypothese H₀: p ≥ 0.5 zu verwerfen. Der Test soll bestätigen, dass p<0.5 ist, also ist es ein linksseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H₀ auf der linken Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(25,0.5,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 7 weniger als 5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H₀: p=0.5 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p<0.5 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0216 =2.16% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H₀: [0;7]

Nicht-Ablehnungsbereich von H₀: [8;25]

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H₀: [0;7], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H₀: [8;25], so muss die Nullhypothese beibehalten werden.

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Hypothesen-Test rechtsseitig

Beispiel:

Ein defektes Kopiergerät, welches viele fehlerhafte Kopien produzierte, wurde repariert. Die mit der Reparatur beauftrage Firma behauptet, dass die Ausschussquote jetzt nur noch höchstens 0,02 beträgt. Um diese Behauptung (Nullhypothese) auf dem Signifikanzniveau von 5% zu testen, werden 400 Kopien angefertigt. Ermittle die zugehörige Entscheidungsregel.

Lösung einblenden

k	P(X≤k)
...	...
8	0.5926
9	0.7179
10	0.8179
11	0.8903
12	0.9381
13	0.9673
14	0.9838
15	0.9924
16	0.9966
17	0.9986
...	...

Dieser Hypothesentest wird gemacht um die Nullhypothese H₀: p ≤ 0.02 zu verwerfen. Der Test soll bestätigen, dass p>0.02 ist, also ist es ein rechtsseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H₀ auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.

Das heißt, dass der Nicht-Ablehnungsbereich von H₀ (hier blau eingefärbt) auf der linken Seite mindestens 1-0.05= 0.95 Wahrscheinlichkeit auf sich vereinen muss.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(400,0.02,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 13 erstmals mindestens 95% der Gesamt-Wahrscheinlichkeit ausmachen.

Nicht-Ablehnungsbereich von H₀: [0;13]

Dies bedeutet für den eigentlich gesuchten Ablehnungsbereich H₀ dass dieser erst bei 14 Treffern beginnt.

Ablehnungsbereich von H₀: [14;400]

Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H₀: p=0.02 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p>0.02 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0327 =3.27% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H₀: [14;400], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H₀: [0;13], so muss die Nullhypothese beibehalten werden.

0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Hypothesen-Test linksseitig

Beispiel:

Ein spielsüchtiger 12-Klässler möchte nachweisen, dass ein bestimmter Würfel gezinkt ist und zu selten eine 6 kommt. Dazu macht er einen Signifikanztest mit 96 Würfen und einem Signifikanzniveau von 5%. In welchem Bereich muss die Anzahl der 6er liegen, damit er die Spielbank verklagen kann (- also, dass das Risiko, die 6er-Wahrscheinlichkeit irrtümlicherweise als zu gering anzunehmen, berechenbar ist.) Wie hoch ist dann diese Irrtumswahrscheinlichkeit?

Lösung einblenden

k	P(X≤k)
...	...
4	0.0002
5	0.0007
6	0.0021
7	0.006
8	0.0145
9	0.0311
10	0.06
11	0.1052
12	0.1693
13	0.2521
...	...

Dieser Hypothesentest wird gemacht um die Nullhypothese H₀: p ≥ $\frac{1}{6}$ zu verwerfen. Der Test soll bestätigen, dass p< $\frac{1}{6}$ ist, also ist es ein linksseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H₀ auf der linken Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(96, $\frac{1}{6}$ ,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 9 weniger als 5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H₀: p= $\frac{1}{6}$ so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p< $\frac{1}{6}$ als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0311 =3.11% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H₀: [0;9]

Nicht-Ablehnungsbereich von H₀: [10;96]

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H₀: [0;9], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H₀: [10;96], so muss die Nullhypothese beibehalten werden.

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Fehler 2. Art

Beispiel:

Eine Pharmafirma behauptet, dass durch eine Verbesserung der Rezeptur die Nebenwirkungen eines Medikament unter p=0,16 gesunken ist. Um dies nachzuweisen, soll ein 54-stufiger Test mit einer maximalen Irrtumswahrscheinlichkeit von 5% durchgeführt werden. a) In welchem Intervall muss hierfür die Anzahl der Nebenwirkungen liegen? b) In Wirklichkeit liegt die Wahrscheinlickeit für Nebenwirkungen bei p=0,07. Wie groß ist nun die Wahrscheinlichkeit, dass bei dem Test trotzdem die Anzahl der Nebenwirkungen nicht in den Ablehnungsbereich gefallen ist und somit - irrtümlicherweise - die falsche Nullhypothese nicht verworfen wurde?

Lösung einblenden

k	P(X≤k)
0	0.0001
1	0.0009
2	0.0052
3	0.0191
4	0.053
5	0.1177
6	0.2182
7	0.3494
...	...

Dieser Hypothesentest wird gemacht um die Nullhypothese H₀: p ≥ 0.16 zu verwerfen. Der Test soll bestätigen, dass p<0.16 ist, also ist es ein linksseitiger Hypothesentest. Wir suchen somit den Ablehnungsbereich der Nullhypothese H₀ auf der linken Seite so, dass die Gesamt-Wahrscheinlichkeit dieses Bereichs gerade noch kleiner als das Signifikanzniveau 5% ist.

Schaut man dazu die kumulierte Binomialverteilung an (TI: y1=binomcdf(54,0.16,X) ), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 3 weniger als 5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in diesem Intervall, wäre das bei Gültigkeit von Nullhypothese H₀: p=0.16 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p<0.16 als statistisch abgesichert betrachten darf. Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von 0.0191 =1.91% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H₀: [0;3]

Nicht-Ablehnungsbereich von H₀: [4;54]

Entscheidungsregel: Fällt die Anzahl der Treffer in den Ablehnungsbereich von H₀: [0;3], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H₀: [4;54], so muss die Nullhypothese beibehalten werden.

0

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

In dieser Aufgabe ist ja aber H₀:p=0.16 falsch, weil ja in Wirklichkeit p=0.07 ist.

Gesucht ist nun die Wahrscheinlichkeit, dass bei dem Test die Trefferanzahl nicht in den Ablehnungsbereich gefallen ist, sondern in den Bereich von 4 bis 54, so dass H₀ (irrtümlicherweise) nicht verworfen wurde.

Diese Wahrscheinlichkeit (mit dem richtigen p=0.07) beträgt nun: $P_{0.07}^{54} (X \geq 4)$ =1- $P_{0.07}^{54} (X \leq 3)$ ≈ 1-0.4718 ≈ 0.5282

Mit 52.82% Wahrscheinlichkeit landet also das Ergebnis des Test im Nicht-Ablehnungsbereich (im Histogramm oben: blauer Bereich), so dass die falsche Nullhypothese nicht verworfen wird.

zweiseitiger Test

Beispiel:

Durch einen Test soll statistisch untermauert werden, dass eine bestimmte Wahrscheinlichkeit p≠0,55 ist. Dazu soll die Nullhypothese H₀: p=0,55 mit einer zufälligen Stichprobe (praktisch als Zufallsexperiment) der Größe n=67 verworfen werden. Die maximale Irrtumswahrscheinlichkeit α soll dabei 5% betragen. In welchen Bereichen muss die Anzahl der Treffer bei der Stichprobe liegen, um die Nullhypothese p=0,55 statistisch untermauert ablehnen zu können? Wie groß ist in diesem Fall die Irrtumswahrscheinlichkeit?

Lösung einblenden

k	P(X≤k)
...	...
27	0.011
28	0.0204
29	0.0359
30	0.0598
31	0.0948
...	...

Dieser Hypothesentest wird gemacht um die Nullhypothese H₀: p = 0.55 zu verwerfen. Der Test soll bestätigen, dass p<0.55 oder p>0.55 ist, es ist ein zweiseitiger Hypothesentest.

Wir suchen somit den Ablehnungsbereich der Nullhypothese H₀ auf der linken und auf der rechten Seite so, dass die Gesamt-Wahrscheinlichkeit dieser beiden Bereiche gerade noch kleiner als das Signifikanzniveau 5% ist.

Dazu teilen wir das Signifikanzniveau 5% gerecht auf 2.5% auf der linken und 2.5% auf der rechten Seite.

Linke Seite:

Schaut man dazu die kumulierte Binomialverteilung an (TI: binomcdf mit n=67 und p=0.55), so erkennt man, dass die Trefferzahlen links im Interval zwischen 0 und 28 gerade noch weniger als 2.5% der Gesamt-Wahrscheinlichkeit auf sich vereinen. Damit haben wir den linken Teil des Ablehnungsbereichs

k	P(X≤k)
...	...
43	0.9499
44	0.971
45	0.9842
46	0.9919
47	0.9961
...	...

Rechte Seite:

Auch am rechten Rand darf der Ablehnungsbereich höchstens 2.5% Gesamtwahrscheinlikeit auf sich vereinen, das bedeutet, dass der gesamte Bereich links vom rechten Ablehnungsbereich mindestens 1 - 0.025 = 0.975 als Wahrscheinlichkeit haben muss.

In der Tabelle links erkennt man, dass bei k=45 erstmals $P_{0.55}^{67} (X \leq k)$ ≥ 0.975 ist (links in der Tabelle in blau dargestellt). Das bedeutet, dass das Intervall von 46 bis 67 das größte ist, das am rechten Rand eine Gesamtwahrscheinlichkeit von unter 2.5% hat.

Der Ablehnungsbereich auf der rechten Seite ist somit von 46 bis 67.

Kommt nun bei einer Stichprobe/Zufallsexperiment eine Trefferzahl in eines dieser beiden Intervalle, so wäre das bei Gültigkeit der Nullhypothese H₀: p=0.55 so unwahrscheinlich, dass man diese Nullhypothese verwerfen kann und somit p≠0.55 als statistisch abgesichert betrachten darf.

Dabei bleibt jedoch eine (Rest-) Irrtumswahrscheinlichkeit von $P_{0.55}^{67} (X \leq 28)$ = 0.0204 auf der linken Seite und $P_{0.55}^{67} (X \geq 46)$ = 1-0.9842 = 0.0158 auf der rechten Seite.
Insgesamt ist somit die Irrtumswahrscheinlichkeit P_Irr = 0.0204 + 0.0158 = 0.0362 =3.62% (dass die Nullhypothese doch stimmt und wir sie irrtümlicherweise verworfen haben)

Ablehnungsbereich von H₀: [0;28] und [46;67]

Nicht-Ablehnungsbereich von H₀: [29;45]

Entscheidungsregel: Fällt die Anzahl der Treffer in einen der Ablehnungsbereiche von H₀: [0;28] oder [46;67], so ist die Nullhypothese zu verwerfen, fällt die Anzahl der Treffer in den Nicht-Ablehnungsbereich von H₀: [29;45], so muss die Nullhypothese beibehalten werden.

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

Die Höhen der Säulen entsprechen der Wahrscheinlichkeit für genau X=k Treffer
(also keine kumulierte Wahrscheinlichkeit wie links in der Tabelle)

Fehler 1. Art beurteilen

Beispiel:

Eine große Handelskette überlegt, ob sie eine Kunden-App entwickeln und einführen soll. Die Finanzabteilung hat dabei herausgefunden, dass sich die Entwicklung und Bewerbung solch einer App nur dann rechnet, wenn sich auch mindestens 45% der Kunden die App aufs Smartphone installiert. Deswegen beschließt die Geschäftsführung einen Hypothesentest in Form einer Befragung von 800 Kunden durchzuführen. Dabei soll das Risiko auf 20% begrenzt werden, dass aufgrund des Tests die App entwickelt wird, obwohl sich diese Investition wirtschaftlich nicht lohnen wird.

Entscheide dich, welche der angebotenen Nullhypothesen für diesen Test verwendet werden muss.

Lösung einblenden

Wir betrachten jede der 4 möglichen Nullhypothesen im Detail:

1. Der Prozentsatz der Kunden, die die App installieren, beträgt mindestens 45%

Wenn die Nullhypothese H₀: " ... mindestens 45%", also p ≥ 0.45 lautet, soll ja der Test "bestätigen", dass p < 0.45 ist - also ist es ein linksseitiger Hypothesentest.

Das bedeutet, dass die Wahrscheinlichkeit eines Ergebnisses des Test im linken (orangen) Ablehnungsbereich kleiner als das Signifikanzniveau α = 20% sein muss, falls die Nullhypothese H₀: p ≥ 0.45 doch stimmen sollte.

Die Wahrscheinlichkeit, p ≥ 0.45 abzulehnen, obwohl es stimmt, ist somit kleiner als 20%.

In diesem Fall würde das bedeuten, dass die Wahrscheinlichkeit p ≥ 0.45 irrtümlicherweise abzulehnen, damit p < 0.45 anzunehmen (obwohl dies falsch ist), und somit die App gar nicht zu entwickeln, obwohl dies wirtschaftlich sinnvoll wäre, auf unter 20% begrenzt werden könnte.

Mit dieser Nullhypothese würde man also ein anderes Risiko absichern, als das im Aufgabentext geforderte.

329

330

331

332

333

334

335

336

337

338

339

340

341

342

343

344

345

346

347

348

349

350

351

352

353

354

355

356

357

358

359

360

361

362

363

364

365

366

367

368

369

370

371

372

373

374

2. Der Prozentsatz der Kunden, die die App installieren, beträgt mindestens 20%

Die Nullhypothese H₀: " ... mindestens 20%", also p ≥ 0.2 macht keinen Sinn, weil die 20%" ja die maximale Irrtumswahrscheinlichkeit angibt, also wie groß höchstens die Wahrscheinlichkeit ist, dass einen das Ergebnis des Hypothesentests zu einer falschen Annahme führt.

In der Nullhypothese muss es doch aber um die eigentlich angezweifelte Wahrscheinlichkeit p=45% gehen, also den Prozentsatz der Kunden, die die App installieren werden.

3. Der Prozentsatz der Kunden, die die App installieren, beträgt höchstens 45%

Wenn die Nullhypothese H₀: " ... höchstens 45%", also p ≤ 0.45 lautet, soll ja der Test "bestätigen", dass p > 0.45 ist - also ist es ein rechtsseitiger Hypothesentest.

Das bedeutet, dass die Wahrscheinlichkeit eines Ergebnisses des Test im rechten (orangen) Ablehnungsbereich kleiner als das Signifikanzniveau α = 20% sein muss, falls die Nullhypothese H₀: p ≤ 0.45 doch stimmen sollte.

Die Wahrscheinlichkeit, p ≤ 0.45 abzulehnen, obwohl es stimmt, ist somit kleiner als 20%

In diesem Fall würde das bedeuten, dass die Wahrscheinlichkeit p ≤ 0.45 irrtümlicherweise abzulehnen, damit p > 0.45 anzunehmen (obwohl dies falsch ist), und somit die App zu entwickeln und zu bewerben, obwohl die Kosten nie wieder eingebracht werden, weil zu wenige Kunden die App installieren werden, auf unter 20% begrenzt werden könnte.

Mit dieser Nullhypothese kann also ein Test die gegebenen Vorgaben erfüllen.

345

346

347

348

349

350

351

352

353

354

355

356

357

358

359

360

361

362

363

364

365

366

367

368

369

370

371

372

373

374

375

376

377

378

379

380

381

382

383

384

385

386

387

388

389

390

4. Der Prozentsatz der Kunden, die die App installieren, beträgt höchstens 20%

Die Nullhypothese H₀: " ... höchstens 20%", also p ≤ 0.2 macht keinen Sinn, weil die 20%" ja die maximale Irrtumswahrscheinlichkeit angibt, also wie groß höchstens die Wahrscheinlichkeit ist, dass einen das Ergebnis des Hypothesentests zu einer falschen Annahme führt.

In der Nullhypothese muss es doch aber um die eigentlich angezweifelte Wahrscheinlichkeit p=45% gehen, also den Prozentsatz der Kunden, die die App installieren werden.

Aufgabenbeispiele von Tests

Hypothesen-Test linksseitig

Hypothesen-Test rechtsseitig

Hypothesen-Test linksseitig

Fehler 2. Art

zweiseitiger Test

Linke Seite:

Rechte Seite:

Fehler 1. Art beurteilen

1. Der Prozentsatz der Kunden, die die App installieren, beträgt mindestens 45%

2. Der Prozentsatz der Kunden, die die App installieren, beträgt mindestens 20%

3. Der Prozentsatz der Kunden, die die App installieren, beträgt höchstens 45%

4. Der Prozentsatz der Kunden, die die App installieren, beträgt höchstens 20%