Wilcoxon Rangsummen-Test

2 Minuten zum Lesen

Testansatz

Beim Rangsummentest wird eine Stichprobe einer Vergleichsstichprobe gegenübergestellt. Es geht darum zu entscheiden, ob die Mediane gleich sind oder in der einen oder anderen Richtung oder überhaupt voneinander abweichen.

Für den Test werden die Werte der Größe nach geordnet. Die Summe der Ränge, die von Werten der Stichprobe belegt werden, ist die Testgröße.

Wie wahrscheinlich sind die einzelnen Rangsummen? Hierzu betrachtet man alle möglichen Anordnungen, hier beispielsweise für 3 Werte aus und 4 Werte aus . Eine einzelne Anordnung ist:

(w, w, w, w, w, w, w, w)

wobei w entweder aus oder aus ist.

Jede Anordnung ergibt eine Rangsumme. Also beispielsweise

(a, a, a, c, c, c, c, c) = 6
(a, a, c, a, c, c, c, c) = 7
(a, a, c, c, a, c, c, c) = 8
...
(a, c, a, a, c, c, c, c) = 8 
...
(c, c, c, c, c, a, a, a) = 21

Die Nullhypothese besagt, dass der Median gleich ist.

Da die Werte 6 und 7 auf genau eine Art und Weise zustande kommen können, hat der Wert 8 eine doppelt so große Wahrscheinlichkeit wie die Werte 6 und 7. Für die effiziente Berechnung der Wahrscheinlichkeiten kann man weitere Überlegungen anstellen. Die folgende Tabelle zeigt wieviele Kombinationen für die einzelnen Rangsummen existieren. Dazu ist die entsprechende Wahrscheinlichkeit und der Wert der kumulierten Wahrscheinlichkeit angegeben.

Wert h p p kumuliert
6 1 0.0286 0.0286
7 1 0.0286 0.0571
8 2 0.0571 0.1143
9 3 0.0857 0.2
10 4 0.1143 0.3143
11 4 0.1143 0.4286
12 5 0.1429 0.5714
13 4 0.1143 0.6857
14 4 0.1143 0.8
15 3 0.0857 0.8857
16 2 0.0571 0.9429
17 1 0.0286 0.9714
18 1 0.0286 1.0

Diagramm: Wahrscheinlichkeiten für die Rangsummen für n = 3, m = 4

Bei einer Rangsumme von 8 liegt die kumulierte Wahrscheinlichkeit erstmals über dem Signifikanzniveau von 0,01.

Für große und nimmt die Verteilung die Form einer Gauß-Verteilung an.

Diagramm: Wahrscheinlichkeiten für die Rangsummen für n = 10, m = 14

Tabellen

Die folgenden Tabellen enthalten die Wahrscheinlichkeiten für die Rangsummen für verschiedene Werte von und (Spalten p) sowie die kumulierten Wahrscheinlichkeiten (Spalten c).

n m  
2 2 bis 30 CSV
2 2 bis 30 CSV
3 2 bis 30 CSV
4 2 bis 30 CSV
5 2 bis 30 CSV
6 2 bis 30 CSV
7 2 bis 30 CSV
8 2 bis 30 CSV
9 2 bis 30 CSV
10 2 bis 30 CSV
11 2 bis 30 CSV
12 2 bis 30 CSV
13 2 bis 30 CSV
14 2 bis 30 CSV
15 2 bis 30 CSV
16 2 bis 30 CSV
17 2 bis 30 CSV
18 2 bis 30 CSV
19 2 bis 30 CSV
20 2 bis 30 CSV
21 2 bis 30 CSV
22 2 bis 30 CSV
23 2 bis 30 CSV
24 2 bis 30 CSV
25 2 bis 30 CSV
26 2 bis 30 CSV
27 2 bis 30 CSV
28 2 bis 30 CSV
29 2 bis 30 CSV
30 2 bis 30 CSV

Kategorien:

Aktualisiert: