La prueba de rangos con signo de Wilcoxon es la alternativa al t-test de muestras dependientes, en los casos en que las muestras no siguen una distribución normal (mostrando marcada asimetría o colas), o bien, cuando hay un tamaño muestral demasiado reducido para poder determinar si realmente proceden de poblaciones normales.
Condiciones para usar la prueba de los rangos con signo de Wilcoxon
Para poder utilizar esta prueba deben cumplirse las siguientes condiciones:
- Los datos tienen que ser dependientes.
- Los datos tienen que ser ordinales, se tienen que poder ordenar de menor a mayor o viceversa.
- No es necesario asumir que las muestras se distribuyen de forma normal o que proceden de poblaciones normales. Pero sea cual sea el tipo de distribución de las diferencias, tiene que ser simétrica.
- A pesar de considerarse el equivalente no paramétrico del t-test, el Wilcoxon signed-rank test trabaja con medianas, no con medias.
- Preferible al t-test cuando hay valores atípicos, no hay normalidad de los datos o el tamaño de las muestras es pequeño.
Procedimiento (análisis manual)
A continuación, se explica la prueba, paso a paso:
- Planteamiento de las hipótesis con un ejemplo
- H0: La mediana de las diferencias de cada par de datos es cero. Mediana(diferencias)=0Mediana(diferencias)=0.
- H1: HaHa: La mediana de las diferencias entre cada par de datos es diferente de cero. Mediana(diferencias)≠0Mediana(diferencias)≠0.
- 2. Se calculan las diferencias y la ordenación de las observaciones:
- Se calcula la diferencia de cada par de observaciones.
diferencias <- c(antes - despues) rbind(antes, despues, diferencias)
## [,1] [,2] [,3] [,4] [,5] [,6] ## antes 2 5 4 6 1 3 ## despues 5 6 2 7 1 6 ## diferencias -3 -1 2 -1 0 -3
Pre-test | Post-test | Signo (+/-) | Diferencia pre-post test | rangos |
---|---|---|---|---|
2 | 5 | -1 | 3 | 4.5 |
5 | 6 | -1 | 1 | 1.5 |
4 | 2 | 1 | 2 | 3.0 |
6 | 7 | -1 | 1 | 1.5 |
1 | 1 | 0 | 0 | 0.0 |
3 | 6 | -1 | 3 | 4.5 |
Cálculo del estadístico W
W=min(W+,W−)
- W+W+ = suma de los rangos con signo positivo
- W−W− = suma de los rangos con signo negativo
sumaPositivos <- sum(tabla[tabla$signo == 1,"rangos"]) sumaNegativos <- sum(tabla[ tabla$signo == -1,"rangos"] ) W <- min(c( sumaPositivos, sumaNegativos )) W
## [1] 3
4.Cálculo de p-value
Una vez ha obtenido el valor del estadístico W, se puede calcular cuál es la probabilidad de que adquiera valores igual o más extremos que el observado.
- Si el tamaño n < 25, se compara el valor obtenido de W con los valores de una tabla Wilcoxon. Si W cae dentro del intervalo correspondiente en la tabla para ese n, la diferencia NO es significativa.
- Si n > 25 se puede asumir que W se distribuye de forma aproximadamente Normal, rechazando H0H0 si Z calculado es menor que el valor de Z para el αα (esta es la que utiliza la función de R).
5. Cálculo del tamaño del efecto (side effect o TE)
Parece indicarse que la forma de calcular el tamaño del efecto de un test de Wilcoxon es mediante la correlación de rangos Rank correlation.
Tabla de valores críticos de la prueba T de Wilcoxon
Para calcular la significancia de un valor T, éste debe ser menor o igual que el valor especificado en la tabla dependiendo de si se trata de una prueba unilateral o bilateral
Prueba bilateral | Prueba unilateral | |||
---|---|---|---|---|
Signif ⇒ n ⇓ | 0.05 | 0.01 | 0.05 | 0.01 |
5 | ** | ** | 0 | ** |
6 | 0 | ** | 2 | ** |
7 | 2 | ** | 3 | 0 |
8 | 3 | 0 | 5 | 1 |
9 | 5 | 1 | 8 | 3 |
10 | 8 | 3 | 10 | 3 |
11 | 10 | 5 | 13 | 7 |
12 | 13 | 7 | 17 | 9 |
13 | 17 | 9 | 21 | 12 |
14 | 21 | 12 | 25 | 15 |
15 | 25 | 15 | 30 | 19 |
16 | 29 | 19 | 35 | 23 |
17 | 34 | 23 | 41 | 27 |
18 | 40 | 27 | 47 | 32 |
19 | 46 | 32 | 53 | 37 |
20 | 52 | 37 | 60 | 43 |
21 | 58 | 42 | 67 | 49 |
22 | 65 | 48 | 75 | 55 |
23 | 73 | 54 | 83 | 62 |
24 | 81 | 61 | 91 | 69 |
25 | 89 | 68 | 100 | 76 |
26 | 98 | 75 | 110 | 84 |
27 | 107 | 83 | 119 | 92 |
28 | 116 | 91 | 130 | 101 |
29 | 126 | 100 | 140 | 110 |
30 | 137 | 109 | 151 | 120 |
Tabla de valores para obtener significancia de valor Z
Para que un valor z sea significativo, éste debe ser mayor que el del percentil correspondiente a un nivel de significancia determinado, dependiendo de si se trata de una prueba de una cola (unilateral) o de dos colas (bilateral)
Prueba Unilateral | Prueba bilateral | |||||
Significancia | 0.05 | 0.01 | 0.001 | 0.05 | 0.01 | 0.001 |
Percentil | 95 | 99 | 99.9 | 97.5 | 99.5 | 99.95 |
z | 1.6449 | 2.3263 | 3.0902 | 1.9600 | 2.5758 | 3.2905 |