En esta ocasión, vamos a abordar las pruebas no paramétricas.
¿Qué es una prueba no paramétrica?
Las pruebas no paramétricas, también conocidas como pruebas de distribución libre, son válidas en un rango más amplio de situaciones (exigen menos condiciones de validez) que en el caso de las paramétricas. Con «distribución libre» nos estamos refiriendo a que los datos observados no tienen una organización normal.
¿Qué pruebas no paramétricas existen?
Las pruebas no paramétricas o de distribución normal pueden listarse como:
- Prueba de signos para 1 muestra.
- Prueba U de Mann-Whitney.
- Prueba de los rangos con signo de Wilcoxon.
- Prueba de signos para 2 muestras.
- Prueba de Kruskal-Wallis.
- Prueba de la mediana de Mood.
- Prueba de Friedman.
¿Cuándo se usan las pruebas no paramétricas? ¿Cuál de ellas usar?
El uso de estas pruebas es mucho más flexible que el de los métodos paramétricos. Por lo general, se usan cuando se pretenden contrastar hipótesis que no son afirmaciones sobre parámetros y dependen de la forma de la distribución poblacional. De hecho, es por esto que también se llaman, asimismo, pruebas de distribución libre. Ahora bien, dentro de las pruebas no paramétricas, ¿cuál es preferible utilizar en caso necesario?
¿Por qué escoger una prueba paramétrica?
Hay tres razones que estarían motivando a la elección de una prueba paramétrica:
- El uso de la mediana es más representativo para el caso que el uso de la media.
- El tamaño de la muestra es muy pequeño.
- Hay datos ordinales o atípicos que no se pueden eliminar.
Razón 1: El área de estudio se representa mejor con la mediana que con la media
Ésta es una razón importante pero que se menciona muy poco. Pero ¿en qué consiste esta diferencia?
Media o promedio | Mediana |
---|---|
Media aritmética de un conjunto de números o el resultado de sumar dos o más cantidades y dividir, después, el total por el número de cantidades | Un valor numérico que separa la mitad superior de un conjunto de la mitad inferior. Es decir: es un valor en un conjunto ordenado de valores por debajo y por encima del cual hay un número igual de valores o que es la media aritmética de los dos valores medios si no hay un número medio. |
Ejemplo: Media del gasto de los viajes realizados en un año teniendo en cuenta que se hacen 10 viajes en avión con precios que pueden ser semejantes o cambiantes. | Ejemplo: En una compañía de 5 empleados, cada empleado cobra un sueldo. Y queremos calcular la mediana |
En el caso del cálculo de la mediana, su intención va más allá de la media, aunque esta media puede tomarse de referencia como punto central. Me explico:
- Ana: 1.500€
- Roberto: 1.800€
- Ramón: .1,000€
- Juan: 25.000 €
- Berto: 350.000€
Berto cobra muchísimo más que el resto de sus compañeros y queremos saber cuánto por encima de la media este empleado cobra respecto al salario medio. Puedes usar herramientas tales como Microsoft Excel (con las funciones AVERAGE() y MEDIAN()) o una calculadora científica para hacer los cálculos de manera automática y obtener la siguiente tabla:
Empleados | Salario |
---|---|
Ana | 1.500 |
Roberto | 1.800 |
Ramón | 1.000 |
Juan | 25.000 |
Berto | 350.000 |
Media (Salario medio o punto central) | 75.860 |
Mediana | 1.800 |
Teniendo en cuenta el valor de la mediana situado en 1800 podemos decir que hay una persona en ese valor, dos personas cobrando por encima (+1.800) y otras dos, cobrando menos (-1.800). La mediana nos va a permitir ordenar los datos y por lo tanto comparar resultados. O lo que es lo mismo: un promedio posicional.
Razón 2: El tamaño de la muestra es muy pequeño
Si la investigación no cumple con las condiciones relativas al tamaño de la muestra para las pruebas paramétricas y no estamos seguros de poder tener los datos distribuidos normalmente, debe usarse una prueba no paramétrica. Esta distribución de los datos, incluso, puede resultar imposible en caso de disponer de una muestra verdaderamente muy pequeña. Esto es así porque las pruebas de distribución carecerán de la potencia suficiente para proporcionar resultados significativos. En este contexto, difícilmente vamos a encontrar una alternativa a la que poder aferrarnos, ya que, si bien las pruebas no paramétricas son poco robustas per sé, lo serán más aún si no disponemos de un tamaño de muestra razonable.
Razón 3: Hay datos ordinales, o valores atípicos que no se pueden eliminar
Hay que tener en cuenta dos puntos importantes: por un lado, las pruebas paramétricas típicas solo pueden evaluar datos continuos y, por otro lado, los resultados podrían verse afectados significativamente por los valores atípicos. Por el contrario, algunas pruebas no paramétricas pueden ser usadas con datos ordinales y no verse seriamente afectadas por los valores atípicos. Asegúrese de comprobar los supuestos para las pruebas no paramétricas, porque cada una tiene sus propios requisitos de datos.
Pruebas paramétricas | Pruebas no paramétricas |
---|---|
Sólo pueden evaluar datos continuos. | Pueden ser usadas con datos ordinales. |
Sí se afectan por los valores atípicos. | No se afectan por los valores atípicos. |
En este caso puede interesarte la entrada sobre la idoneidad de la prueba estadística cuando se emplea una escala Likert.
Puedes ampliar información sobre este tema:
- Ventajas e inconvenientes de las pruebas paramétricas y no paramétricas.
- Comparativa entre las pruebas paramétricas y no paramétricas en investigación.
- Pruebas paramétricas con ejemplos: ¿qué son, cuándo usarlas y cómo se clasifican?
- Ejemplos rápidos para aprender a utilizar una prueba paramétrica u otra
- ¿Qué prueba de análisis estadístico utilizar cuando tenemos datos en una escala de Likert?
- Error tipo 1 y error tipo 2 en investigación: ¿en qué consisten? ¿qué tienen que ver con las hipótesis?
- El método, el apartado del TFG más desesperante para los estudiantes de psicologia
- Técnicas de análisis más habituales para evaluar la eficacia y la efectividad de tu programa de intervención en el TFG de psicología