¿Qué prueba de análisis estadístico utilizar cuando tenemos datos de una escala likert?

Cuando queremos hacer analizar los resultados de un cuestionario en cuya resolución se usa una escala likert, hay dos pruebas específicas que pueden usarse: prueba T de dos muestras y la Mann-Whitney. Pero ¿cuál es mejor y por qué? En esta entrada pretendo no hacerme mucho lío al explicártelo.

La escala Likert en cuestionarios

Es muy probable que, si estás evaluando la depresión o la ansiedad a tus sujetos de estudio te encuentres con alguna escala que utilice un formato de respuesta conocido como Likert. También suelen utilizarse en las encuestas. Nos estamos refiriendo a un tipo de respuesta que hace escoger entre un «completamente en desacuerdo», «de acuerdo» o «muy de acuerdo» y que suelen suponer una puntuación que va del 0 al 3 o del 0 al 5. En definitiva, podemos decir que los datos de elementos de Likert son discretos, ordinales y se presentan en un rango limitado. Debido a esto, los expertos no parecen llegar a un acuerdo unánime respecto a qué prueba utilizar. Por lo general, a la hora de preguntarnos si es mejor utilizar una prueba paramétrica o una prueba no paramétrica. Pero ¿por qué una prueba y no la otra?

Prueba paramétrica o no paramétrica

La principal diferencia a tener en cuenta entre estos dos grandes tipos de pruebas de análisis es en relación a la asunción de una distribución continua normal y a su robustez dependiendo del tamaño de la muestra. Más concretamente:

  • Utilizar una prueba paramétrica (como podría ser la prueba t de 2 muestras) nos lleva a asumir una distribución continua normal. Por otro lado, no hace falta tener un tamaño de muestra lo suficientemente grande ya que las pruebas t son robustas a las desviaciones de la normalidad.
  • Si usamos una prueba no paramétrica (la prueba de Mann-Whitney) supone no asumir una distribución normal o continua. Por otro lado, no podemos ignorar el hecho de que estas pruebas no paramétricas presentan más dificultades a la hora de detectar una diferencia cuando ésta realmente existe.

¿Prueba t de 2 muestras (paramétrica) o la prueba de Mann-Whitney (no paramétrica)?

Entonces, ¿qué? ¿Cuál es mejor a la hora de analizar los datos de una escala Likert? Pues parece ser que no hay mucha diferencia a la hora de escoger un tipo de prueba u otro. Si necesitas comparar dos grupos de datos de escala likert (0-5 o de cinco puntos), no importa qué tipo de análisis (paramétrico o no paramétrico) utilices. Ya que ambas pruebas ofrecen casi la misma protección contra falsos negativos y siempre brindan la misma protección ante los falsos positivos. Siempre y cuando utilices tamaños de muestra de 10, 30 y 200 por grupo. O sea, tamaños muestrales bastante empleados en los TFG del Grado de Psicología y más habituales en general en las investigaciones.

Sobre esto dilucidan de Winter y Dodou (2010), cuyo artículo te invito a leer para ampliar la información que te ofrezco en esta entrada.

una diferencia de poder entre las dos pruebas. Si realiza ambas pruebas en los mismos datos y no están de acuerdo (uno es significativo y el otro no lo es), puede consultar una tabla del artículo para determinar si una diferencia en el poder estadístico podría ser un problema. Esta diferencia de poder afecta sólo a una pequeña minoría de los casos.


Referencias

Abstract: Los cuestionarios de Likert se utilizan ampliamente en la investigación de encuestas, pero no está claro si los datos de los ítems deben investigarse mediante procedimientos paramétricos o no paramétricos. Este estudio comparó las tasas de error de Tipo I y II de la prueba t versus Mann-Whitney-Wilcoxon (MWW) para ítems de Likert de cinco puntos. Se definieron catorce distribuciones de población y se extrajeron pares de muestras de las poblaciones y se sometieron a la prueba t y la prueba t en rangos, que arroja los mismos resultados que MWW. Los resultados mostraron que las dos pruebas tenían potencia equivalente para la mayoría de los pares. MWW tenía una ventaja de poder cuando una de las muestras se extrajo de una distribución sesgada o con picos. Se produjeron fuertes diferencias de poder entre la prueba t y MWW cuando una de las muestras se extrajo de una distribución multimodal. En particular, la tasa de error Tipo I de ambos métodos nunca estuvo más del 3 % por encima de la tasa nominal del 5 %, incluso cuando los tamaños de muestra eran muy desiguales. En conclusión, para los ítems de Likert de cinco puntos, la prueba t y MWW generalmente tienen un poder similar, y los investigadores no tienen que preocuparse por encontrar una diferencia mientras no haya ninguna en la población. Consultado 61,170 veces en https://pareonline.net desde el 6 de octubre de 2010 hasta el 31 de diciembre de 2019. Para descargas desde el 1 de enero de 2020 en adelante, haga clic en el enlace PlumX Metrics a la derecha.

Sobre el artículo

Los investigadores identificaron un conjunto diverso de 14 distribuciones que son representativas de los datos reales de Likert. El programa informático dibujó pares independientes de muestras para probar todas las combinaciones posibles de las 14 distribuciones. En total, se generaron 10.000 muestras aleatorias para cada una de las 98 combinaciones de distribución. Los pares de muestras se analizan utilizando tanto la prueba t de dos muestras y la prueba de Mann-Whitney para comparar la eficacia de cada prueba. El estudio también evaluó diferentes tamaños de muestra.

Los resultados muestran que para todos los pares de distribuciones las tasas de error Tipo I (falso positivo) son muy cercanas a las cantidades objetivo. En otras palabras, si usted utiliza cualquiera de los análisis y sus resultados son estadísticamente significativos, no es necesario estar demasiado preocupado por un falso positivo.

Los resultados también muestran que para la mayoría de los pares de distribuciones, la diferencia entre el poder estadístico de las dos pruebas es trivial. En otras palabras, si realmente existe una diferencia a nivel de población, cualquiera de los análisis es igualmente probable que lo detecte. Las preocupaciones sobre la prueba de Mann-Whitney que tienen menos poder en este contexto parecen ser infundadas.


5/5 - (2 votos)

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio