stringtranslate.com

Escala de Likert

Una escala de Likert (/ˈlɪkərt / LIK - ərt , [ 1 ] [ nota 1] ) es una escala psicométrica que lleva el nombre de su inventor, el psicólogo social estadounidense Rensis Likert , [2] que se utiliza comúnmente en cuestionarios de investigación . Es el enfoque más utilizado para escalar respuestas en la investigación de encuestas, de modo que el término (o más completamente la escala de tipo Likert ) a menudo se usa indistintamente con escala de calificación , aunque existen otros tipos de escalas de calificación.

Likert distingue entre una escala propiamente dicha, que surge de las respuestas colectivas a un conjunto de ítems (normalmente ocho o más), y el formato en el que las respuestas se califican a lo largo de un rango. Técnicamente hablando, una escala Likert se refiere únicamente a la primera. [3] [4] La diferencia entre estos dos conceptos tiene que ver con la distinción que hace Likert entre el fenómeno subyacente que se investiga y los medios para capturar la variación que apunta al fenómeno subyacente. [5]

Al responder a un ítem de Likert, los encuestados especifican su nivel de acuerdo o desacuerdo en una escala simétrica de acuerdo-desacuerdo para una serie de afirmaciones. De este modo, el rango refleja la intensidad de sus sentimientos respecto de un ítem determinado. [6]

Una escala puede crearse como la simple suma o promedio de las respuestas del cuestionario sobre el conjunto de ítems individuales (preguntas). Al hacerlo, la escala Likert supone que las distancias entre cada opción (opción de respuesta) son iguales. Muchos investigadores emplean un conjunto de tales ítems que están altamente correlacionados (que muestran una alta consistencia interna ) pero también que juntos capturarán el dominio completo en estudio (lo que requiere correlaciones menos que perfectas). Otros se adhieren a un estándar por el cual "se supone que todos los ítems son réplicas unos de otros o, en otras palabras, los ítems se consideran instrumentos paralelos". [7] : 197  Por el contrario, la teoría de pruebas moderna trata la dificultad de cada ítem (los ICC ) como información que se debe incorporar en los ítems de escala. [8]

Composición

Ejemplo de cuestionario sobre el diseño de un sitio web, con respuestas en escala Likert

Una escala Likert es la suma de respuestas a varios ítems de Likert . Debido a que muchas escalas Likert emparejan cada ítem de Likert constituyente con su propia instancia de una escala analógica visual (por ejemplo, una línea horizontal, en la que el sujeto indica una respuesta haciendo un círculo o marcando las marcas), a veces se hace referencia erróneamente a un ítem individual como si fuera o tuviera una escala, y este error crea una confusión generalizada en la literatura y el lenguaje del campo.

Un ítem Likert es simplemente una afirmación que se le pide al encuestado que evalúe dándole un valor cuantitativo en cualquier tipo de dimensión subjetiva u objetiva, siendo el nivel de acuerdo/desacuerdo la dimensión más comúnmente utilizada. Los ítems Likert bien diseñados muestran tanto "simetría" como "equilibrio". Simetría significa que contienen cantidades iguales de posiciones positivas y negativas cuyas distancias respectivas son bilateralmente simétricas respecto del valor "neutral"/cero (ya sea que ese valor se presente o no como candidato). Equilibrio significa que la distancia entre cada valor candidato es la misma, lo que permite que las comparaciones cuantitativas, como el promedio, sean válidas entre ítems que contienen más de dos valores candidatos. [9]

El formato de un elemento Likert típico de cinco niveles, por ejemplo, podría ser:

  1. Estoy totalmente en desacuerdo
  2. Discrepar
  3. Ni de acuerdo ni en desacuerdo
  4. Aceptar
  5. Estoy totalmente de acuerdo

La escala Likert es un método de escala bipolar que mide la respuesta positiva o negativa a una afirmación. A veces se utiliza una escala de puntos iguales, en la que la opción intermedia de "ni de acuerdo ni en desacuerdo" no está disponible. A esto a veces se le llama método de "elección forzada", ya que se elimina la opción neutral. [10] La opción neutral puede verse como una opción fácil de tomar cuando un encuestado no está seguro, por lo que es cuestionable si es una opción verdaderamente neutral. Un estudio de 1987 encontró diferencias insignificantes entre el uso de "indeciso" y "neutral" como opción intermedia en una escala Likert de cinco puntos. [11]

Las escalas Likert pueden estar sujetas a distorsiones por diversas causas. Los encuestados pueden:

El diseño de una escala con una codificación equilibrada (un número igual de afirmaciones positivas y negativas y, especialmente, un número igual de afirmaciones positivas y negativas con respecto a cada posición o tema en cuestión) puede obviar el problema del sesgo de aquiescencia, ya que la aquiescencia en los ítems con codificación positiva equilibrará la aquiescencia en los ítems con codificación negativa, pero los sesgos defensivos, de tendencia central y de deseabilidad social son algo más problemáticos.

Puntuación y análisis

Una vez completado el cuestionario, cada ítem puede analizarse por separado o, en algunos casos, las respuestas a los ítems pueden sumarse para crear una puntuación para un grupo de ítems. Por ello, las escalas Likert suelen denominarse escalas sumativas.

En la literatura [12] [13] existe un considerable desacuerdo sobre si los ítems de Likert individuales pueden considerarse como datos de nivel de intervalo o si deben tratarse como datos categóricos ordenados, y hay convicciones firmes sobre cuáles son los métodos más aplicables. Este desacuerdo se remonta, en muchos aspectos, al grado en que los ítems de Likert se interpretan como datos ordinales .

Hay dos consideraciones principales en esta discusión. En primer lugar, las escalas Likert son arbitrarias. El valor asignado a un ítem Likert no tiene una base numérica objetiva, ni en términos de teoría de la medida ni de escala (a partir de la cual se puede determinar una métrica de distancia ). El valor asignado a cada ítem Likert es simplemente determinado por el investigador que diseña la encuesta, quien toma la decisión basándose en un nivel de detalle deseado. Sin embargo, por convención, a los ítems Likert se les suelen asignar valores enteros positivos progresivos. Las escalas Likert suelen oscilar entre 2 y 10, siendo 3, 5 o 7 los más comunes. [14] Además, esta estructura progresiva de la escala es tal que cada ítem Likert sucesivo se trata como si indicara una respuesta "mejor" que el valor anterior. (Esto puede diferir en los casos en que se necesita un orden inverso de la escala Likert).

El segundo punto, y posiblemente el más importante, es si la "distancia" entre cada categoría sucesiva de ítems es equivalente, lo que se infiere tradicionalmente. Por ejemplo, en el ítem Likert de cinco puntos mencionado anteriormente, la inferencia es que la "distancia" entre la categoría 1 y 2 es la misma que entre la categoría 3 y 4. En términos de una buena práctica de investigación, una presentación equidistante por parte del investigador es importante; de ​​lo contrario, puede resultar un sesgo en el análisis. Por ejemplo, es poco probable que un ítem Likert de cuatro puntos con las categorías "Malo", "Promedio", "Bueno" y "Muy bueno" tenga todas las categorías equidistantes, ya que solo hay una categoría que puede recibir una calificación por debajo del promedio. Podría decirse que esto sesgaría cualquier resultado a favor de un resultado positivo. Por otro lado, incluso si un investigador presenta lo que él o ella cree que son categorías equidistantes, es posible que el encuestado no lo interprete como tal.

Una buena escala Likert, como la anterior, presentará una simetría de categorías en torno a un punto medio con calificadores lingüísticos claramente definidos. En una escala simétrica de este tipo, los atributos equidistantes normalmente se observarán con mayor claridad o, al menos, se inferirán. Cuando una escala Likert es simétrica y equidistante, se comportará más como una medición a nivel de intervalo. Por lo tanto, si bien una escala Likert es de hecho ordinal , si se presenta bien, puede aproximarse a una medición a nivel de intervalo. Esto puede ser beneficioso ya que, si se tratara simplemente como una escala ordinal, se podría perder información valiosa si la "distancia" entre los elementos de Likert no estuviera disponible para su consideración. La idea importante aquí es que el tipo apropiado de análisis depende de cómo se haya presentado la escala Likert.

Las nociones de tendencia central suelen ser aplicables a nivel de ítem, es decir, las respuestas suelen mostrar una distribución cuasinormal. La validez de tales medidas depende de la naturaleza de intervalo subyacente de la escala. Si se supone la naturaleza de intervalo para una comparación de dos grupos, la prueba t de muestras pareadas no es inapropiada. [4] Si se van a realizar pruebas no paramétricas, se recomienda la modificación de Pratt (1959) [15] a la prueba de rangos con signo de Wilcoxon en lugar de la prueba de rangos con signo de Wilcoxon estándar . [4]

Las respuestas a varias preguntas Likert pueden sumarse siempre que todas las preguntas utilicen la misma escala Likert y que la escala sea una aproximación defendible a una escala de intervalo, en cuyo caso el teorema del límite central permite el tratamiento de los datos como datos de intervalo que miden una variable latente. [ cita requerida ] Si las respuestas sumadas cumplen estos supuestos, se pueden aplicar pruebas estadísticas paramétricas como el análisis de varianza . Los puntos de corte típicos para pensar que esta aproximación será aceptable son un mínimo de cuatro y preferiblemente ocho elementos en la suma. [5] [13]

Para modelar directamente las respuestas binarias de Likert, se pueden representar en forma binomial sumando las respuestas de acuerdo y desacuerdo por separado. La prueba de chi-cuadrado , la prueba Q de Cochran o la prueba de McNemar son procedimientos estadísticos comunes utilizados después de esta transformación. Las pruebas no paramétricas como la prueba de chi-cuadrado , la prueba de Mann-Whitney , la prueba de rangos con signo de Wilcoxon o la prueba de Kruskal-Wallis [16] se utilizan a menudo en el análisis de datos de escala Likert .

Como alternativa, las respuestas de la escala Likert se pueden analizar con un modelo probit ordenado , preservando el orden de las respuestas sin asumir una escala de intervalo. El uso de un modelo probit ordenado puede evitar errores que surgen al tratar las calificaciones ordenadas como mediciones a nivel de intervalo. [17] La ​​evaluación basada en el consenso (CBA) se puede utilizar para crear un estándar objetivo para las escalas Likert en dominios donde no existe un estándar generalmente aceptado u objetivo. La evaluación basada en el consenso (CBA) se puede utilizar para refinar o incluso validar estándares generalmente aceptados. [ cita requerida ]

Presentación visual de datos de tipo Likert

Una parte importante del análisis y la presentación de datos es la visualización (o representación gráfica) de los mismos. El tema de la representación gráfica de datos de calificación Likert (y otros) se analiza en profundidad en dos artículos de Robbins y Heiberger. [18] En el primero, recomiendan el uso de lo que denominan gráficos de barras apiladas divergentes y los comparan con otros estilos de representación gráfica. El segundo artículo [19] describe el uso de la función Likert en el paquete HH para R y ofrece muchos ejemplos de su uso.

Nivel de medición

A menudo se cree que las cinco categorías de respuesta representan un nivel de intervalo de medición . Pero esto solo puede ser así si los intervalos entre los puntos de la escala corresponden a observaciones empíricas en un sentido métrico. Reips y Funke (2008) [20] muestran que este criterio se cumple mucho mejor con una escala analógica visual . De hecho, también pueden aparecer fenómenos que incluso cuestionen el nivel de escala ordinal en escalas Likert. [21] Por ejemplo, en un conjunto de ítems A ,  B ,  C calificados con una escala Likert pueden aparecer relaciones circulares como A  >  B , B  >  C y C  >  A. Esto viola el axioma de transitividad para la escala ordinal.

Las investigaciones de Labovitz [22] y Traylor [23] aportan pruebas de que, incluso con distorsiones bastante grandes de las distancias percibidas entre los puntos de la escala, los ítems de tipo Likert tienen un rendimiento cercano al de las escalas que se perciben como intervalos iguales. Por lo tanto, estos ítems y otras escalas que parecen iguales en los cuestionarios son resistentes a las violaciones del supuesto de distancias iguales que muchos investigadores creen que se requiere para los procedimientos y pruebas estadísticas paramétricas.

Modelo de Rasch

En principio, los datos de la escala Likert pueden utilizarse como base para obtener estimaciones de nivel de intervalo en un continuo mediante la aplicación del modelo politómico de Rasch , cuando se pueden obtener datos que se ajusten a este modelo. Además, el modelo politómico de Rasch permite probar la hipótesis de que las afirmaciones reflejan niveles crecientes de una actitud o rasgo, como se pretende. Por ejemplo, la aplicación del modelo a menudo indica que la categoría neutral no representa un nivel de actitud o rasgo entre las categorías de acuerdo y desacuerdo.

No todos los conjuntos de ítems con escala Likert se pueden utilizar para la medición de Rasch. Los datos deben comprobarse minuciosamente para cumplir con los estrictos axiomas formales del modelo. Sin embargo, las puntuaciones brutas son estadísticas suficientes para las medidas de Rasch, una elección deliberada de Georg Rasch , por lo que, si está preparado para aceptar las puntuaciones brutas como válidas, entonces también puede aceptar las medidas de Rasch como válidas.

Pronunciación

Rensis Likert , el desarrollador de la escala, pronunció su nombre / ˈlɪkərt / LIK -ərt . [ 24] [25] Algunos han afirmado que el nombre de Likert "es uno de los más mal pronunciados en [el] campo", [ 26 ] porque muchas personas pronuncian el nombre de la escala como / ˈl aɪkərt / LY - kərt .

Véase también

Notas

  1. ^ Comúnmente se pronuncia incorrectamente como / ˈ l k ər t / LY -kərt

Referencias

  1. ^ Wuensch, Karl L. (4 de octubre de 2005). "¿Qué es una escala Likert? ¿Y cómo se pronuncia 'Likert'?". Universidad de Carolina del Este . Consultado el 16 de diciembre de 2023 .
  2. ^ Likert, Rensis (1932). "Una técnica para la medición de actitudes". Archivos de Psicología . 140 : 1–55.
  3. ^ Spector, Paul E (1992). Construcción de una escala de calificación sumada . Sage.
  4. ^ abc Derrick, B; White, P (2017). "Comparación de dos muestras de una pregunta Likert individual". Revista internacional de matemáticas y estadística . 18 (3): 1–13.
  5. ^ ab Carifio, James; Perla, Rocco (2007). "Diez malentendidos comunes, conceptos erróneos, mitos persistentes y leyendas urbanas sobre las escalas Likert y los formatos de respuesta Likert y sus antídotos". Revista de Ciencias Sociales . 3 (3): 106–116. doi :10.3844/jssp.2007.106.116.
  6. ^ Burns, Alvin; Burns, Ronald (2008). Investigación básica de marketing (segunda edición). Nueva Jersey: Pearson Education. pp. 245. ISBN 978-0-13-205958-9.
  7. ^ van Alphen, A.; Halfens, R.; Hasman, A.; Imbos, T. (1994). "¿Likert o Rasch? Nada es más aplicable que una buena teoría". Journal of Advanced Nursing . 20 (1): 196–201. doi :10.1046/j.1365-2648.1994.20010196.x. PMID  7930122.
  8. ^ Rusch, Thomas; Lowry, Paul B.; Mair, Patrick; Treiblmaier, Horst (2017). "Liberarse de las limitaciones de la teoría clásica de las pruebas: desarrollo y medición de escalas de sistemas de información utilizando la teoría de respuesta a los ítems" (PDF) . Información y gestión . 54 (2): 189–203. doi :10.1016/j.im.2016.06.005.
  9. ^ Burns, Alvin; Burns, Ronald (2008). Investigación básica de marketing (segunda edición). Nueva Jersey: Pearson Education. pp. 250. ISBN 978-0-13-205958-9.
  10. ^ Allen, Elaine; Seaman, Christopher (2007). "Escalas de Likert y análisis de datos". Quality Progress . págs. 64–65.
  11. ^ Armstrong, Robert (1987). "El punto medio en una escala tipo Likert de cinco puntos". Perceptual and Motor Skills . 64 (2): 359–362. doi :10.2466/pms.1987.64.2.359. S2CID  145705789.
  12. ^ Jamieson, Susan (2004). "Escalas Likert: cómo (ab)utilizarlas" (PDF) . Educación médica . 38 (12): 1217–1218. doi :10.1111/j.1365-2929.2004.02012.x. PMID  15566531. S2CID  42509064.
  13. ^ ab Norman, Geoff (2010). "Escalas Likert, niveles de medición y las "leyes" de la estadística". Avances en Educación en Ciencias de la Salud . 15 (5): 625–632. doi :10.1007/s10459-010-9222-y. PMID  20146096. S2CID  6566608.
  14. ^ "Explicación de la escala Likert: con un ejemplo interactivo". SurveyKing . Consultado el 13 de agosto de 2017 .
  15. ^ Pratt, J. (1959). "Observaciones sobre ceros y empates en los procedimientos de rangos con signo de Wilcoxon". Revista de la Asociación Estadounidense de Estadística . 54 (287): 655–667. doi :10.1080/01621459.1959.10501526.
  16. ^ Mogey, Nora (25 de marzo de 1999). "So You Want to Use a Likert Scale?" [¿Entonces quiere usar una escala Likert?]. Learning Technology Dissemination Initiative [Iniciativa de difusión de tecnología de aprendizaje ]. Heriot-Watt University . Consultado el 30 de abril de 2009 .
  17. ^ Liddell, T.; Kruschke, J. (2018). "Análisis de datos ordinales con modelos métricos: ¿Qué podría salir mal?". Journal of Experimental Social Psychology . 79 : 328–348. doi :10.1016/j.jesp.2018.08.009. hdl : 2022/21970 .
  18. ^ Robbins, NB; Heiberger, RM (2011). "Gráficos de Likert y otras escalas de calificación" (PDF) . Actas de la JSM, Sección sobre métodos de investigación de encuestas . Asociación Estadounidense de Estadística. págs. 1058–1066.
  19. ^ Heiberger, RM; Robbins, NB (2014). "Diseño de gráficos de barras apiladas divergentes para escalas de Likert y otras aplicaciones". Journal of Statistical Software . Vol. 57. Asociación Estadounidense de Estadística. págs. 1–32. doi :10.18637/jss.v057.i05. S2CID  61139330.
  20. ^ Reips, Ulf-Dietrich; Funke, Frederik (2008). "Medición del nivel de intervalo con escalas analógicas visuales en la investigación basada en Internet: generador VAS". Métodos de investigación del comportamiento . 40 (3): 699–704. doi : 10.3758/BRM.40.3.699 . PMID  18697664.
  21. ^ Johanson, George A.; Gips, Crystal J. (12-16 de abril de 1993). Intransitividad de comparación por pares: ¿información útil o molestia? (PDF) . Reunión anual de la Asociación Estadounidense de Investigación Educativa. Atlanta, GA.
  22. ^ Labovitz, S. (1967). "Algunas observaciones sobre medición y estadística". Fuerzas sociales . 46 (2): 151–160. doi :10.2307/2574595. JSTOR  2574595.
  23. ^ Traylor, Mark (octubre de 1983). "Escalamiento ordinal e interválico". Revista de la Sociedad de Investigación de Mercados . 25 (4): 297–303.
  24. ^ Babbie, Earl R. (2005). Los fundamentos de la investigación social . Belmont, CA: Thomson Wadsworth. pág. 174. ISBN 978-0-534-63036-2.
  25. ^ Meyers, Lawrence S.; Guarino, Anthony; Gamst, Glenn (2005). Investigación multivariante aplicada: diseño e interpretación . Sage Publications. pág. 20. ISBN. 978-1-4129-0412-4.
  26. ^ Latham, Gary P. (2006). Motivación laboral: historia, teoría, investigación y práctica . Thousand Oaks, California: Sage Publications. pág. 15. ISBN 978-0-7619-2018-2.

Enlaces externos