stringtranslate.com

Alfa de Krippendorff

El coeficiente alfa de Krippendorff , [1] llamado así por el académico Klaus Krippendorff , es una medida estadística del acuerdo alcanzado al codificar un conjunto de unidades de análisis. Desde la década de 1970, el coeficiente alfa se ha utilizado en el análisis de contenido , donde las unidades textuales son categorizadas por lectores capacitados, en la investigación de encuestas y asesoramiento, donde los expertos codifican datos de entrevistas abiertas en términos analizables, en pruebas psicológicas, donde se deben comparar pruebas alternativas de los mismos fenómenos, o en estudios observacionales , donde se registran sucesos no estructurados para su posterior análisis.

El alfa de Krippendorff generaliza varias estadísticas conocidas, a menudo llamadas medidas de acuerdo entre codificadores, confiabilidad entre evaluadores , confiabilidad de la codificación de conjuntos de unidades dados (a diferencia de la unificación), pero también se distingue de las estadísticas que se denominan coeficientes de confiabilidad pero que no son adecuadas para los detalles de la codificación de datos generados para el análisis posterior.

El alfa de Krippendorff es aplicable a cualquier número de codificadores, cada uno de los cuales asigna un valor a una unidad de análisis, a datos incompletos (faltantes), a cualquier número de valores disponibles para codificar una variable, a métricas binarias, nominales, ordinales, de intervalo, de razón, polares y circulares (nótese que esto no es una métrica en el sentido matemático, sino a menudo el cuadrado de una métrica matemática , consulte niveles de medición ), y se ajusta a tamaños de muestra pequeños de los datos de confiabilidad. La virtud de un solo coeficiente con estas variaciones es que las confiabilidades calculadas son comparables entre cualquier número de codificadores, valores, métricas diferentes y tamaños de muestra desiguales.

Hay disponible un software para calcular el alfa de Krippendorff. [2] [3] [4] [5] [6] [7] [8] [9] [10]

Datos de fiabilidad

Los datos de confiabilidad se generan en una situación en la que m ≥ 2 codificadores instruidos conjuntamente (por ejemplo, por un libro de códigos ) pero que trabajan independientemente asignan cualquiera de un conjunto de valores 1,..., V a un conjunto común de N unidades de análisis. En su forma canónica, los datos de confiabilidad se tabulan en una matriz m por N que contiene N valores v ij que el codificador c i ha asignado a la unidad u j . Defina m j como el número de valores asignados a la unidad j entre todos los codificadores c . Cuando los datos están incompletos, m j puede ser menor que m . Los datos de confiabilidad requieren que los valores sean emparejables, es decir, m j ≥ 2. El número total de valores emparejables es nmN .

Para ayudar a aclarar, así es como se ve la forma canónica, en resumen:

Forma general de alfa

Denotamos por el conjunto de todas las respuestas posibles que puede dar un observador. Las respuestas de todos los observadores para un ejemplo se denominan unidad (forman un multiconjunto). Denotamos un multiconjunto con estas unidades como los elementos, .

Alfa viene dado por:

¿Dónde está el desacuerdo observado y es el desacuerdo esperado por casualidad?

donde es una función métrica (nótese que no es una métrica en el sentido matemático, sino a menudo el cuadrado de una métrica matemática, ver más abajo), es el número total de elementos emparejables, es el número de elementos en una unidad, número de pares en la unidad y es la función de permutación . Reordenando los términos, la suma puede interpretarse de manera conceptual como el promedio ponderado de los desacuerdos de las unidades individuales, ponderado por el número de codificadores asignados a la unidad j:

donde es la media de los números (aquí y definen elementos emparejables). Nótese que en el caso de todos los , es solo el promedio de todos los números con . También hay una interpretación de como la distancia media observada (ponderada) desde la diagonal.

donde es el número de maneras en que se puede formar el par. Esto se puede ver como la distancia promedio desde la diagonal de todos los pares posibles de respuestas que podrían derivarse del conjunto múltiple de todas las observaciones.

Lo anterior es equivalente a la forma usual de una vez que se ha simplificado algebraicamente. [11]

Una interpretación del alfa de Krippendorff es:

Indica una fiabilidad perfecta
indica la ausencia total de fiabilidad. Las unidades y los valores asignados a ellas no tienen relación estadística.
cuando los desacuerdos son sistemáticos y exceden lo que se puede esperar por casualidad.

En esta forma general, los desacuerdos D o y D e pueden ser conceptualmente transparentes pero son computacionalmente ineficientes. Pueden simplificarse algebraicamente, especialmente cuando se expresan en términos de la representación visualmente más instructiva de la matriz de coincidencia de los datos de confiabilidad.

Matrices de coincidencia

Una matriz de coincidencias tabula de forma cruzada los n valores emparejables de la forma canónica de los datos de confiabilidad en una matriz cuadrada de v por v , donde v es el número de valores disponibles en una variable. A diferencia de las matrices de contingencia, conocidas en las estadísticas de asociación y correlación, que tabulan pares de valores ( tabulación cruzada ), una matriz de coincidencias tabula todos los valores emparejables . Una matriz de coincidencias omite las referencias a los codificadores y es simétrica alrededor de su diagonal, que contiene todas las coincidencias perfectas, v iu = v i'u para dos codificadores i e i' , en todas las unidades u . La matriz de coincidencias observadas contiene frecuencias:

omitiendo valores no apareados, donde I (∘) = 1 si es verdadero y 0 en caso contrario.

Debido a que una matriz de coincidencia tabula todos los valores emparejables y su contenido suma el total n , cuando participan cuatro o más codificadores, o ck pueden ser fracciones.

La matriz de coincidencias esperadas contiene frecuencias:

que suman los mismos n c , n k y n que o ck . En función de estas coincidencias, el alfa de Krippendorff se convierte en:

Funciones de diferencia

Las funciones de diferencia [12] entre los valores v y v' reflejan las propiedades métricas ( niveles de medición ) de su variable.

En general:

En particular:

Para datos nominales , donde v y v' sirven como nombres.
Para datos ordinales , donde v y v ′ son valores codificados interpretados como rangos, y n g , n v , n v son las frecuencias respectivas de cada rango.
Para datos de intervalo , donde v y v ′ son valores de escala de intervalo.
Para datos de razón , donde v y v ′ son valores absolutos.
Para datos polares , donde v min y v max definen los puntos finales de la escala polar.
Para datos circulares , donde la función seno se expresa en grados y U es la circunferencia o el rango de valores en un círculo o bucle antes de que se repitan. Para métricas circulares de intervalos iguales, los valores enteros más pequeños y más grandes de esta métrica son adyacentes entre sí y U  =  v más grande  –  v más pequeño  + 1.

Significado

Dado que las afirmaciones matemáticas de la distribución estadística de alfa son siempre sólo aproximaciones, es preferible obtener la distribución de alfa mediante el método bootstrap . [13] [14] La distribución de alfa da lugar a dos índices:

El coeficiente alfa mínimo aceptable debe elegirse de acuerdo con la importancia de las conclusiones que se extraigan de datos imperfectos. Cuando los costos de sacar conclusiones erróneas son altos, el alfa mínimo también debe establecerse alto. A falta de conocimiento de los riesgos de sacar conclusiones falsas de datos poco fiables, los científicos sociales suelen basarse en datos con fiabilidades α  ≥ 0,800, consideran los datos con 0,800 >  α  ≥ 0,667 sólo para sacar conclusiones provisionales y descartan los datos cuyas medidas de concordancia α < 0,667. [15]

Un ejemplo computacional

Sea la forma canónica de los datos de confiabilidad una matriz de 3 codificadores por 15 unidades con 45 celdas:

Supongamos que “*” indica una categoría predeterminada como “no se puede codificar”, “no hay respuesta” o “falta una observación”. Entonces, * no proporciona información sobre la confiabilidad de los datos en los cuatro valores que importan. Tenga en cuenta que las unidades 2 y 14 no contienen información y la unidad 1 contiene solo un valor, que no es emparejable dentro de esa unidad. Por lo tanto, estos datos de confiabilidad no consisten en mN  = 45 sino en n  = 26 valores emparejables, no en N  = 15 sino en 12 unidades codificadas de forma múltiple.

La matriz de coincidencia para estos datos se construiría de la siguiente manera:

o 11 = {en u = 4}: {en u = 10}: {en u = 11}:
o 13 = {en u =8}: o 31
o 22 = {en u = 3}: {en u = 9}:
o 33 = {en u = 5}: {en u = 6}: {en u = 12}: {en u = 13}:
o 34 = {en u = 6}: {en u = 15}: o 43
o 44 = {en u = 7}:

En términos de las entradas en esta matriz de coincidencia, el alfa de Krippendorff puede calcularse a partir de:

Para mayor comodidad, debido a que los productos con y , solo las entradas en uno de los triángulos fuera de la diagonal de la matriz de coincidencia se enumeran a continuación:

Considerando que para datos nominales la expresión anterior da como resultado:

Con datos de intervalo la expresión anterior da como resultado:

Aquí, debido a que los desacuerdos ocurren en gran medida entre valores vecinos, visualizados al ocurrir más cerca de la diagonal de la matriz de coincidencia, una condición que tiene en cuenta pero no. Cuando las frecuencias observadas o vv son en promedio proporcionales a las frecuencias esperadas e v ≠ v' , .

Comparar los coeficientes alfa entre diferentes métricas puede proporcionar pistas sobre cómo los codificadores conceptualizan la métrica de una variable.

La adopción de otras estadísticas por parte de Alpha

El alfa de Krippendorff reúne varias estadísticas conocidas bajo un paraguas común, cada una de ellas tiene sus propias limitaciones pero ninguna virtud adicional.

El alfa de Krippendorff es más general que cualquiera de estos coeficientes de propósito especial. Se ajusta a distintos tamaños de muestra y permite realizar comparaciones entre una amplia variedad de datos de confiabilidad, que en su mayoría son ignorados por las medidas conocidas.

Coeficientes incompatibles con alfa y la fiabilidad de la codificación

En términos semánticos, la fiabilidad es la capacidad de confiar en algo, en este caso en datos codificados para su posterior análisis. Cuando un número suficientemente grande de codificadores concuerda perfectamente en lo que han leído u observado, confiar en sus descripciones es una apuesta segura. Los juicios de este tipo dependen del número de codificadores que duplican el proceso y de la representatividad de las unidades codificadas de la población de interés. Los problemas de interpretación surgen cuando el acuerdo no es perfecto, especialmente cuando no hay fiabilidad.

El hecho de que una estadística se denomine de acuerdo, reproducibilidad o fiabilidad no la convierte en un índice válido para determinar si se puede confiar en los datos codificados para tomar decisiones posteriores. Su estructura matemática debe ajustarse al proceso de codificación de unidades en un sistema de términos analizables.

Notas

  1. ^ Krippendorff, K. (2013) pp. 221–250 describe las matemáticas de alfa y su uso en el análisis de contenido desde 1969.
  2. ^ Hayes, AF y Krippendorff, K. (2007) describen y proporcionan macros de SPSS y SAS para calcular alfa, sus límites de confianza y la probabilidad de no alcanzar un mínimo elegido.
  3. ^ Manual de referencia del paquete irr que contiene la función kripp.alpha() para el paquete de estadísticas independiente de la plataforma R
  4. ^ La página de recursos de Alpha.
  5. ^ Código Matlab para calcular el alfa de Krippendorff.
  6. ^ Código Python para calcular el alfa de Krippendorff.
  7. ^ Código Python para el cálculo rápido alfa de Krippendorff.
  8. ^ Se encuentran disponibles varias adiciones escritas por los usuarios al software comercial Stata.
  9. ^ Implementación de Python de código abierto compatible con marcos de datos
  10. ^ Marzi, Giacomo; Balzano, Marco; Marchiori, Davide (2024). "Calculadora K-Alpha–Calculadora Alfa de Krippendorff: una herramienta fácil de usar para calcular el coeficiente de confiabilidad entre evaluadores Alfa de Krippendorff". MethodsX . 12 : 102545. doi :10.1016/j.mex.2023.102545. hdl : 10278/5046412 . ISSN  2215-0161.
  11. ^ Honor, David. "Comprensión del alfa de Krippendorff" (PDF) .
  12. ^ Cálculo de la confiabilidad alfa de Krippendorff” http://repository.upenn.edu/asc_papers/43/
  13. ^ Krippendorff, K. (2004) págs. 237-238
  14. ^ Hayes, AF y Krippendorff, K. (2007) Respondiendo al llamado para una medida de confiabilidad estándar para la codificación de datos [1]
  15. ^ Krippendorff, K. (2004) págs. 241-243
  16. ^ Scott, Washington (1955)
  17. ^ Fleiss, J. L. (1971)
  18. ^ Cohen, J. (1960)
  19. ^ Siegel, S. y Castellan, NJ (1988), págs. 284–291.
  20. ^ Lancero, CE (1904)
  21. ^ Pearson, K. (1901), Tildesley, ML (1921)
  22. ^ Krippendorff, K. (1970)
  23. ^ Cohen, J. (1960)
  24. ^ Krippendorff, K. (1978) planteó esta cuestión a Joseph Fleiss
  25. ^ Zwick, R. (1988), Brennan, RL y Prediger, DJ (1981), Krippendorff (1978, 2004).
  26. ^ Nunnally, JC y Bernstein, IH (1994)
  27. ^ Cronbach, L. J. (1951)
  28. ^ Bennett, E. M., Alpert, R. y Goldstein, A. C. (1954)
  29. ^ Goodman, LA y Kruskal, WH (1954) pág. 758
  30. ^ Lin, LI (1989)

Referencias

Enlaces externos