stringtranslate.com

Eliminación por lista

Un ejemplo visual de eliminación por lista

En estadística , la eliminación por lista es un método para manejar datos faltantes . En este método, se excluye del análisis un registro completo si falta algún valor individual. [1] : 6 

Ejemplo

Por ejemplo, considere el siguiente cuestionario, respondido por 10 sujetos:

Un investigador espera modelar los ingresos ( variable dependiente ) en función de la edad y el género (variables independientes). Mediante la eliminación por lista, el investigador eliminaría los sujetos 3, 4 y 8 de la muestra antes de realizar cualquier análisis adicional.

Problemas con la eliminación por listas

La eliminación de listas afecta la potencia estadística de las pruebas realizadas. [2] [3] La potencia estadística depende en parte del gran tamaño de la muestra. Debido a que la eliminación de listas excluye los datos con valores faltantes, reduce la muestra que se está analizando estadísticamente.

La eliminación por lista también es problemática cuando la razón de los datos faltantes puede no ser aleatoria (es decir, preguntas en cuestionarios que apuntan a extraer información confidencial). [3] Debido al método, muchos de los datos de los sujetos se excluirán del análisis, dejando un sesgo en los hallazgos de los datos. Por ejemplo, un cuestionario puede incluir preguntas sobre el historial de consumo de drogas de los encuestados, los ingresos actuales o las inclinaciones sexuales. Muchos de los sujetos de la muestra pueden no responder debido a la naturaleza intrusiva de las preguntas, pero pueden responder todos los demás elementos. La eliminación por lista excluirá a estos encuestados del análisis. Esto puede crear un sesgo ya que los participantes que divulgan esta información pueden tener características diferentes a los participantes que no lo hacen. La imputación múltiple es una técnica alternativa para tratar los datos faltantes que intenta eliminar este sesgo.

En comparación con otros métodos

Si bien la eliminación por lista tiene sus problemas, es preferible a muchos otros métodos para manejar datos faltantes. [1] : 7  En algunos casos, incluso puede ser el método menos problemático. [1] : 6  La siguiente tabla proporciona algunas comparaciones de eliminaciones por lista con otros métodos:

Referencias

  1. ^ abcd Allison, PD (2001). Datos faltantes . Serie de artículos de la Universidad Sage sobre aplicaciones cuantitativas en las ciencias sociales. Vol. 07–136. Thousand Oaks, CA: Sage.
  2. ^ Roth, PL (1994). "Datos faltantes: una revisión conceptual para psicólogos aplicados". Psicología del personal . 47 (3): 537–559. doi :10.1111/j.1744-6570.1994.tb01736.x.
  3. ^ ab Olinsky, A.; Chen, S.; Harlow, L. (2003). "La eficacia comparativa de los métodos de imputación para datos faltantes en el modelado de ecuaciones estructurales". Revista Europea de Investigación Operativa . 151 (1): 53–79. doi :10.1016/S0377-2217(02)00578-7.
  4. ^ Jones, MP (1996). "Métodos de estratificación e indicadores para variables explicativas faltantes en regresión lineal múltiple". J. Amer. Statist. Assoc. 91 (433): 222–230. doi :10.1080/01621459.1996.10476680. Como lo cita Allison (2001), pág. 10.