stringtranslate.com

Sesgo de selección

El sesgo de selección es el sesgo introducido por la selección de individuos, grupos o datos para el análisis de tal manera que no se logra una aleatorización adecuada, por lo que no se garantiza que la muestra obtenida sea representativa de la población que se pretende analizar. [1] A veces se lo denomina efecto de selección . La frase "sesgo de selección" se refiere con mayor frecuencia a la distorsión de un análisis estadístico , resultante del método de recolección de muestras. Si no se tiene en cuenta el sesgo de selección, algunas conclusiones del estudio pueden ser falsas.

Tipos de sesgo

Sesgo de muestreo

El sesgo de muestreo es un error sistemático debido a una muestra no aleatoria de una población, [2] que hace que algunos miembros de la población tengan menos probabilidades de ser incluidos que otros, lo que resulta en una muestra sesgada , definida como una muestra estadística de una población (o factores no humanos) en la que todos los participantes no están igualmente equilibrados ni representados objetivamente. [3] Se clasifica principalmente como un subtipo de sesgo de selección, [4] a veces denominado específicamente sesgo de selección de muestra , [5] [6] [7] pero algunos lo clasifican como un tipo separado de sesgo. [8]

Una distinción entre el sesgo de muestreo (aunque no sea una distinción universalmente aceptada) es que socava la validez externa de una prueba (la capacidad de generalizar sus resultados al resto de la población), mientras que el sesgo de selección se ocupa principalmente de la validez interna de las diferencias o similitudes encontradas en la muestra en cuestión. En este sentido, los errores que ocurren en el proceso de recolección de la muestra o cohorte causan sesgo de muestreo, mientras que los errores en cualquier proceso posterior causan sesgo de selección.

Algunos ejemplos de sesgo de muestreo incluyen la autoselección , la preselección de los participantes del ensayo, el descuento de sujetos/pruebas del ensayo que no se completaron y el sesgo de migración al excluir a sujetos que se han mudado recientemente dentro o fuera del área de estudio, el sesgo de duración , donde se detecta una enfermedad de desarrollo lento con mejor pronóstico, y el sesgo de tiempo de anticipación , donde la enfermedad se diagnostica antes en los participantes que en las poblaciones de comparación, aunque el curso promedio de la enfermedad es el mismo.

Intervalo de tiempo

Exposición

Datos

Estudios

Desgaste

El sesgo de deserción es un tipo de sesgo de selección causado por la pérdida de participantes, [13] descartando sujetos/pruebas del ensayo que no se completaron. Está estrechamente relacionado con el sesgo de supervivencia , donde solo los sujetos que "sobrevivieron" a un proceso se incluyen en el análisis o el sesgo de fracaso , donde solo se incluyen los sujetos que "fallaron" en un proceso. Incluye abandono , falta de respuesta ( tasa de respuesta más baja ), retiro y desviaciones del protocolo . Da resultados sesgados cuando es desigual con respecto a la exposición y/o el resultado. Por ejemplo, en una prueba de un programa de dieta, el investigador puede simplemente rechazar a todos los que abandonan el ensayo, pero la mayoría de los que abandonan son aquellos para los que no estaba funcionando. La pérdida diferente de sujetos en el grupo de intervención y de comparación puede cambiar las características de estos grupos y los resultados independientemente de la intervención estudiada . [13]

La pérdida de seguimiento es otra forma de sesgo de deserción, que se produce principalmente en estudios médicos durante un período de tiempo prolongado. El sesgo de no respuesta o de retención puede verse influido por una serie de factores tangibles e intangibles, como la riqueza, la educación, el altruismo, la comprensión inicial del estudio y sus requisitos. [14] Los investigadores también pueden ser incapaces de realizar contactos de seguimiento como resultado de la información de identificación y los datos de contacto inadecuados recopilados durante la fase inicial de reclutamiento e investigación. [15]

Selección de observadores

El filósofo Nick Bostrom ha sostenido que los datos se filtran no sólo en función del diseño y la medición del estudio, sino también por la condición previa necesaria de que debe haber alguien que lleve a cabo el estudio. En situaciones en las que la existencia del observador o del estudio está correlacionada con los datos, se producen efectos de selección de la observación y se requiere un razonamiento antrópico . [16]

Un ejemplo es el registro de impactos ocurridos en el pasado en la Tierra: si los grandes impactos causan extinciones masivas y perturbaciones ecológicas que impiden la evolución de observadores inteligentes durante largos períodos, nadie observará evidencia alguna de grandes impactos en el pasado reciente (ya que habrían impedido la evolución de observadores inteligentes). Por lo tanto, existe un sesgo potencial en el registro de impactos de la Tierra. [17] Los riesgos existenciales astronómicos también podrían subestimarse debido al sesgo de selección, y debe introducirse una corrección antrópica. [18]

Sesgo voluntario

El sesgo de autoselección o el sesgo de voluntariado en los estudios plantean otras amenazas a la validez de un estudio, ya que estos participantes pueden tener características intrínsecamente diferentes de la población objetivo del estudio. [19] Los estudios han demostrado que los voluntarios tienden a provenir de un nivel social más alto que de un entorno socioeconómico más bajo. [20] Además, otro estudio muestra que las mujeres tienen más probabilidades de ofrecerse como voluntarias para los estudios que los hombres. El sesgo de voluntariado es evidente durante todo el ciclo de vida del estudio, desde el reclutamiento hasta los seguimientos. En términos más generales, la respuesta de los voluntarios puede atribuirse al altruismo individual, un deseo de aprobación, una relación personal con el tema del estudio y otras razones. [20] [14] Como en la mayoría de los casos, la mitigación en el caso del sesgo de voluntariado es un mayor tamaño de la muestra. [ cita requerida ]

Mitigación

En general, los sesgos de selección no se pueden superar con el análisis estadístico de los datos existentes únicamente, aunque se puede utilizar la corrección de Heckman en casos especiales. Se puede evaluar el grado de sesgo de selección examinando las correlaciones entre las variables exógenas (de fondo) y un indicador de tratamiento. Sin embargo, en los modelos de regresión , es la correlación entre los determinantes no observados del resultado y los determinantes no observados de la selección en la muestra lo que genera el sesgo en las estimaciones, y esta correlación entre los no observables no se puede evaluar directamente mediante los determinantes observados del tratamiento. [21]

Cuando se seleccionan datos para fines de ajuste o pronóstico, se puede configurar un juego de coalición para que se pueda definir una función de precisión de ajuste o pronóstico en todos los subconjuntos de las variables de datos.

Cuestiones relacionadas

El sesgo de selección está estrechamente relacionado con:

Véase también

Referencias

  1. ^ Diccionario de términos sobre el cáncer → sesgo de selección. Consultado el 23 de septiembre de 2009.
  2. ^ Diccionario médico - 'Sesgo de muestreo' Recuperado el 23 de septiembre de 2009
  3. ^ TheFreeDictionary → muestra sesgada. Recuperado el 23 de septiembre de 2009. El sitio a su vez cita: Diccionario médico de Mosby, octava edición.
  4. ^ Diccionario de términos sobre cáncer → Sesgo de selección. Consultado el 23 de septiembre de 2009.
  5. ^ Ards, Sheila; Chung, Chanjin; Myers, Samuel L. (1998). "Los efectos del sesgo de selección de la muestra en las diferencias raciales en la denuncia de abuso infantil". Abuso infantil y negligencia . 22 (2): 103–115. doi : 10.1016/S0145-2134(97)00131-2 . PMID  9504213.
  6. ^ Cortes, Corinna; Mohri, Mehryar; Riley, Michael; Rostamizadeh, Afshin (2008). "Sample Selection Bias Correction Theory". Algorithmic Learning Theory (PDF) . Apuntes de clase en informática. Vol. 5254. págs. 38–53. arXiv : 0805.2775 . CiteSeerX 10.1.1.144.4478 . doi :10.1007/978-3-540-87987-9_8. ISBN  978-3-540-87986-2.S2CID842488  .​
  7. ^ Cortes, Corinna; Mohri, Mehryar (2014). "Adaptación de dominio y corrección del sesgo de muestra: teoría y algoritmo para regresión" (PDF) . Theoretical Computer Science . 519 : 103–126. CiteSeerX 10.1.1.367.6899 . doi :10.1016/j.tcs.2013.09.027. 
  8. ^ Fadem, Barbara (2009). Ciencias del comportamiento. Lippincott Williams & Wilkins. pág. 262. ISBN 978-0-7817-8257-9.
  9. ^ ab Feinstein AR; Horwitz RI (noviembre de 1978). "Una crítica de la evidencia estadística que asocia los estrógenos con el cáncer de endometrio". Cancer Res . 38 (11 Pt 2): 4001–5. PMID  698947.
  10. ^ Tamim H; Monfared AA; LeLorier J (marzo de 2007). "Aplicación del tiempo de retardo en las definiciones de exposición para controlar el sesgo protopático". Pharmacoepidemiol Drug Saf . 16 (3): 250–8. doi :10.1002/pds.1360. PMID  17245804. S2CID  25648490.
  11. ^ Matthew R. Weir (2005). Hipertensión (enfermedades clave) (Serie de enfermedades clave de la Acp) . Filadelfia, Pensilvania: Colegio Estadounidense de Médicos. pág. 159. ISBN 978-1-930513-58-7.
  12. ^ Kruskal, William H. (1960). "Algunas observaciones sobre observaciones salvajes". Technometrics . 2 (1): 1–3. doi :10.1080/00401706.1960.10489875.
  13. ^ ab Jüni, P.; Egger, Matthias (2005). "Evidencia empírica del sesgo de deserción en ensayos clínicos". Revista Internacional de Epidemiología . 34 (1): 87–88. doi : 10.1093/ije/dyh406 . PMID  15649954.
  14. ^ ab Jordan, Sue; Watkins, Alan; Storey, Mel; Allen, Steven J.; Brooks, Caroline J.; Garaiova, Iveta; Heaven, Martin L.; Jones, Ruth; Plummer, Sue F.; Russell, Ian T.; Thornton, Catherine A. (9 de julio de 2013). "Sesgo de los voluntarios en el reclutamiento, la retención y la donación de muestras de sangre en un ensayo controlado aleatorio que involucra a madres y sus hijos a los seis meses y a los dos años: un análisis longitudinal". PLOS ONE . ​​8 (7): e67912. Bibcode :2013PLoSO...867912J. doi : 10.1371/journal.pone.0067912 . ISSN  1932-6203. PMC 3706448 . PMID  23874465. 
  15. ^ Small, WP (6 de mayo de 1967). "Perdidos en el seguimiento". The Lancet . Publicado originalmente como Volumen 1, Número 7497. 289 (7497): 997–999. doi :10.1016/S0140-6736(67)92377-X. ISSN  0140-6736. PMID  4164620. S2CID  27683727.
  16. ^ Bostrom, Nick (2002). Sesgo antrópico: efectos de la selección de observaciones en la ciencia y la filosofía . Nueva York: Routledge. ISBN 978-0-415-93858-7.
  17. ^ Ćirković, MM; Sandberg, A.; Bostrom, N. (2010). "Sombra antrópica: efectos de selección de la observación y riesgos de extinción humana". Análisis de riesgos . 30 (10): 1495–506. Código Bibliográfico :2010RiskA..30.1495C. doi :10.1111/j.1539-6924.2010.01460.x. PMID  20626690. S2CID  6485564.
  18. ^ Tegmark, M.; Bostrom, N. (2005). "Astrofísica: ¿es probable una catástrofe del fin del mundo?". Nature . 438 (7069): 754. Bibcode :2005Natur.438..754T. doi : 10.1038/438754a . PMID  16341005. S2CID  4390013.
  19. ^ Tripepi, Giovanni; Jager, Kitty J.; Dekker, Friedo W.; Zoccali, Carmine (2010). "Sesgo de selección y sesgo de información en la investigación clínica". Nephron Clinical Practice . 115 (2): c94–c99. doi : 10.1159/000312871 . ISSN  1660-2110. PMID  20407272.
  20. ^ ab "Sesgo voluntario". Catálogo de sesgos . 2017-11-17 . Consultado el 2020-10-29 .
  21. ^ Heckman, JJ (1979). "Sesgo de selección de muestra como error de especificación". Econometrica . 47 (1): 153–161. doi :10.2307/1912352. JSTOR  1912352.