stringtranslate.com

Sesgo de muestreo

En estadística , el sesgo de muestreo es un sesgo en el que una muestra se recoge de tal manera que algunos miembros de la población prevista tienen una probabilidad de muestreo menor o mayor que otros. El resultado es una muestra sesgada [1] de una población (o factores no humanos) en la que no todos los individuos o instancias tenían la misma probabilidad de haber sido seleccionados. [2] Si esto no se tiene en cuenta, los resultados pueden atribuirse erróneamente al fenómeno en estudio en lugar del método de muestreo .

Las fuentes médicas a veces se refieren al sesgo de muestreo como sesgo de verificación . [3] [4] El sesgo de verificación tiene básicamente la misma definición, [5] [6] pero a veces todavía se clasifica como un tipo separado de sesgo. [5]

Distinción con el sesgo de selección

El sesgo de muestreo suele clasificarse como un subtipo de sesgo de selección , [7] a veces denominado específicamente sesgo de selección de muestra , [8] [9] [10] pero algunos lo clasifican como un tipo separado de sesgo. [11] Una distinción, aunque no universalmente aceptada, del sesgo de muestreo es que socava la validez externa de una prueba (la capacidad de sus resultados de generalizarse a toda la población), mientras que el sesgo de selección aborda principalmente la validez interna de las diferencias o similitudes encontradas en la muestra en cuestión. En este sentido, los errores que ocurren en el proceso de recolección de la muestra o cohorte causan sesgo de muestreo, mientras que los errores en cualquier proceso posterior causan sesgo de selección.

Sin embargo, el sesgo de selección y el sesgo de muestreo a menudo se utilizan como sinónimos. [12]

Tipos

Muestreo basado en síntomas

El estudio de las enfermedades comienza con informes anecdóticos. Por su naturaleza, estos informes solo incluyen a aquellos que son derivados para diagnóstico y tratamiento. Un niño que no puede funcionar en la escuela tiene más probabilidades de ser diagnosticado con dislexia que un niño que tiene dificultades pero aprueba. Un niño examinado por una enfermedad tiene más probabilidades de ser examinado y diagnosticado con otras enfermedades, lo que sesga las estadísticas de comorbilidad . A medida que ciertos diagnósticos se asocian con problemas de conducta o discapacidad intelectual , los padres tratan de evitar que sus hijos sean estigmatizados con esos diagnósticos, lo que introduce más sesgo. Estudios cuidadosamente seleccionados de poblaciones enteras están mostrando que muchas enfermedades son mucho más comunes y, por lo general, mucho más leves de lo que se creía anteriormente.

Selección truncada en estudios de pedigrí

Ejemplo simple de sesgo de muestreo en pedigrí

Los genetistas tienen limitaciones en cuanto a la forma en que pueden obtener datos de poblaciones humanas. Como ejemplo, consideremos una característica humana. Nos interesa decidir si la característica se hereda como un rasgo mendeliano simple . Siguiendo las leyes de la herencia mendeliana , si los padres de una familia no tienen la característica, pero llevan el alelo correspondiente, son portadores (por ejemplo, un heterocigoto no expresivo ). En este caso, sus hijos tendrán cada uno un 25% de posibilidades de mostrar la característica. El problema surge porque no podemos saber qué familias tienen a ambos padres como portadores (heterocigotos) a menos que tengan un hijo que muestre la característica. La descripción sigue el libro de texto de Sutton. [13]

La figura muestra los pedigríes de todas las posibles familias con dos hijos cuando los padres son portadores (Aa).

En la figura se muestran las probabilidades de que cada una de las familias sea seleccionada, junto con la frecuencia muestral de los niños afectados. En este caso sencillo, el investigador buscará una frecuencia de 47 o 58 para la característica, según el tipo de selección truncada utilizada.

El efecto cavernícola

Un ejemplo de sesgo de selección es el llamado "efecto cavernícola". Gran parte de nuestro conocimiento sobre los pueblos prehistóricos proviene de cuevas, como las pinturas rupestres realizadas hace casi 40.000 años. Si hubiera habido pinturas contemporáneas en árboles, pieles de animales o laderas, habrían desaparecido hace mucho tiempo. De manera similar, es más probable que la evidencia de pozos de fuego, basureros , lugares de enterramiento , etc. permanezca intacta hasta la era moderna en cuevas. Los pueblos prehistóricos se asocian con las cuevas porque es allí donde todavía existen los datos, no necesariamente porque la mayoría de ellos vivieron en cuevas durante la mayor parte de sus vidas. [14]

Problemas debidos al sesgo de muestreo

El sesgo de muestreo es problemático porque es posible que una estadística calculada de la muestra sea sistemáticamente errónea. El sesgo de muestreo puede llevar a una sobreestimación o subestimación sistemática del parámetro correspondiente en la población. El sesgo de muestreo ocurre en la práctica porque es prácticamente imposible asegurar una aleatoriedad perfecta en el muestreo. Si el grado de distorsión es pequeño, entonces la muestra puede ser tratada como una aproximación razonable a una muestra aleatoria. Además, si la muestra no difiere notablemente en la cantidad que se mide, entonces una muestra sesgada puede seguir siendo una estimación razonable.

La palabra sesgo tiene una fuerte connotación negativa. De hecho, los sesgos a veces provienen de la intención deliberada de engañar o de otro fraude científico . En el uso estadístico, el sesgo simplemente representa una propiedad matemática, sin importar si es deliberada o inconsciente o se debe a imperfecciones en los instrumentos utilizados para la observación. Si bien algunas personas pueden usar deliberadamente una muestra sesgada para producir resultados engañosos, más a menudo, una muestra sesgada es solo un reflejo de la dificultad de obtener una muestra verdaderamente representativa o de la ignorancia del sesgo en su proceso de medición o análisis. Un ejemplo de cómo puede existir la ignorancia de un sesgo es el uso generalizado de una razón (también conocida como cambio de pliegue ) como medida de diferencia en biología. Debido a que es más fácil lograr una razón grande con dos números pequeños con una diferencia dada, y relativamente más difícil lograr una razón grande con dos números grandes con una diferencia mayor, pueden pasarse por alto grandes diferencias significativas al comparar mediciones numéricas relativamente grandes. Algunos han llamado a esto un "sesgo de demarcación" porque el uso de una proporción (división) en lugar de una diferencia (resta) elimina los resultados del análisis de la ciencia y los lleva a la pseudociencia (ver Problema de demarcación ).

Algunas muestras utilizan un diseño estadístico sesgado que, no obstante, permite la estimación de parámetros. El Centro Nacional de Estadísticas de Salud de los Estados Unidos , por ejemplo, sobremuestrea deliberadamente a poblaciones minoritarias en muchas de sus encuestas nacionales para obtener suficiente precisión para las estimaciones dentro de estos grupos. [15] Estas encuestas requieren el uso de ponderaciones de muestra (véase más adelante) para producir estimaciones adecuadas para todos los grupos étnicos. Siempre que se cumplan ciertas condiciones (principalmente que las ponderaciones se calculen y utilicen correctamente), estas muestras permiten una estimación precisa de los parámetros de la población.

Ejemplos históricos

Ejemplo de muestra sesgada: en junio de 2008, el 55% de los navegadores web ( Internet Explorer ) en uso no pasaron la prueba Acid2 . Debido a la naturaleza de la prueba, la muestra estaba compuesta principalmente por desarrolladores web. [16]

Un ejemplo clásico de una muestra sesgada y de los resultados engañosos que produjo ocurrió en 1936. En los primeros días de las encuestas de opinión, la revista American Literary Digest recopiló más de dos millones de encuestas postales y predijo que el candidato republicano en las elecciones presidenciales de Estados Unidos , Alf Landon , vencería al presidente en ejercicio, Franklin Roosevelt , por un amplio margen. El resultado fue exactamente el opuesto. La encuesta de Literary Digest representó una muestra recopilada de los lectores de la revista, complementada con registros de propietarios de automóviles registrados y usuarios de teléfonos. Esta muestra incluía una sobrerrepresentación de individuos ricos, quienes, como grupo, tenían más probabilidades de votar por el candidato republicano. En contraste, una encuesta de solo 50 mil ciudadanos seleccionados por la organización de George Gallup predijo con éxito el resultado, lo que llevó a la popularidad de la encuesta de Gallup .

Otro ejemplo clásico ocurrió en las elecciones presidenciales de 1948. La noche de las elecciones, el Chicago Tribune publicó el titular DEWEY DERROTA A TRUMAN , que resultó ser un error. Por la mañana, el sonriente presidente electo , Harry S. Truman , fue fotografiado sosteniendo un periódico con este titular. La razón por la que el Tribune se equivocó es que su editor confió en los resultados de una encuesta telefónica. La investigación de encuestas estaba entonces en su infancia, y pocos académicos se dieron cuenta de que una muestra de usuarios de teléfono no era representativa de la población general. Los teléfonos aún no estaban muy extendidos, y quienes los tenían tendían a ser prósperos y tener direcciones estables. (En muchas ciudades, la guía telefónica del Sistema Bell contenía los mismos nombres que el Social Register ). Además, la encuesta de Gallup en la que el Tribune basó su titular tenía más de dos semanas de antigüedad en el momento de la impresión. [17]

En los datos de calidad del aire , los contaminantes (como el monóxido de carbono , el monóxido de nitrógeno , el dióxido de nitrógeno o el ozono ) muestran con frecuencia correlaciones altas , ya que provienen de los mismos procesos químicos. Estas correlaciones dependen del espacio (es decir, la ubicación) y del tiempo (es decir, el período). Por lo tanto, una distribución de contaminantes no es necesariamente representativa de cada ubicación y cada período. Si un instrumento de medición de bajo costo se calibra con datos de campo de manera multivariada, más precisamente por colocación junto a un instrumento de referencia, las relaciones entre los diferentes compuestos se incorporan al modelo de calibración. Al reubicar el instrumento de medición, se pueden producir resultados erróneos. [18]

Un ejemplo del siglo XXI es la pandemia de COVID-19 , donde se ha demostrado que las variaciones en el sesgo de muestreo en las pruebas de COVID-19 explican amplias variaciones tanto en las tasas de letalidad como en la distribución por edad de los casos en los distintos países. [19] [20]

Correcciones estadísticas para una muestra sesgada

Si se excluyen de una muestra segmentos enteros de la población, no hay ajustes que puedan producir estimaciones que sean representativas de toda la población. Pero si algunos grupos están subrepresentados y se puede cuantificar el grado de subrepresentación, las ponderaciones de la muestra pueden corregir el sesgo. Sin embargo, el éxito de la corrección se limita al modelo de selección elegido. Si faltan ciertas variables, los métodos utilizados para corregir el sesgo podrían ser inexactos. [21]

Por ejemplo, una población hipotética podría incluir 10 millones de hombres y 10 millones de mujeres. Supongamos que una muestra sesgada de 100 pacientes incluyera 20 hombres y 80 mujeres. Un investigador podría corregir este desequilibrio asignando un peso de 2,5 para cada hombre y 0,625 para cada mujer. Esto ajustaría cualquier estimación para lograr el mismo valor esperado que una muestra que incluyera exactamente 50 hombres y 50 mujeres, a menos que los hombres y las mujeres difirieran en su probabilidad de participar en la encuesta. [ cita requerida ]

Véase también

Referencias

  1. ^ "Sesgo de muestreo". Diccionario médico . Archivado desde el original el 10 de marzo de 2016. Consultado el 23 de septiembre de 2009 .
  2. ^ "Muestra sesgada". TheFreeDictionary . Consultado el 23 de septiembre de 2009 . Diccionario médico de Mosby, octava edición
  3. ^ Weising K (2005). Huellas de ADN en plantas: principios, métodos y aplicaciones. Londres: Taylor & Francis Group. p. 180. ISBN 978-0-8493-1488-9.
  4. ^ Ramírez i Soriano A (29 de noviembre de 2008). Pruebas de desequilibrio de selección y ligamiento bajo demografías complejas y sesgo de verificación (PDF) (tesis doctoral). Universitat Pompeu Fabra. p. 34.
  5. ^ ab Panacek EA (mayo de 2009). "Error y sesgo en la investigación clínica" (PDF) . Reunión anual de la SAEM . Nueva Orleans, LA: Society for Academic Emergency Medicine . Archivado desde el original (PDF) el 17 de agosto de 2016. Consultado el 14 de noviembre de 2009 .
  6. ^ "Sesgo de verificación". Diccionario médico Medilexicon . Archivado desde el original el 6 de agosto de 2016. Consultado el 14 de noviembre de 2009 .
  7. ^ "Sesgo de selección". Diccionario de términos sobre el cáncer . Archivado desde el original el 9 de junio de 2009. Consultado el 23 de septiembre de 2009 .
  8. ^ Ards S, Chung C, Myers SL (febrero de 1998). "Los efectos del sesgo de selección de la muestra en las diferencias raciales en la denuncia de abuso infantil". Child Abuse & Neglect . 22 (2): 103–15. doi : 10.1016/S0145-2134(97)00131-2 . PMID  9504213.
  9. ^ Cortes C, Mohri M, Riley M, Rostamizadeh A (2008). "Sample Selection Bias Correction Theory" (PDF) . Teoría del aprendizaje algorítmico . Apuntes de clase en informática . 5254 : 38–53. arXiv : 0805.2775 . CiteSeerX 10.1.1.144.4478 . doi :10.1007/978-3-540-87987-9_8. ISBN  978-3-540-87986-2.S2CID842488  .​
  10. ^ Cortes C, Mohri M (2014). "Adaptación de dominio y corrección del sesgo de muestra: teoría y algoritmo para regresión" (PDF) . Theoretical Computer Science . 519 : 103–126. CiteSeerX 10.1.1.367.6899 . doi :10.1016/j.tcs.2013.09.027. 
  11. ^ Fadem B (2009). Ciencias del comportamiento. Lippincott Williams & Wilkins. pág. 262. ISBN 978-0-7817-8257-9.
  12. ^ Wallace R (2007). Maxcy-Rosenau-Last Salud pública y medicina preventiva (15.ª ed.). McGraw Hill Professional. pág. 21. ISBN 978-0-07-159318-2.
  13. ^ Sutton HE (1988). Introducción a la genética humana (4.ª ed.). Harcourt Brace Jovanovich. ISBN 978-0-15-540099-3.
  14. ^ Berk RA (junio de 1983). "Introducción al sesgo de selección de muestra en datos sociológicos". American Sociological Review . 48 (3): 386–398. doi :10.2307/2095230. JSTOR  2095230.
  15. ^ "Salud de las minorías". Centro Nacional de Estadísticas de Salud. 2007.
  16. ^ "Estadísticas del navegador". Datos de Refsnes. Junio ​​de 2008. Consultado el 5 de julio de 2008 .
  17. ^ Lienhard JH. "Encuesta Gallup". Los motores de nuestro ingenio . Consultado el 29 de septiembre de 2007 .
  18. ^ Tancev G, Pascale C (octubre de 2020). "El problema de reubicación de los sistemas de sensores de bajo costo calibrados en campo en el monitoreo de la calidad del aire: un sesgo de muestreo". Sensores . 20 (21): 6198. Bibcode :2020Senso..20.6198T. doi : 10.3390/s20216198 . PMC 7662848 . PMID  33143233. 
  19. ^ Ward D (20 de abril de 2020). Sesgo de muestreo: explicación de las amplias variaciones en las tasas de letalidad de casos de COVID-19. Preimpresión (informe). Berna, Suiza. doi :10.13140/RG.2.2.24953.62564/1.
  20. ^ Böttcher L, D'Orsogna MR, Chou T (mayo de 2021). "Uso de estadísticas de exceso de muertes y pruebas para determinar la mortalidad por COVID-19". Revista Europea de Epidemiología . 36 (5): 545–558. doi : 10.1007/s10654-021-00748-2 . PMC 8127858 . 
  21. ^ Cuddeback G, Wilson E, Orme JG, Combs-Orme T (2004). "Detección y corrección estadística del sesgo en la selección de muestras". Revista de investigación en servicios sociales . 30 (3): 19–33. doi :10.1300/J079v30n03_02. S2CID  11685550.