Sesgo de muestreo

En estadística , el sesgo de muestreo es un sesgo en el que una muestra se recopila de tal manera que algunos miembros de la población prevista tienen una probabilidad de muestreo mayor o menor que otros. Da como resultado una muestra sesgada ^[1] de una población (o factores no humanos) en la que no todos los individuos, o instancias, tenían la misma probabilidad de haber sido seleccionados. ^[2] Si esto no se tiene en cuenta, los resultados pueden atribuirse erróneamente al fenómeno en estudio y no al método de muestreo .

Las fuentes médicas a veces se refieren al sesgo de muestreo como sesgo de verificación . ^[3]^[4] El sesgo de verificación tiene básicamente la misma definición, ^[5]^[6] pero a veces todavía se clasifica como un tipo separado de sesgo. ^[5]

Distinción del sesgo de selección

El sesgo de muestreo generalmente se clasifica como un subtipo de sesgo de selección , ^[7] a veces denominado específicamente sesgo de selección de muestra , ^[8]^[9]^[10] pero algunos lo clasifican como un tipo de sesgo separado. ^[11] Una distinción, aunque no universalmente aceptada, del sesgo de muestreo es que socava la validez externa de una prueba (la capacidad de sus resultados de generalizarse a toda la población), mientras que el sesgo de selección aborda principalmente la validez interna de las diferencias o similitudes. encontrado en la muestra que nos ocupa. En este sentido, los errores que ocurren en el proceso de recolección de la muestra o cohorte causan un sesgo de muestreo, mientras que los errores en cualquier proceso posterior causan un sesgo de selección.

Sin embargo, el sesgo de selección y el sesgo de muestreo suelen utilizarse como sinónimos. ^[12]

Tipos

Selección de un área real concreta . Por ejemplo, una encuesta de estudiantes de secundaria para medir el uso de drogas ilegales por parte de los adolescentes será una muestra sesgada porque no incluye a los estudiantes educados en casa ni a los que abandonaron la escuela. Una muestra también está sesgada si ciertos miembros están subrepresentados o sobrerrepresentados en relación con otros de la población. Por ejemplo, una entrevista de "hombre de la calle" que selecciona personas que caminan por un lugar determinado tendrá una representación excesiva de personas sanas que tienen más probabilidades de estar fuera de casa que personas con una enfermedad crónica. Esta puede ser una forma extrema de muestreo sesgado, porque ciertos miembros de la población están totalmente excluidos de la muestra (es decir, tienen probabilidad cero de ser seleccionados).
Sesgo de autoselección (ver también Sesgo de falta de respuesta ), que es posible siempre que el grupo de personas que se estudia tiene algún tipo de control sobre si participar o no (como lo exigen los estándares actuales de ética de la investigación con sujetos humanos para muchos casos en tiempo real y algunos). formas longitudinales de estudio). La decisión de los participantes de participar puede estar correlacionada con rasgos que afectan el estudio, lo que convierte a los participantes en una muestra no representativa. Por ejemplo, las personas que tienen opiniones sólidas o conocimientos sustanciales pueden estar más dispuestas a dedicar tiempo a responder una encuesta que quienes no las tienen. Otro ejemplo son las encuestas en línea y por teléfono , que son muestras sesgadas porque los encuestados son autoseleccionados. Aquellos individuos que están altamente motivados para responder, típicamente aquellos que tienen opiniones firmes, están sobrerrepresentados, y los individuos que son indiferentes o apáticos tienen menos probabilidades de responder. Esto a menudo conduce a una polarización de las respuestas, dando a las perspectivas extremas un peso desproporcionado en el resumen. Como resultado, este tipo de encuestas se consideran poco científicas.

El sesgo de exclusión resulta de la exclusión de grupos particulares de la muestra, por ejemplo, la exclusión de sujetos que han migrado recientemente al área de estudio (esto puede ocurrir cuando los recién llegados no están disponibles en un registro utilizado para identificar la población de origen). Excluir a los sujetos que se mudan fuera del área de estudio durante el seguimiento equivale más bien a abandonar o no responder, un sesgo de selección en el sentido de que afecta más bien la validez interna del estudio.
Sesgo de usuario saludable , cuando la población de estudio probablemente sea más saludable que la población general. Por ejemplo, es poco probable que alguien con mala salud tenga un trabajo como trabajador manual, por lo que si se realiza un estudio sobre trabajadores manuales, es probable que se sobrestime la salud de la población general.
Falacia de Berkson , cuando la población de estudio se selecciona de un hospital y por tanto es menos saludable que la población general. Esto puede dar como resultado una correlación negativa espuria entre enfermedades: un paciente hospitalizado sin diabetes tiene más probabilidades de tener otra enfermedad determinada, como colecistitis , ya que, en primer lugar, debe haber tenido algún motivo para ingresar al hospital.
Coincidencia excesiva , coincidencia para un aparente factor de confusión que en realidad es resultado de la exposición^{[ se necesita aclaración ]} . El grupo de control se vuelve más similar a los casos con respecto a la exposición que la población general.
Sesgo de supervivencia , en el que sólo se seleccionan sujetos "sobrevivientes", ignorando aquellos que quedaron fuera de la vista. Por ejemplo, utilizar el historial de las empresas actuales como indicador del clima empresarial o la economía ignora las empresas que fracasaron y ya no existen.
Sesgo de Malmquist , un efecto en astronomía observacional que conduce a la detección preferencial de objetos intrínsecamente brillantes.

Falacia de Spotlight , la suposición acrítica de que todos los integrantes o casos de una determinada clase o tipo son como los que reciben mayor atención o cobertura en los medios.

Muestreo basado en síntomas

El estudio de las condiciones médicas comienza con informes anecdóticos. Por su naturaleza, dichos informes sólo incluyen aquellos remitidos para diagnóstico y tratamiento. Un niño que no puede funcionar en la escuela tiene más probabilidades de ser diagnosticado con dislexia que un niño que tiene dificultades pero pasa. Un niño examinado por una afección tiene más probabilidades de que se le realicen pruebas y se le diagnostiquen otras afecciones, lo que distorsiona las estadísticas de comorbilidad . A medida que ciertos diagnósticos se asocian con problemas de conducta o discapacidad intelectual , los padres intentan evitar que sus hijos sean estigmatizados con esos diagnósticos, lo que introduce más sesgos. Estudios cuidadosamente seleccionados de poblaciones enteras muestran que muchas afecciones son mucho más comunes y, por lo general, mucho más leves de lo que se creía anteriormente.

Selección truncada en estudios de pedigrí.

Los genetistas tienen limitaciones en cuanto a cómo pueden obtener datos de poblaciones humanas. Como ejemplo, consideremos una característica humana. Nos interesa decidir si la característica se hereda como un rasgo mendeliano simple . Siguiendo las leyes de la herencia mendeliana , si los padres de una familia no tienen la característica, pero portan el alelo correspondiente, son portadores (por ejemplo, un heterocigoto no expresivo ). En este caso, cada uno de sus hijos tendrá un 25% de posibilidades de mostrar la característica. El problema surge porque no podemos saber qué familias tienen a ambos padres como portadores (heterocigotos) a menos que tengan un hijo que presente la característica. La descripción sigue el libro de texto de Sutton. ^[13]

La figura muestra los pedigríes de todas las posibles familias con dos hijos cuando los padres son portadores (Aa).

Selección no truncada . En un mundo perfecto deberíamos poder descubrir todas esas familias con un gen, incluidas aquellas que son simplemente portadores. En esta situación, el análisis estaría libre de sesgo de verificación y los pedigríes estarían bajo "selección no truncada". En la práctica, la mayoría de los estudios identifican e incluyen familias en un estudio basado en que tienen individuos afectados.
Truncar selección . Cuando los individuos afectados tienen las mismas posibilidades de ser incluidos en un estudio, esto se denomina selección truncada, lo que significa la exclusión (truncamiento) involuntaria de familias portadoras de un gen. Debido a que la selección se realiza a nivel individual, las familias con dos o más niños afectados tendrían una mayor probabilidad de ser incluidas en el estudio.
La selección truncada completa es un caso especial en el que cada familia con un niño afectado tiene las mismas posibilidades de ser seleccionada para el estudio.

Las probabilidades de que cada una de las familias sean seleccionadas se dan en la figura, y también se proporciona la frecuencia de muestra de los niños afectados. En este caso sencillo, el investigador buscará una frecuencia de 4 ⁄ 7 o 5 ⁄ 8 para la característica, dependiendo del tipo de selección truncada utilizada.

El efecto cavernícola

Un ejemplo de sesgo de selección se denomina "efecto cavernícola". Gran parte de nuestro conocimiento sobre los pueblos prehistóricos proviene de las cuevas, como las pinturas rupestres realizadas hace casi 40.000 años. Si hubiera habido pinturas contemporáneas sobre árboles, pieles de animales o laderas de colinas, habrían desaparecido hace mucho tiempo. De manera similar, es más probable que la evidencia de fogatas, basureros , lugares de entierro , etc. permanezca intacta hasta la era moderna en las cuevas. Los pueblos prehistóricos están asociados con las cuevas porque es allí donde todavía existen datos, no necesariamente porque la mayoría de ellos vivieron en cuevas durante la mayor parte de sus vidas. ^[14]

Problemas debidos al sesgo de muestreo

El sesgo de muestreo es problemático porque es posible que una estadística calculada de la muestra sea sistemáticamente errónea. El sesgo de muestreo puede conducir a una sobreestimación o subestimación sistemática del parámetro correspondiente en la población. En la práctica se produce un sesgo de muestreo, ya que es prácticamente imposible garantizar una aleatoriedad perfecta en el muestreo. Si el grado de tergiversación es pequeño, entonces la muestra puede tratarse como una aproximación razonable a una muestra aleatoria. Además, si la muestra no difiere marcadamente en la cantidad que se mide, entonces una muestra sesgada aún puede ser una estimación razonable.

La palabra prejuicio tiene una fuerte connotación negativa. De hecho, los sesgos a veces provienen de una intención deliberada de engañar o de otro tipo de fraude científico . En el uso estadístico, el sesgo representa simplemente una propiedad matemática, sin importar si es deliberado o inconsciente o se debe a imperfecciones en los instrumentos utilizados para la observación. Si bien algunas personas pueden utilizar deliberadamente una muestra sesgada para producir resultados engañosos, lo más frecuente es que una muestra sesgada sea sólo un reflejo de la dificultad para obtener una muestra verdaderamente representativa o de la ignorancia del sesgo en su proceso de medición o análisis. Un ejemplo de cómo puede existir la ignorancia de un sesgo es el uso generalizado de una proporción (también conocida como cambio de veces ) como medida de diferencia en biología. Debido a que es más fácil lograr una razón grande con dos números pequeños con una diferencia dada, y relativamente más difícil lograr una razón grande con dos números grandes con una diferencia mayor, es posible que se pasen por alto grandes diferencias significativas al comparar medidas numéricas relativamente grandes. Algunos han llamado a esto un 'sesgo de demarcación' porque el uso de una razón (división) en lugar de una diferencia (resta) elimina los resultados del análisis de ciencia a pseudociencia (ver Problema de demarcación ).

Algunas muestras utilizan un diseño estadístico sesgado que, sin embargo, permite la estimación de parámetros. El Centro Nacional de Estadísticas de Salud de Estados Unidos , por ejemplo, sobremuestra deliberadamente a partir de poblaciones minoritarias en muchas de sus encuestas nacionales para obtener suficiente precisión en las estimaciones dentro de estos grupos. ^[15] Estas encuestas requieren el uso de ponderaciones muestrales (ver más adelante) para producir estimaciones adecuadas en todos los grupos étnicos. Siempre que se cumplan ciertas condiciones (principalmente que las ponderaciones se calculen y utilicen correctamente), estas muestras permiten una estimación precisa de los parámetros de la población.

Ejemplos historicos

Ejemplo de muestra sesgada: en junio de 2008, el 55% de los navegadores web ( Internet Explorer ) utilizados no pasaron la prueba Acid2 . Debido a la naturaleza de la prueba, la muestra estuvo compuesta principalmente por desarrolladores web. ^[dieciséis]

Un ejemplo clásico de muestra sesgada y de los resultados engañosos que produjo ocurrió en 1936. En los primeros días de las encuestas de opinión, la revista American Literary Digest recopiló más de dos millones de encuestas postales y predijo que el candidato republicano en las elecciones presidenciales de Estados Unidos , Alf Landon , derrotaría al presidente en ejercicio, Franklin Roosevelt , por un amplio margen. El resultado fue exactamente lo contrario. La encuesta de Literary Digest representó una muestra recopilada de lectores de la revista, complementada con registros de propietarios de automóviles registrados y usuarios de teléfonos. Esta muestra incluía una representación excesiva de personas ricas que, como grupo, tenían más probabilidades de votar por el candidato republicano. Por el contrario, una encuesta de sólo 50.000 ciudadanos seleccionados por la organización de George Gallup predijo con éxito el resultado, lo que llevó a la popularidad de la encuesta de Gallup .

Otro ejemplo clásico ocurrió en las elecciones presidenciales de 1948 . La noche de las elecciones, el Chicago Tribune publicó el titular DEWEY DERROTA A TRUMAN , que resultó ser erróneo. Por la mañana, el sonriente presidente electo , Harry S. Truman , fue fotografiado sosteniendo un periódico con este titular. La razón por la que el Tribune se equivocó es que su editor confió en los resultados de una encuesta telefónica. La investigación por encuestas estaba entonces en su infancia y pocos académicos se dieron cuenta de que una muestra de usuarios de teléfono no era representativa de la población general. Los teléfonos aún no estaban muy extendidos y quienes los tenían solían ser prósperos y tener direcciones estables. (En muchas ciudades, el directorio telefónico de Bell System contenía los mismos nombres que el Registro Social ). Además, la encuesta de Gallup en la que el Tribune basó su titular tenía más de dos semanas en el momento de su publicación. ^[17]

En los datos de calidad del aire , los contaminantes (como el monóxido de carbono , el monóxido de nitrógeno , el dióxido de nitrógeno o el ozono ) frecuentemente muestran altas correlaciones , ya que provienen del mismo proceso químico. Estas correlaciones dependen del espacio (es decir, la ubicación) y del tiempo (es decir, el período). Por lo tanto, una distribución de contaminantes no es necesariamente representativa de cada lugar y cada período. Si un instrumento de medición de bajo costo se calibra con datos de campo de manera multivariada, más precisamente colocándolo junto a un instrumento de referencia, las relaciones entre los diferentes compuestos se incorporan al modelo de calibración. Al reubicar el instrumento de medición se pueden producir resultados erróneos. ^[18]

Un ejemplo del siglo XXI es la pandemia de COVID-19 , donde se ha demostrado que las variaciones en el sesgo de muestreo en las pruebas de COVID-19 explican amplias variaciones tanto en las tasas de letalidad como en la distribución por edad de los casos entre países. ^[19]^[20]

Correcciones estadísticas para una muestra sesgada

Si se excluyen segmentos enteros de la población de una muestra, entonces no hay ajustes que puedan producir estimaciones que sean representativas de toda la población. Pero si algunos grupos están subrepresentados y el grado de subrepresentación puede cuantificarse, entonces las ponderaciones muestrales pueden corregir el sesgo. Sin embargo, el éxito de la corrección se limita al modelo de selección elegido. Si faltan ciertas variables, los métodos utilizados para corregir el sesgo podrían ser inexactos. ^[21]

Por ejemplo, una población hipotética podría incluir 10 millones de hombres y 10 millones de mujeres. Supongamos que una muestra sesgada de 100 pacientes incluyera 20 hombres y 80 mujeres. Un investigador podría corregir este desequilibrio asignando un peso de 2,5 a cada hombre y 0,625 a cada mujer. Esto ajustaría cualquier estimación para lograr el mismo valor esperado que una muestra que incluye exactamente 50 hombres y 50 mujeres, a menos que hombres y mujeres difieran en su probabilidad de participar en la encuesta. ^{[ cita necesaria ]}

Ver también

Referencias

^ "Sesgo de muestreo". Diccionario médico . Archivado desde el original el 10 de marzo de 2016 . Consultado el 23 de septiembre de 2009 .
^ "Muestra sesgada". El diccionario gratuito . Consultado el 23 de septiembre de 2009 . Diccionario médico de Mosby, octava edición
^ Weising K (2005). Huellas dactilares de ADN en plantas: principios, métodos y aplicaciones. Londres: Grupo Taylor & Francis. pag. 180.ISBN 978-0-8493-1488-9.
^ Ramírez i Soriano A (29 de noviembre de 2008). Pruebas de desequilibrio de selección y vinculación bajo demografías complejas y sesgos de verificación (PDF) (tesis doctoral). Universidad Pompeu Fabra. pag. 34.
^ ab Panacek EA (mayo de 2009). "Error y sesgo en la investigación clínica" (PDF) . Reunión Anual de SAEM . Nueva Orleans, LA: Sociedad de Medicina Académica de Emergencia . Archivado desde el original (PDF) el 17 de agosto de 2016 . Consultado el 14 de noviembre de 2009 .
^ "Sesgo de verificación". Diccionario médico Medilexicon . Archivado desde el original el 6 de agosto de 2016 . Consultado el 14 de noviembre de 2009 .
^ "Sesgo de selección". Diccionario de términos sobre cáncer . Archivado desde el original el 9 de junio de 2009 . Consultado el 23 de septiembre de 2009 .
^ Ards S, Chung C, Myers SL (febrero de 1998). "Los efectos del sesgo de selección de muestras sobre las diferencias raciales en la denuncia de abuso infantil". Abuso y negligencia infantil . 22 (2): 103–15. doi : 10.1016/S0145-2134(97)00131-2 . PID 9504213.
^ Cortés C, Mohri M, Riley M, Rostamizadeh A (2008). "Teoría de la corrección del sesgo de selección de muestras" (PDF) . Teoría del aprendizaje algorítmico . Apuntes de conferencias sobre informática. 5254 : 38–53. arXiv : 0805.2775 . CiteSeerX 10.1.1.144.4478 . doi :10.1007/978-3-540-87987-9_8. ISBN 978-3-540-87986-2. S2CID 842488.
^ Cortés C, Mohri M (2014). "Teoría y algoritmo de regresión de adaptación de dominio y corrección de sesgo de muestra" (PDF) . Informática Teórica . 519 : 103–126. CiteSeerX 10.1.1.367.6899 . doi :10.1016/j.tcs.2013.09.027.
^ Fadem B (2009). Ciencia del comportamiento. Lippincott Williams y Wilkins. pag. 262.ISBN 978-0-7817-8257-9.
^ Wallace R (2007). Maxcy-Rosenau-Last Salud pública y medicina preventiva (15ª ed.). Profesional de McGraw Hill. pag. 21.ISBN 978-0-07-159318-2.
^ Sutton ÉL (1988). Una introducción a la genética humana (4ª ed.). Harcourt Brace Jovanovich. ISBN 978-0-15-540099-3.
^ Berk RA (junio de 1983). "Una introducción al sesgo de selección de muestras en datos sociológicos". Revista sociológica estadounidense . 48 (3): 386–398. doi :10.2307/2095230. JSTOR 2095230.
^ "Salud de las minorías". Centro Nacional de Estadísticas de Salud. 2007.
^ "Estadísticas del navegador". Datos de Refsnes. Junio de 2008 . Consultado el 5 de julio de 2008 .
^ Lienhard JH. "Encuesta Gallup". Los motores de nuestro ingenio . Consultado el 29 de septiembre de 2007 .
^ Tancev G, Pascale C (octubre de 2020). "El problema de la reubicación de sistemas de sensores de bajo costo calibrados en campo en el monitoreo de la calidad del aire: un sesgo de muestreo". Sensores . 20 (21): 6198. Código Bib : 2020Senso..20.6198T. doi : 10.3390/s20216198 . PMC 7662848 . PMID 33143233.
^ Distrito D (20 de abril de 2020). Sesgo de muestreo: explicación de las amplias variaciones en las tasas de letalidad por COVID-19. Preimpresión (Informe). Berna, Suiza. doi :10.13140/RG.2.2.24953.62564/1.
^ Böttcher L, D'Orsogna MR, Chou T (mayo de 2021). "Uso del exceso de muertes y estadísticas de pruebas para determinar la mortalidad por COVID-19". Revista europea de epidemiología . 36 (5): 545–558. doi : 10.1007/s10654-021-00748-2 . PMC 8127858 .
^ Cuddeback G, Wilson E, Orme JG, Combs-Orme T (2004). "Detección y corrección estadística del sesgo de selección de muestras". Revista de investigación de servicios sociales . 30 (3): 19–33. doi :10.1300/J079v30n03_02. S2CID 11685550.