En estadística , un marco de muestreo es el material fuente o dispositivo del cual se extrae una muestra . [1] Es una lista de todos aquellos dentro de una población que pueden ser muestreados, y puede incluir individuos, hogares o instituciones. [1]
Jessen [2] y Salant y Dillman [3] destacan la importancia del marco de muestreo .
En muchas situaciones prácticas, el marco es una cuestión de elección para el planificador de la investigación y, a veces, una cuestión crítica. [...] Algunas investigaciones muy valiosas no se llevan a cabo en absoluto debido a la falta de un marco aparente; otras, debido a marcos defectuosos, han terminado en un desastre o en una nube de dudas .
—Raymond James Jessen
Un concepto un poco más general de marco de muestreo incluye los marcos de muestreo de áreas , cuyos elementos tienen una naturaleza geográfica. Los marcos de muestreo de áreas pueden ser útiles, por ejemplo, en las estadísticas agrícolas cuando no se dispone de un censo agrícola adecuado y actualizado. En las encuestas ambientales , los marcos de muestreo de áreas pueden ser la única opción.
En los casos más sencillos, como cuando se trabaja con un lote de material de una serie de producción o se utiliza un censo , es posible identificar y medir cada uno de los elementos de la población e incluir cualquiera de ellos en nuestra muestra; esto se conoce como muestreo de elementos directos . [1] Sin embargo, en muchos otros casos esto no es posible; ya sea porque es prohibitivo en términos de costo (llegar a todos los ciudadanos de un país) o imposible (llegar a todos los seres humanos vivos).
Una vez establecido el marco, existen diversas maneras de organizarlo para mejorar la eficiencia y la eficacia. Es en esta etapa cuando el investigador debe decidir si la muestra será de hecho toda la población y, por lo tanto, un censo .
Esta lista también debería facilitar el acceso a las unidades de muestreo seleccionadas . Un marco también puede proporcionar "información auxiliar" adicional sobre sus elementos; cuando esta información está relacionada con variables o grupos de interés, puede utilizarse para mejorar el diseño de la encuesta. Si bien no es necesario para un muestreo simple, un marco de muestreo utilizado para técnicas de muestreo más avanzadas, como el muestreo estratificado , puede contener información adicional (como información demográfica ). [1] Por ejemplo, un registro electoral puede incluir el nombre y el sexo; esta información puede utilizarse para garantizar que una muestra tomada de ese marco cubra todas las categorías demográficas de interés. (A veces, la información auxiliar es menos explícita; por ejemplo, un número de teléfono puede proporcionar alguna información sobre la ubicación.
Un marco de muestreo ideal tendrá las siguientes cualidades: [1]
El tipo de marco más sencillo es una lista de elementos de la población (preferiblemente toda la población) con información de contacto apropiada. Por ejemplo, en una encuesta de opinión , los posibles marcos de muestreo incluyen un registro electoral o un directorio telefónico . Otros marcos de muestreo pueden incluir registros de empleo, listas de clases escolares, archivos de pacientes en un hospital, organizaciones listadas en una base de datos temática, etc. [1] [5] En un nivel más práctico, los marcos de muestreo tienen la forma de archivos de computadora . [1]
No todos los marcos enumeran explícitamente los elementos de la población; algunos solo enumeran "conglomerados". Por ejemplo, un mapa de calles se puede utilizar como marco para una encuesta puerta a puerta; aunque no muestra casas individuales, podemos seleccionar calles del mapa y luego seleccionar casas en esas calles. Esto ofrece algunas ventajas: un marco de este tipo incluiría a las personas que se han mudado recientemente y que aún no están en los marcos de lista analizados anteriormente, y puede ser más fácil de usar porque no requiere almacenar datos para cada unidad de la población, solo para un número menor de conglomerados.
El marco de muestreo debe ser representativo de la población, y esta es una cuestión que queda fuera del ámbito de la teoría estadística y que exige el juicio de expertos en el tema en cuestión. Todos los marcos anteriores omiten a algunas personas que votarán en las próximas elecciones y contienen a otras que no lo harán; algunos marcos contendrán varios registros de la misma persona. Las personas que no están en el marco no tienen ninguna posibilidad de ser incluidas en la muestra.
Debido a que un marco basado en conglomerados contiene menos información sobre la población, puede imponer restricciones al diseño de la muestra, posiblemente requiriendo el uso de métodos de muestreo menos eficientes y/o dificultando la interpretación de los datos resultantes.
La teoría estadística nos habla de las incertidumbres que existen al extrapolar de una muestra al marco. Es de esperar que los marcos muestrales siempre contengan algunos errores. [5] En algunos casos, esto puede llevar a un sesgo de muestreo . [1] Dicho sesgo debe minimizarse e identificarse, aunque evitarlo por completo en el mundo real es casi imposible. [1] Tampoco se debe asumir que las fuentes que afirman ser imparciales y representativas lo sean. [1]
Para definir el marco, es necesario abordar cuestiones prácticas, económicas, éticas y técnicas. La necesidad de obtener resultados oportunos puede impedir que se extienda el marco mucho más hacia el futuro. Las dificultades pueden ser extremas cuando la población y el marco están disjuntos . Este es un problema particular en la previsión, cuando se hacen inferencias sobre el futuro a partir de datos históricos . De hecho, en 1703, cuando Jacob Bernoulli propuso a Gottfried Leibniz la posibilidad de utilizar datos históricos de mortalidad para predecir la probabilidad de muerte temprana de un hombre vivo, Gottfried Leibniz reconoció el problema al responder: [6]
La naturaleza ha establecido pautas que se originan en el retorno de los acontecimientos, pero sólo en su mayor parte. Nuevas enfermedades inundan la raza humana, de modo que por muchos experimentos que se hayan hecho con cadáveres, no se ha impuesto con ello un límite a la naturaleza de los acontecimientos para que en el futuro no puedan variar.
—Gottfried Leibniz
Leslie Kish planteó cuatro problemas básicos de los marcos de muestreo: [7]
Problemas como los enumerados se pueden identificar mediante el uso de pruebas previas a la encuesta y estudios piloto .