La metodología de encuestas es "el estudio de los métodos de encuesta ". [1] Como campo de la estadística aplicada que se concentra en las encuestas de investigación humana , la metodología de encuestas estudia el muestreo de unidades individuales de una población y las técnicas asociadas de recopilación de datos de encuestas , como la construcción de cuestionarios y los métodos para mejorar la cantidad y la precisión de las respuestas a las encuestas. La metodología de encuestas se enfoca en instrumentos o procedimientos que formulan una o más preguntas que pueden o no responderse.
Los investigadores realizan encuestas estadísticas con el objetivo de hacer inferencias estadísticas sobre la población estudiada; dichas inferencias dependen en gran medida de las preguntas de la encuesta utilizadas. Las encuestas sobre opinión pública , las encuestas de salud pública, las encuestas de investigación de mercado , las encuestas gubernamentales y los censos son ejemplos de investigación cuantitativa que utiliza la metodología de encuesta para responder preguntas sobre una población. Aunque los censos no incluyen una "muestra", sí incluyen otros aspectos de la metodología de encuesta, como cuestionarios, entrevistadores y técnicas de seguimiento de la falta de respuesta. Las encuestas proporcionan información importante para todo tipo de campos de información pública e investigación, como la investigación de mercados , la psicología , la prestación de servicios de salud y la sociología .
Una encuesta única se compone de al menos una muestra (o población completa en el caso de un censo), un método de recolección de datos (por ejemplo, un cuestionario) y preguntas o ítems individuales que se convierten en datos que pueden analizarse estadísticamente. Una encuesta única puede centrarse en diferentes tipos de temas como preferencias (por ejemplo, para un candidato presidencial), opiniones (por ejemplo, ¿debería ser legal el aborto?), comportamiento (tabaquismo y consumo de alcohol) o información factual (por ejemplo, ingresos), dependiendo de su propósito. Dado que la investigación de encuestas casi siempre se basa en una muestra de la población, el éxito de la investigación depende de la representatividad de la muestra con respecto a una población objetivo de interés para el investigador. Esa población objetivo puede variar desde la población general de un país determinado hasta grupos específicos de personas dentro de ese país, hasta una lista de miembros de una organización profesional o una lista de estudiantes matriculados en un sistema escolar (ver también muestreo (estadísticas) y muestreo de encuesta ). Las personas que responden a una encuesta se denominan encuestados y, dependiendo de las preguntas formuladas, sus respuestas pueden representarse a sí mismas como individuos, sus hogares, empleadores u otra organización a la que representan.
La metodología de encuestas, como campo científico, busca identificar principios sobre el diseño de la muestra, los instrumentos de recolección de datos, el ajuste estadístico de los datos, el procesamiento de los datos y el análisis final de los datos que pueden crear errores sistemáticos y aleatorios en las encuestas. Los errores de las encuestas a veces se analizan en relación con el costo de la encuesta. Las limitaciones de costos a veces se enmarcan como una mejora de la calidad dentro de las limitaciones de costos o, alternativamente, una reducción de costos para un nivel fijo de calidad. La metodología de encuestas es tanto un campo científico como una profesión, lo que significa que algunos profesionales en el campo se centran en los errores de las encuestas empíricamente y otros diseñan encuestas para reducirlos. Para los diseñadores de encuestas, la tarea implica tomar un gran conjunto de decisiones sobre miles de características individuales de una encuesta con el fin de mejorarla. [2]
Los desafíos metodológicos más importantes de un metodólogo de encuestas incluyen la toma de decisiones sobre cómo: [2]
La muestra se elige del marco de muestreo, que consiste en una lista de todos los miembros de la población de interés. [3] El objetivo de una encuesta no es describir la muestra, sino la población en general. Esta capacidad de generalización depende de la representatividad de la muestra, como se indicó anteriormente. Cada miembro de la población se denomina elemento. Existen dificultades frecuentes al elegir una muestra representativa. Un error común que resulta es el sesgo de selección . El sesgo de selección se produce cuando los procedimientos utilizados para seleccionar una muestra dan como resultado una sobrerrepresentación o una subrepresentación de algún aspecto significativo de la población. Por ejemplo, si la población de interés consta de un 75% de mujeres y un 25% de hombres, y la muestra consta de un 40% de mujeres y un 60% de hombres, las mujeres están subrepresentadas mientras que los hombres están sobrerrepresentados. Para minimizar los sesgos de selección, a menudo se utiliza el muestreo aleatorio estratificado . Esto es cuando la población se divide en subpoblaciones llamadas estratos, y se extraen muestras aleatorias de cada uno de los estratos, o se extraen elementos para la muestra de forma proporcional.
Existen varias formas de administrar una encuesta. La elección entre los modos de administración está influenciada por varios factores, entre ellos:
Los distintos métodos crean efectos modales que modifican la forma de responder de los encuestados, y cada método tiene distintas ventajas. Los modos de administración más comunes se pueden resumir de la siguiente manera: [4]
Existen varios diseños o estructuras generales diferentes que se pueden utilizar en la investigación por encuesta. Los tres tipos generales son los estudios transversales, los estudios de muestras independientes sucesivas y los estudios longitudinales. [3]
En los estudios transversales, se extrae una muestra (o muestras) de la población relevante y se estudia una sola vez. [3] Un estudio transversal describe las características de esa población en un momento dado, pero no puede brindar ninguna información sobre las causas de las características de la población porque es un diseño predictivo y correlacional.
Un diseño de muestras independientes sucesivas extrae múltiples muestras aleatorias de una población en uno o más momentos. [3] Este diseño puede estudiar los cambios dentro de una población, pero no los cambios dentro de los individuos porque los mismos individuos no son encuestados más de una vez. Por lo tanto, tales estudios no pueden identificar necesariamente las causas del cambio a lo largo del tiempo. Para que los diseños de muestras independientes sucesivas sean efectivos, las muestras deben extraerse de la misma población y deben ser igualmente representativas de ella. Si las muestras no son comparables, los cambios entre muestras pueden deberse a características demográficas en lugar de al tiempo. Además, las preguntas deben formularse de la misma manera para que las respuestas puedan compararse directamente.
Los estudios longitudinales miden la misma muestra aleatoria en múltiples puntos temporales. [3] A diferencia de un diseño de muestras independientes sucesivas, este diseño mide las diferencias en las respuestas de los participantes individuales a lo largo del tiempo. Esto significa que un investigador puede evaluar potencialmente las razones de los cambios en las respuestas evaluando las diferencias en las experiencias de los encuestados. Los estudios longitudinales son la forma más fácil de evaluar el efecto de un evento que ocurre naturalmente, como el divorcio, que no se puede probar experimentalmente.
Sin embargo, los estudios longitudinales son costosos y difíciles de realizar. Es más difícil encontrar una muestra que se comprometa con un estudio de meses o años que con una entrevista de 15 minutos, y los participantes con frecuencia abandonan el estudio antes de la evaluación final. Además, estos estudios a veces requieren que la recopilación de datos sea confidencial o anónima, lo que crea una dificultad adicional para vincular las respuestas de los participantes a lo largo del tiempo. Una posible solución es el uso de un código de identificación autogenerado (SGIC). [5] Estos códigos generalmente se crean a partir de elementos como "mes de nacimiento" y "primera letra del segundo nombre de la madre". Algunos enfoques SGIC anónimos recientes también han intentado minimizar aún más el uso de datos personalizados, utilizando en su lugar preguntas como "nombre de su primera mascota". [6] [7] Dependiendo del enfoque utilizado, se puede perder la capacidad de hacer coincidir alguna parte de la muestra.
Además, la pérdida general de participantes no es aleatoria, por lo que las muestras pueden volverse menos representativas con evaluaciones sucesivas. Para tener esto en cuenta, un investigador puede comparar a los encuestados que abandonaron la encuesta con los que no lo hicieron, para ver si son poblaciones estadísticamente diferentes. Los encuestados también pueden intentar ser coherentes a pesar de los cambios en las respuestas de la encuesta.
Los cuestionarios son la herramienta más utilizada en las encuestas de investigación. Sin embargo, los resultados de una encuesta en particular no tienen valor si el cuestionario está redactado de manera inadecuada. [3] Los cuestionarios deben producir medidas de variables demográficas válidas y confiables y deben arrojar disparidades individuales válidas y confiables que generan las escalas de autoinforme. [3]
Una categoría variable que se mide a menudo en las investigaciones de encuestas son las variables demográficas, que se utilizan para describir las características de las personas encuestadas en la muestra. [3] Las variables demográficas incluyen medidas como la etnia, el nivel socioeconómico, la raza y la edad. [3] Las encuestas a menudo evalúan las preferencias y actitudes de los individuos, y muchas emplean escalas de autoinforme para medir las opiniones y los juicios de las personas sobre diferentes elementos presentados en una escala. [3] Las escalas de autoinforme también se utilizan para examinar las disparidades entre las personas en los elementos de la escala. [3] Estas escalas de autoinforme, que generalmente se presentan en forma de cuestionario, son uno de los instrumentos más utilizados en psicología y, por lo tanto, es importante que las medidas se construyan con cuidado, al mismo tiempo que sean confiables y válidas. [3]
Las medidas confiables de autoinforme se definen por su consistencia. [3] Por lo tanto, una medida de autoinforme confiable produce resultados consistentes cada vez que se ejecuta. [3] La confiabilidad de una prueba se puede medir de varias maneras. [3] Primero, se puede calcular una confiabilidad de prueba-reprueba. [3] La confiabilidad de prueba-reprueba implica realizar el mismo cuestionario a una muestra grande en dos momentos diferentes. [3] Para que el cuestionario se considere confiable, las personas en la muestra no tienen que puntuar de manera idéntica en cada prueba, sino que su posición en la distribución de puntajes debe ser similar tanto para la prueba como para la reprueba. [3] Las medidas de autoinforme generalmente serán más confiables cuando tienen muchos ítems que miden un constructo. [3] Además, las mediciones serán más confiables cuando el factor que se mide tiene una mayor variabilidad entre los individuos en la muestra que se están evaluando. [3] Finalmente, habrá una mayor confiabilidad cuando las instrucciones para completar el cuestionario sean claras y cuando haya distracciones limitadas en el entorno de prueba. [3] Por el contrario, un cuestionario es válido si lo que mide es lo que originalmente se había planeado medir. [3] La validez de constructo de una medida es el grado en que mide el constructo teórico que originalmente se suponía que debía medir. [3]
Se pueden seguir seis pasos para elaborar un cuestionario que produzca resultados fiables y válidos. [3] En primer lugar, hay que decidir qué tipo de información se debe recopilar. [3] En segundo lugar, hay que decidir cómo se va a llevar a cabo el cuestionario. [3] En tercer lugar, hay que elaborar un primer borrador del cuestionario. [3] En cuarto lugar, hay que revisar el cuestionario. [3] A continuación, hay que ponerlo a prueba. [3] Por último, hay que editar el cuestionario y especificar los procedimientos para su uso. [3]
La forma en que se formula una pregunta puede tener un gran impacto en cómo un participante de la investigación responderá a la pregunta. [3] Por lo tanto, los investigadores de encuestas deben ser conscientes de su redacción al escribir las preguntas de la encuesta. [3] Es importante que los investigadores tengan en cuenta que diferentes individuos, culturas y subculturas pueden interpretar ciertas palabras y frases de manera diferente entre sí. [3] Hay dos tipos diferentes de preguntas que los investigadores de encuestas utilizan al escribir un cuestionario: preguntas de respuesta libre y preguntas cerradas. [3] Las preguntas de respuesta libre son abiertas, mientras que las preguntas cerradas suelen ser de opción múltiple. [3] Las preguntas de respuesta libre son beneficiosas porque permiten al encuestado una mayor flexibilidad, pero también son muy difíciles de registrar y puntuar, lo que requiere una codificación extensa. [3] Por el contrario, las preguntas cerradas se pueden puntuar y codificar más fácilmente, pero disminuyen la expresividad y la espontaneidad del encuestado. [3] En general, el vocabulario de las preguntas debe ser muy simple y directo, y la mayoría debe tener menos de veinte palabras. [3] Cada pregunta debe editarse para facilitar su "legibilidad" y debe evitar preguntas capciosas o capciosas. [3] Por último, si se utilizan varios ítems para medir un constructo, la redacción de algunos de ellos debe estar redactada en dirección opuesta para evitar el sesgo de respuesta. [3]
La respuesta de un encuestado a una pregunta abierta se puede codificar posteriormente en una escala de respuesta [4] o analizar utilizando métodos más cualitativos.
Los investigadores de encuestas deben construir cuidadosamente el orden de las preguntas en un cuestionario. [3] Para los cuestionarios que son autoadministrados, las preguntas más interesantes deben estar al principio del cuestionario para captar la atención del encuestado, mientras que las preguntas demográficas deben estar cerca del final. [3] Por el contrario, si una encuesta se administra por teléfono o en persona, las preguntas demográficas deben administrarse al principio de la entrevista para aumentar la confianza del encuestado. [3] Otra razón para ser consciente del orden de las preguntas puede causar un efecto de respuesta de la encuesta en el que una pregunta puede afectar cómo las personas responden a las preguntas posteriores como resultado de la preparación .
La traducción es fundamental para recopilar datos comparables de las encuestas. Los cuestionarios se traducen de un idioma de origen a uno o más idiomas de destino, como por ejemplo del inglés al español y al alemán. Se recomienda que el proceso de traducción se lleve a cabo en equipo, en el que participen traductores, expertos en la materia y personas que ayuden al proceso. [8] [9]
Las mejores prácticas de traducción de encuestas incluyen la traducción paralela, discusiones en equipo y pruebas previas con personas de la vida real. [10] [11] No es un proceso mecánico de colocación de palabras. El modelo TRAPD (traducción, revisión, adjudicación, prueba previa y documentación), desarrollado originalmente para las encuestas sociales europeas , ahora se usa ampliamente en la comunidad de investigación de encuestas global, aunque no siempre se lo etiqueta como tal o se lo implementa en su forma completa. [12] [13] [8] Por ejemplo, la sociolingüística proporciona un marco teórico para la traducción de cuestionarios y complementa al TRAPD. Este enfoque establece que para que la traducción del cuestionario logre el efecto comunicativo equivalente al del idioma de origen, la traducción debe ser lingüísticamente apropiada al tiempo que incorpora las prácticas sociales y las normas culturales del idioma de destino. [14]
Se han recomendado las siguientes formas de reducir la falta de respuesta [15] en encuestas telefónicas y presenciales: [16]
La brevedad también se cita a menudo como un factor que aumenta la tasa de respuesta. Una revisión bibliográfica de 1996 encontró evidencia mixta que respaldaba esta afirmación tanto para las encuestas escritas como para las verbales, y concluyó que otros factores a menudo pueden ser más importantes. [18] Un estudio de 2010 que examinó 100.000 encuestas en línea encontró que la tasa de respuesta disminuyó aproximadamente un 3% con 10 preguntas y aproximadamente un 6% con 20 preguntas, y que la disminución fue más lenta (por ejemplo, solo un 10% con 40 preguntas). [19] Otros estudios mostraron que la calidad de la respuesta se degradaba hacia el final de las encuestas largas. [20]
Algunos investigadores también han analizado el papel o la profesión del destinatario como un factor potencial que afecta a la forma en que se gestiona la falta de respuesta. Por ejemplo, los faxes no se utilizan habitualmente para distribuir encuestas, pero en un estudio reciente a veces los farmacéuticos los preferían, ya que reciben con frecuencia recetas por fax en el trabajo pero no siempre tienen acceso a una pieza de correo con una dirección general. [21]
Los metodólogos de encuestas han dedicado mucho esfuerzo a determinar en qué medida las respuestas de los entrevistados se ven afectadas por las características físicas del entrevistador. Los principales rasgos del entrevistador que se ha demostrado que influyen en las respuestas de la encuesta son la raza, [22] el género [23] y el peso corporal relativo (IMC). [24] Estos efectos del entrevistador son particularmente operativos cuando las preguntas están relacionadas con el rasgo del entrevistador. Por lo tanto, se ha demostrado que la raza del entrevistador afecta las respuestas a las medidas relacionadas con las actitudes raciales, [25] las respuestas del sexo del entrevistador a las preguntas que involucran cuestiones de género [26] y las respuestas del IMC del entrevistador a las preguntas relacionadas con la alimentación y la dieta. [27] Si bien los efectos del entrevistador se han investigado principalmente para encuestas cara a cara, también se ha demostrado que existen para modos de entrevista sin contacto visual, como encuestas telefónicas y en encuestas web mejoradas con video. La explicación que generalmente se proporciona para los efectos del entrevistador es el sesgo de deseabilidad social : los participantes de la encuesta pueden intentar proyectar una autoimagen positiva en un esfuerzo por ajustarse a las normas que atribuyen al entrevistador que hace preguntas. Los efectos del entrevistador son un ejemplo de los efectos de las respuestas de la encuesta .
Desde 2018, los metodólogos de encuestas han comenzado a examinar cómo el big data puede complementar la metodología de encuestas para permitir a los investigadores y profesionales mejorar la producción de estadísticas de encuestas y su calidad. El big data tiene un bajo costo por punto de datos, aplica técnicas de análisis a través del aprendizaje automático y la minería de datos , e incluye fuentes de datos diversas y nuevas, por ejemplo, registros, redes sociales, aplicaciones y otras formas de datos digitales. Se han celebrado tres conferencias Big Data Meets Survey Science (BigSurv) en 2018, 2020, 2023 y una conferencia próxima en 2025, [28] un número especial en Social Science Computer Review , [29] un número especial en Journal of the Royal Statistical Society , [30] y un número especial en EP J Data Science , [31] y un libro llamado Big Data Meets Social Sciences [32] editado por Craig A. Hill y otros cinco miembros de la American Statistical Association .
[...] La metodología de encuestas es el estudio de los métodos de encuesta. Es el estudio de las fuentes de error en las encuestas y cómo hacer que los números producidos por las encuestas sean lo más precisos posible.