Sesgo de deseabilidad social

En la investigación de las ciencias sociales , el sesgo de deseabilidad social es un tipo de sesgo de respuesta que es la tendencia de los encuestados a responder preguntas de una manera que los demás vean favorablemente. ^[1] Puede tomar la forma de un exceso de información sobre "buen comportamiento" o una falta de información sobre "malo" o comportamiento indeseable. Esta tendencia plantea un grave problema a la hora de realizar investigaciones con autoinformes . Este sesgo interfiere con la interpretación de las tendencias promedio así como con las diferencias individuales.

Temas sujetos a sesgos de deseabilidad social

Los temas en los que la respuesta socialmente deseable (SDR) es de especial preocupación son los autoinformes sobre habilidades, personalidad, comportamiento sexual y uso de drogas. Cuando se les pregunta "¿Con qué frecuencia se masturba ?", por ejemplo, los encuestados pueden verse presionados por el tabú social contra la masturbación y subestimar la frecuencia o evitar responder la pregunta. Por lo tanto, es probable que las tasas medias de masturbación derivadas de las encuestas de autoinforme estén gravemente subestimadas.

Cuando se le pregunta: "¿Consume drogas/sustancias ilícitas?" El encuestado puede verse influenciado por el hecho de que las sustancias controladas , incluida la marihuana , de uso más común , son generalmente ilegales. Los encuestados pueden sentirse presionados a negar cualquier consumo de drogas o a racionalizarlo , por ejemplo, "sólo fumo marihuana cuando mis amigos están cerca". El sesgo también puede influir en los informes sobre el número de parejas sexuales. De hecho, el sesgo puede operar en direcciones opuestas para diferentes subgrupos: mientras que los hombres tienden a inflar las cifras, las mujeres tienden a subestimar las suyas. En cualquier caso, es probable que los informes medios de ambos grupos estén distorsionados por un sesgo de deseabilidad social.

Otros temas que son sensibles al sesgo de deseabilidad social incluyen:

Los rasgos de personalidad autoinformados se correlacionarán fuertemente con el sesgo de deseabilidad social ^[2]
Ingresos y ganancias personales , a menudo inflados cuando son bajos y deflactados cuando son altos
Sentimientos de baja autoestima y/o impotencia, a menudo negados.
Funciones excretoras , a menudo abordadas de manera incómoda, si se discuten en absoluto.
Cumplimiento de los esquemas de dosificación de medicamentos, a menudo inflados
Planificación familiar , incluido el uso de anticonceptivos y el aborto ^[3]^[4]
Religión , a menudo evitada o abordada de manera incómoda ^[5]
Patriotismo , ya sea inflado o, si se niega, hecho por temor al juicio de la otra parte.
La intolerancia y la intolerancia , a menudo negadas, incluso si existen dentro del respondedor.
Logros intelectuales, a menudo inflados
Apariencia física, ya sea inflada o desinflada.
Actos de violencia física real o imaginaria , a menudo negados
Indicadores de caridad o "benevolencia", a menudo inflados
Actos ilegales, a menudo negados
Participación electoral ^[6]^[7]^[8]^[9]

Diferencias individuales en las respuestas socialmente deseables

En 1953, Allen L. Edwards introdujo la noción de deseabilidad social en la psicología, demostrando el papel de la deseabilidad social en la medición de los rasgos de personalidad. Demostró que las calificaciones de deseabilidad social de las descripciones de rasgos de personalidad están muy correlacionadas con la probabilidad de que un grupo posterior de personas respalde estas autodescripciones de rasgos. En su primera demostración de este patrón, la correlación entre las calificaciones de deseabilidad social de un grupo de estudiantes universitarios de un conjunto de rasgos y la probabilidad de que los estudiantes universitarios de un segundo grupo respaldaran autodescripciones que describieran los mismos rasgos era tan alta que podría distorsionar el significado de los rasgos de personalidad. En otras palabras, ¿estas autodescripciones describen rasgos de personalidad o deseabilidad social? ^[10]

Posteriormente, Edwards desarrolló la primera Escala de deseabilidad social, un conjunto de 39 preguntas de verdadero y falso extraídas del Inventario multifásico de personalidad de Minnesota (MMPI), preguntas que los jueces podían, con un alto acuerdo, ordenar según su deseabilidad social. ^[2] Posteriormente se descubrió que estos elementos estaban muy correlacionados con una amplia gama de escalas de medición, escalas de personalidad y diagnóstico del MMPI. ^[11] La SDS también está altamente correlacionada con el Inventario de Desesperanza de Beck. ^[12]

El hecho de que las personas difieran en su tendencia a participar en respuestas socialmente deseables (SDR) es una preocupación especial para quienes miden las diferencias individuales con autoinformes. Las diferencias individuales en los DEG hacen difícil distinguir a las personas con buenos rasgos que responden objetivamente de aquellas que distorsionan sus respuestas en una dirección positiva.

Cuando no se puede eliminar el DEG, los investigadores pueden recurrir a evaluar la tendencia y luego controlarla. Se debe administrar una medida DEG separada junto con la medida principal (prueba o entrevista) dirigida al tema de la investigación. La suposición clave es que los encuestados que responden de manera socialmente deseable en esa escala también responden de manera deseable a todos los autoinformes a lo largo del estudio.

En algunos casos, es posible que simplemente se descarte todo el paquete de cuestionarios de los encuestados con puntuaciones altas. Alternativamente, las respuestas de los encuestados a los cuestionarios primarios pueden ajustarse estadísticamente de manera proporcional a sus tendencias en DEG. Por ejemplo, este ajuste se realiza automáticamente en la puntuación estándar de las escalas MMPI.

La principal preocupación con las escalas SDR es que confunden estilo con contenido. Después de todo, las personas en realidad difieren en el grado en que poseen rasgos deseables (por ejemplo, monjas versus delincuentes). En consecuencia, las medidas de deseabilidad social confunden las diferencias verdaderas con el sesgo de deseabilidad social.

Medidas estándar de DEG individuales

Hasta la década de 1990, la medida de respuesta socialmente deseable más utilizada era la Escala de Deseabilidad Social de Marlowe-Crowne . ^[13] La versión original constaba de 33 ítems de Verdadero-Falso. Una versión abreviada, la Strahan-Gerbasi sólo consta de diez ítems, pero algunos han planteado dudas sobre la fiabilidad de esta medida. ^[14]

En 1991, Delroy L. Paulhus publicó el Inventario equilibrado de respuestas deseables (BIDR): un cuestionario diseñado para medir dos formas de DEG. ^[15] Este instrumento de cuarenta ítems proporciona subescalas separadas para el " manejo de impresiones ", la tendencia a dar autodescripciones infladas a una audiencia; y mejora autoengañosa , la tendencia a dar autodescripciones honestas pero infladas. La versión comercial del BIDR se llama "Escalas de engaño Paulhus (PDS)". ^[dieciséis]

Las escalas diseñadas para aprovechar los estilos de respuesta están disponibles en los principales idiomas, incluidos el italiano ^[17]^[18] y el alemán. ^[19]

Técnicas para reducir el sesgo de deseabilidad social

Anonimato y confidencialidad

Se ha demostrado que la administración anónima de encuestas, en comparación con la administración en persona o por teléfono, genera una mayor notificación de ítems con sesgo de deseabilidad social. ^[20] En entornos de encuestas anónimas, se garantiza al sujeto que sus respuestas no estarán vinculadas a él y no se le pide que divulgue información confidencial directamente a un encuestador. El anonimato se puede establecer mediante la autoadministración de encuestas en papel enviadas por sobre, correo o urnas, o mediante la autoadministración de encuestas electrónicas a través de una computadora , teléfono inteligente o tableta. ^[1]^[21] También se han establecido encuestas electrónicas asistidas por audio para sujetos de estudio con bajo nivel de alfabetización o analfabetos. ^[1]^[22]

La confidencialidad se puede establecer en entornos no anónimos asegurándose de que solo esté presente el personal del estudio y manteniendo la confidencialidad de los datos una vez completadas las encuestas. Incluir garantías de confidencialidad de los datos en las encuestas tiene un efecto mixto en la respuesta a preguntas delicadas; puede aumentar la respuesta debido a una mayor confianza o disminuir la respuesta al aumentar la sospecha y la preocupación. ^[1]

Técnicas de interrogatorio especializadas.

Se han establecido varias técnicas para reducir el sesgo al formular preguntas sensibles a la deseabilidad social. ^[20] Las técnicas de preguntas complejas pueden reducir el sesgo de deseabilidad social, pero también pueden resultar confusas o mal entendidas por los encuestados.

Más allá de técnicas específicas, el sesgo de deseabilidad social puede reducirse mediante preguntas neutrales y una redacción rápida. ^[1]

Método de las urnas

El método de las urnas (BBM) proporciona a los encuestados anonimato al permitirles responder en privado, completando ellos mismos sus respuestas a las preguntas delicadas de la encuesta en una boleta secreta y enviándolas a una caja cerrada. El entrevistador no tiene conocimiento de lo que está registrado en la boleta secreta y no tiene acceso al candado de la urna, lo que oscurece las respuestas y limita el potencial de SDB. Sin embargo, un número de control único en cada boleta permite reunir las respuestas con un cuestionario correspondiente que contiene preguntas menos sensibles. ^[23]^[24] El BBM se ha utilizado con éxito para obtener estimaciones de comportamientos sexuales sensibles durante un estudio de prevención del VIH, ^[23] así como del uso ilegal de recursos ambientales. ^[24]^[25] En un estudio de validación en el que el comportamiento observado se comparó con el comportamiento informado utilizando varios métodos de control de SDB, el BBM fue, con mucho, el método de reducción de sesgos más preciso, con un rendimiento significativamente mejor que la técnica de respuesta aleatoria (RRT). ^[24]

Técnicas de respuesta aleatoria

La técnica de respuesta aleatoria pide a un participante que responda con una respuesta fija o que responda con sinceridad basándose en el resultado de un acto aleatorio. ^[22] Por ejemplo, los encuestados lanzan en secreto una moneda y responden "sí" si sale cara (independientemente de su respuesta real a la pregunta), y se les indica que respondan con la verdad si sale cruz. Esto permite al investigador estimar la prevalencia real de un comportamiento determinado entre la población del estudio sin necesidad de conocer el verdadero estado de ningún encuestado individual. Las investigaciones muestran que la validez de la técnica de respuesta aleatoria es limitada. ^[26] La investigación de validación ha demostrado que el TRR en realidad funciona peor que el interrogatorio directo para algunos comportamientos sensibles y se debe tener cuidado al considerar su uso. ^[24]

Técnicas nominativas y de mejor amigo.

La técnica nominativa pregunta al participante sobre el comportamiento de sus amigos cercanos, en lugar de sobre su propio comportamiento. ^[27] Se pregunta a los participantes cuántos amigos cercanos que conocen han cometido con seguridad un comportamiento sensible y cuántas otras personas creen que conocen ese comportamiento. A partir de la respuesta se pueden derivar estimaciones poblacionales de comportamientos.

La metodología similar del mejor amigo pregunta al participante sobre el comportamiento de un mejor amigo. ^[28]

Técnica de conteo inigualable

La técnica del conteo no coincidente pide a los encuestados que indiquen cuántos elementos de una lista de varios elementos han hecho o son verdaderos para ellos. ^[29] Los encuestados son asignados al azar para recibir una lista de elementos no sensibles o esa misma lista más el elemento sensible de interés. Las diferencias en el número total de ítems entre los dos grupos indican cuántos de los del grupo que recibió el ítem sensible dijeron que sí.

Método de respuesta agrupada

El método de respuesta agrupada, también conocido como método de dos o tres tarjetas, combina opciones de respuesta de modo que la respuesta sensible se combina con al menos una opción de respuesta no sensible. ^[30]

Métodos transversales, triangulares y de sensibilidad oculta

Estos métodos piden a los participantes que seleccionen una respuesta basada en dos o más preguntas, de las cuales sólo una es sensible. ^[31] Por ejemplo, a un participante se le preguntará si su año de nacimiento es par y si ha realizado una actividad ilegal; si respondió sí a ambas o no a ambas, seleccione A, y si respondió sí a una pero no a la otra, seleccione B. Al combinar preguntas sensibles y no sensibles, se enmascara la respuesta del participante al elemento sensible. Las investigaciones muestran que la validez del modelo transversal es limitada. ^[32]

Tubería falsa

Las técnicas de canalización falsa son aquellas en las que un participante cree que se utilizará una prueba objetiva, como un detector de mentiras, junto con la respuesta a la encuesta, independientemente de que esa prueba o procedimiento se utilice realmente o no. ^[1]

Otros estilos de respuesta

El "estilo de respuesta extrema" (ERS) adopta la forma de preferencia exagerada por las extremidades, por ejemplo, '1' o '7' en escalas de 7 puntos. Su opuesto, el "sesgo de moderación", implica una preferencia por respuestas de rango medio (o punto medio) (por ejemplo, 3 a 5 en escalas de 7 puntos).

"Aquiescencia" (ARS) es la tendencia a responder a elementos con acuerdo/afirmación independientemente de su contenido (decir "sí").

Este tipo de estilos de respuesta difieren del sesgo de deseabilidad social en que no están relacionados con el contenido de la pregunta y pueden estar presentes tanto en contextos socialmente neutrales como socialmente favorables o desfavorables, mientras que el SDR está, por definición, vinculado a este último.

Ver también

Referencias

^ abcdef Krumpal, Ivar (2013). "Determinantes del sesgo de deseabilidad social en encuestas sensibles: una revisión de la literatura". Calidad cantidad . 47 (4): 2025-2047. doi :10.1007/s11135-011-9640-9. S2CID 143045969.
^ ab Edwards, Allen (1957). La variable deseabilidad social en la evaluación e investigación de la personalidad . Nueva York: The Dryden Press.
^ Estuardo, Gretchen S.; Grimes, David A. (2009). "Sesgo de deseabilidad social en los estudios de planificación familiar: un problema desatendido". Anticoncepción . 80 (2): 108-112. doi :10.1016/j.contraception.2009.02.009. PMID 19631784.
^ Sedgh, Gilda; Keogh, Sarah C. (18 de abril de 2019). "Nuevos enfoques para estimar la incidencia del aborto". Salud reproductiva . 16 (1): 44. doi : 10.1186/s12978-019-0702-0 . PMC 6472065 . PMID 30999917.
^ Prensador, Stanley; Stinson, Linda (1998). "Modo de recopilación de datos y sesgo de deseabilidad social en la asistencia religiosa autoinformada". Revista sociológica estadounidense . 63 (1): 137-145. doi :10.2307/2657486. JSTOR 2657486.
^ Brian, Duff; Hanmer, Michael J.; Park, Won-Ho; Blanco, Ismail K. (2007). "Buenas excusas: comprender quién vota con una pregunta de participación mejorada". Opinión Pública Trimestral . 71 (1): 67–90. doi : 10.1093/poq/nfl045.
^ Hanmer, Michael J.; Bancos, Antoine J.; Blanco, Ismail K. (2013). "Experimentos para reducir la sobreinformación de las votaciones: un conducto hacia la verdad". Análisis Político . 22 (1): 130-141. doi : 10.1093/pan/mpt027 .
^ Morin-Chassé, Alexandre; Bol, Damián; Stephenson, Laura B.; Labbé St-Vincent, Simon (2017). "¿Cómo realizar una encuesta sobre la participación electoral? La eficacia de los ítems de respuesta para salvar las apariencias en 19 contextos diferentes" (PDF) . Investigación y métodos de ciencias políticas . 5 (3): 575–584. doi :10.1017/psrm.2016.31. S2CID 148277964.
^ Morin-Chassé, Alexandre (2018). "¿Cómo realizar encuestas sobre la participación electoral? Evidencia adicional". Revista de Ciencia Política Experimental . 5 (3): 230–233. doi : 10.1017/XPS.2018.1 . S2CID 158608425.
^ Edwards, Allen (1953). "La relación entre la deseabilidad juzgada de un rasgo y la probabilidad de que el rasgo sea respaldado". Revista de Psicología Aplicada . 37 (2): 90–93. doi :10.1037/h0058073.
^ Fordyce, William (1956). "Deseabilidad social en el MMPI". Revista de Psicología de la Consultoría . 20 (3): 171-175. doi :10.1037/h0048547. PMID 13357640.
^ Linehan, Marsha (1981). "Evaluación de la ideación suicida y parasuicidio: desesperanza y deseabilidad social". Revista de Consultoría y Psicología Clínica . 49 (5): 773–775. doi :10.1037/0022-006X.49.5.773. PMID 7287996.
^ Crowne, Douglas P.; Marlowe, David (1960). "Una nueva escala de deseabilidad social independiente de la psicopatología". Revista de Psicología de la Consultoría . 24 (4): 349–354. doi :10.1037/h0047358. PMID 13813058. S2CID 9781635.
^ Thompson, Edmund R.; Phua, Florencia TT (2005). "Confiabilidad entre los altos directivos de la escala de deseabilidad social de formato corto de Marlowe-Crowne". Revista de Negocios y Psicología . 19 (4): 541–554. doi :10.1007/s10869-005-4524-4. S2CID 143818289.
^ Paulhus, DL (1991). Medición y control de sesgos de respuesta. En JP Robinson et al. (Eds.), Medidas de personalidad y actitudes psicológicas sociales . San Diego: prensa académica
^ Paulhus DL, (1998) Paulhus Deception Scales (PDS) es una publicación de Multi-Health Systems de Toronto.
^ Roccato M., (2003) Desiderabilità Sociale e Acquiescenza. Alcune Trappole delle Inchieste e dei Sondaggi . LED Edizioni Universitarie, Turín. ISBN 88-7916-216-0
^ Corbetta P., (2003) La ricerca sociale: metodologia e tecniche . vol. I-IV. Il Mulino, Bolonia.
^ Stöber, Joachim (2001). "La escala de deseabilidad social-17 (SDS-17)" (PDF) . Revista europea de evaluación psicológica . 17 (3): 222–232. doi :10.1027//1015-5759.17.3.222. S2CID 51780539.
^ ab Nederhof, Anton J. (1 de julio de 1985). "Métodos para afrontar el sesgo de deseabilidad social: una revisión". Revista Europea de Psicología Social . 15 (3): 263–280. doi :10.1002/ejsp.2420150303.
^ McBurney DH, (1994) Métodos de investigación . Brooks/Cole, Pacific Grove, California.
^ ab Tourangeau, R.; Yan, T. (2007). "Preguntas delicadas en las encuestas". Boletín Psicológico . 133 (5): 859–83. CiteSeerX 10.1.1.563.2414 . doi :10.1037/0033-2909.133.5.859. PMID 17723033. S2CID 7160451.
^ ab Lewis, James JC; Ronsmans, Carine; Ezeh, Alex; Gregson, Simon (junio de 2004). "El impacto poblacional del VIH en la fertilidad en el África subsahariana". SIDA . 18 (Suplemento 2): S35 – S43. doi :10.1097/00002030-200406002-00005. ISSN 0269-9370. PMID 15319742.
^ abcd Bova, Christopher S.; Aswani, Shankar; Cuarto de centavo, Matthew W.; Potts, Warren M. (1 de diciembre de 2018). "Limitaciones de la técnica de respuesta aleatoria y llamado a implementar el método de las urnas para estimar el cumplimiento de los pescadores recreativos mediante encuestas". Investigación pesquera . 208 : 34–41. doi :10.1016/j.fishres.2018.06.017. ISSN 0165-7836. S2CID 92793552.
^ Arias, Melisa; Hinsley, Amy; Nogales-Ascarrunz, Paola; Negros, Nuño; Glikman, Jenny Anne; Milner-Gulland, EJ (julio de 2021). "Prevalencia y características del comercio ilegal de jaguares en el noroeste de Bolivia". Ciencia y práctica de la conservación . 3 (7). Código Bib : 2021ConSP...3E.444A. doi : 10.1111/csp2.444. ISSN 2578-4854.
^ Juan, Leslie K.; Loewenstein, George; Acquisti, Alessandro; Vosgerau, Joachim (septiembre de 2018). "Cuándo y por qué las técnicas de respuesta aleatoria (no logran) obtener la verdad". Comportamiento Organizacional y Procesos de Decisión Humana . 148 : 101-123. doi :10.1016/j.obhdp.2018.07.004. S2CID 52263233.
^ Miller, JD (1985). "La técnica nominativa: un nuevo método para estimar la prevalencia de la heroína" (PDF) . Monografía de investigación del NIDA . 54 : 104-124. PMID 3929108.
^ Yeatman, Sara; Trinitapoli, Jenny (1 de septiembre de 2011). "Informes de mejores amigos: una herramienta para medir la prevalencia de comportamientos sensibles". Revista Estadounidense de Salud Pública . 101 (9): 1666-1667. doi :10.2105/AJPH.2011.300194. PMC 3154247 . PMID 21778489.
^ Derecho, Judith; Caspar, Raquel A.; Hubbard, Michael L.; Perejil, Teresa L.; Visscher, Wendy; Ezzati, Trena M. (2011), "La técnica del recuento de ítems como método de interrogatorio indirecto: una revisión de su desarrollo y una aplicación de estudio de caso", Errores de medición en encuestas , John Wiley & Sons, Ltd, págs. , doi :10.1002/9781118150382.ch11, ISBN 9781118150382
^ Droitcour, Judith A.; Larson, Eric M. (22 de julio de 2016). "Una técnica innovadora para hacer preguntas delicadas: el método de las tres cartas". Boletín de Metodología Sociológica/Bulletin de Méthodologie Sociologique . 75 : 5–23. doi :10.1177/075910630207500103. S2CID 73189531.
^ Yu, Jun-Wu; Tian, Guo-Liang; Tang, Man-Lai (18 de abril de 2007). "Dos nuevos modelos de muestreo de encuestas con características sensibles: diseño y análisis". Métrica . 67 (3): 251. doi :10.1007/s00184-007-0131-x. S2CID 122941401.
^ Schnapp, Patrick (2019). "Técnicas de preguntas sensibles y respuestas descuidadas: ajuste del modelo transversal para respuestas aleatorias". Métodos, datos, análisis . 13 : 307–320. doi :10.12758/mda.2019.03. S2CID 88504613.