En la investigación de las ciencias sociales , el sesgo de deseabilidad social es un tipo de sesgo de respuesta que es la tendencia de los encuestados a responder preguntas de una manera que los demás vean favorablemente. [1] Puede tomar la forma de un exceso de información sobre "buen comportamiento" o una falta de información sobre "malo" o comportamiento indeseable. Esta tendencia plantea un grave problema a la hora de realizar investigaciones con autoinformes . Este sesgo interfiere con la interpretación de las tendencias promedio así como con las diferencias individuales.
Los temas en los que la respuesta socialmente deseable (SDR) es de especial preocupación son los autoinformes sobre habilidades, personalidad, comportamiento sexual y uso de drogas. Cuando se les pregunta "¿Con qué frecuencia se masturba ?", por ejemplo, los encuestados pueden verse presionados por el tabú social contra la masturbación y subestimar la frecuencia o evitar responder la pregunta. Por lo tanto, es probable que las tasas medias de masturbación derivadas de las encuestas de autoinforme estén gravemente subestimadas.
Cuando se le pregunta: "¿Consume drogas/sustancias ilícitas?" El encuestado puede verse influenciado por el hecho de que las sustancias controladas , incluida la marihuana , de uso más común , son generalmente ilegales. Los encuestados pueden sentirse presionados a negar cualquier consumo de drogas o a racionalizarlo , por ejemplo, "sólo fumo marihuana cuando mis amigos están cerca". El sesgo también puede influir en los informes sobre el número de parejas sexuales. De hecho, el sesgo puede operar en direcciones opuestas para diferentes subgrupos: mientras que los hombres tienden a inflar las cifras, las mujeres tienden a subestimar las suyas. En cualquier caso, es probable que los informes medios de ambos grupos estén distorsionados por un sesgo de deseabilidad social.
Otros temas que son sensibles al sesgo de deseabilidad social incluyen:
En 1953, Allen L. Edwards introdujo la noción de deseabilidad social en la psicología, demostrando el papel de la deseabilidad social en la medición de los rasgos de personalidad. Demostró que las calificaciones de deseabilidad social de las descripciones de rasgos de personalidad están muy correlacionadas con la probabilidad de que un grupo posterior de personas respalde estas autodescripciones de rasgos. En su primera demostración de este patrón, la correlación entre las calificaciones de deseabilidad social de un grupo de estudiantes universitarios de un conjunto de rasgos y la probabilidad de que los estudiantes universitarios de un segundo grupo respaldaran autodescripciones que describieran los mismos rasgos era tan alta que podría distorsionar el significado de los rasgos de personalidad. En otras palabras, ¿estas autodescripciones describen rasgos de personalidad o deseabilidad social? [10]
Posteriormente, Edwards desarrolló la primera Escala de deseabilidad social, un conjunto de 39 preguntas de verdadero y falso extraídas del Inventario multifásico de personalidad de Minnesota (MMPI), preguntas que los jueces podían, con un alto acuerdo, ordenar según su deseabilidad social. [2] Posteriormente se descubrió que estos elementos estaban muy correlacionados con una amplia gama de escalas de medición, escalas de personalidad y diagnóstico del MMPI. [11] La SDS también está altamente correlacionada con el Inventario de Desesperanza de Beck. [12]
El hecho de que las personas difieran en su tendencia a participar en respuestas socialmente deseables (SDR) es una preocupación especial para quienes miden las diferencias individuales con autoinformes. Las diferencias individuales en los DEG hacen difícil distinguir a las personas con buenos rasgos que responden objetivamente de aquellas que distorsionan sus respuestas en una dirección positiva.
Cuando no se puede eliminar el DEG, los investigadores pueden recurrir a evaluar la tendencia y luego controlarla. Se debe administrar una medida DEG separada junto con la medida principal (prueba o entrevista) dirigida al tema de la investigación. La suposición clave es que los encuestados que responden de manera socialmente deseable en esa escala también responden de manera deseable a todos los autoinformes a lo largo del estudio.
En algunos casos, es posible que simplemente se descarte todo el paquete de cuestionarios de los encuestados con puntuaciones altas. Alternativamente, las respuestas de los encuestados a los cuestionarios primarios pueden ajustarse estadísticamente de manera proporcional a sus tendencias en DEG. Por ejemplo, este ajuste se realiza automáticamente en la puntuación estándar de las escalas MMPI.
La principal preocupación con las escalas SDR es que confunden estilo con contenido. Después de todo, las personas en realidad difieren en el grado en que poseen rasgos deseables (por ejemplo, monjas versus delincuentes). En consecuencia, las medidas de deseabilidad social confunden las diferencias verdaderas con el sesgo de deseabilidad social.
Hasta la década de 1990, la medida de respuesta socialmente deseable más utilizada era la Escala de Deseabilidad Social de Marlowe-Crowne . [13] La versión original constaba de 33 ítems de Verdadero-Falso. Una versión abreviada, la Strahan-Gerbasi sólo consta de diez ítems, pero algunos han planteado dudas sobre la fiabilidad de esta medida. [14]
En 1991, Delroy L. Paulhus publicó el Inventario equilibrado de respuestas deseables (BIDR): un cuestionario diseñado para medir dos formas de DEG. [15] Este instrumento de cuarenta ítems proporciona subescalas separadas para el " manejo de impresiones ", la tendencia a dar autodescripciones infladas a una audiencia; y mejora autoengañosa , la tendencia a dar autodescripciones honestas pero infladas. La versión comercial del BIDR se llama "Escalas de engaño Paulhus (PDS)". [dieciséis]
Las escalas diseñadas para aprovechar los estilos de respuesta están disponibles en los principales idiomas, incluidos el italiano [17] [18] y el alemán. [19]
Se ha demostrado que la administración anónima de encuestas, en comparación con la administración en persona o por teléfono, genera una mayor notificación de ítems con sesgo de deseabilidad social. [20] En entornos de encuestas anónimas, se garantiza al sujeto que sus respuestas no estarán vinculadas a él y no se le pide que divulgue información confidencial directamente a un encuestador. El anonimato se puede establecer mediante la autoadministración de encuestas en papel enviadas por sobre, correo o urnas, o mediante la autoadministración de encuestas electrónicas a través de una computadora , teléfono inteligente o tableta. [1] [21] También se han establecido encuestas electrónicas asistidas por audio para sujetos de estudio con bajo nivel de alfabetización o analfabetos. [1] [22]
La confidencialidad se puede establecer en entornos no anónimos asegurándose de que solo esté presente el personal del estudio y manteniendo la confidencialidad de los datos una vez completadas las encuestas. Incluir garantías de confidencialidad de los datos en las encuestas tiene un efecto mixto en la respuesta a preguntas delicadas; puede aumentar la respuesta debido a una mayor confianza o disminuir la respuesta al aumentar la sospecha y la preocupación. [1]
Se han establecido varias técnicas para reducir el sesgo al formular preguntas sensibles a la deseabilidad social. [20] Las técnicas de preguntas complejas pueden reducir el sesgo de deseabilidad social, pero también pueden resultar confusas o mal entendidas por los encuestados.
Más allá de técnicas específicas, el sesgo de deseabilidad social puede reducirse mediante preguntas neutrales y una redacción rápida. [1]
El método de las urnas (BBM) proporciona a los encuestados anonimato al permitirles responder en privado, completando ellos mismos sus respuestas a las preguntas delicadas de la encuesta en una boleta secreta y enviándolas a una caja cerrada. El entrevistador no tiene conocimiento de lo que está registrado en la boleta secreta y no tiene acceso al candado de la urna, lo que oscurece las respuestas y limita el potencial de SDB. Sin embargo, un número de control único en cada boleta permite reunir las respuestas con un cuestionario correspondiente que contiene preguntas menos sensibles. [23] [24] El BBM se ha utilizado con éxito para obtener estimaciones de comportamientos sexuales sensibles durante un estudio de prevención del VIH, [23] así como del uso ilegal de recursos ambientales. [24] [25] En un estudio de validación en el que el comportamiento observado se comparó con el comportamiento informado utilizando varios métodos de control de SDB, el BBM fue, con mucho, el método de reducción de sesgos más preciso, con un rendimiento significativamente mejor que la técnica de respuesta aleatoria (RRT). [24]
La técnica de respuesta aleatoria pide a un participante que responda con una respuesta fija o que responda con sinceridad basándose en el resultado de un acto aleatorio. [22] Por ejemplo, los encuestados lanzan en secreto una moneda y responden "sí" si sale cara (independientemente de su respuesta real a la pregunta), y se les indica que respondan con la verdad si sale cruz. Esto permite al investigador estimar la prevalencia real de un comportamiento determinado entre la población del estudio sin necesidad de conocer el verdadero estado de ningún encuestado individual. Las investigaciones muestran que la validez de la técnica de respuesta aleatoria es limitada. [26] La investigación de validación ha demostrado que el TRR en realidad funciona peor que el interrogatorio directo para algunos comportamientos sensibles y se debe tener cuidado al considerar su uso. [24]
La técnica nominativa pregunta al participante sobre el comportamiento de sus amigos cercanos, en lugar de sobre su propio comportamiento. [27] Se pregunta a los participantes cuántos amigos cercanos que conocen han cometido con seguridad un comportamiento sensible y cuántas otras personas creen que conocen ese comportamiento. A partir de la respuesta se pueden derivar estimaciones poblacionales de comportamientos.
La metodología similar del mejor amigo pregunta al participante sobre el comportamiento de un mejor amigo. [28]
La técnica del conteo no coincidente pide a los encuestados que indiquen cuántos elementos de una lista de varios elementos han hecho o son verdaderos para ellos. [29] Los encuestados son asignados al azar para recibir una lista de elementos no sensibles o esa misma lista más el elemento sensible de interés. Las diferencias en el número total de ítems entre los dos grupos indican cuántos de los del grupo que recibió el ítem sensible dijeron que sí.
El método de respuesta agrupada, también conocido como método de dos o tres tarjetas, combina opciones de respuesta de modo que la respuesta sensible se combina con al menos una opción de respuesta no sensible. [30]
Estos métodos piden a los participantes que seleccionen una respuesta basada en dos o más preguntas, de las cuales sólo una es sensible. [31] Por ejemplo, a un participante se le preguntará si su año de nacimiento es par y si ha realizado una actividad ilegal; si respondió sí a ambas o no a ambas, seleccione A, y si respondió sí a una pero no a la otra, seleccione B. Al combinar preguntas sensibles y no sensibles, se enmascara la respuesta del participante al elemento sensible. Las investigaciones muestran que la validez del modelo transversal es limitada. [32]
Las técnicas de canalización falsa son aquellas en las que un participante cree que se utilizará una prueba objetiva, como un detector de mentiras, junto con la respuesta a la encuesta, independientemente de que esa prueba o procedimiento se utilice realmente o no. [1]
El "estilo de respuesta extrema" (ERS) adopta la forma de preferencia exagerada por las extremidades, por ejemplo, '1' o '7' en escalas de 7 puntos. Su opuesto, el "sesgo de moderación", implica una preferencia por respuestas de rango medio (o punto medio) (por ejemplo, 3 a 5 en escalas de 7 puntos).
"Aquiescencia" (ARS) es la tendencia a responder a elementos con acuerdo/afirmación independientemente de su contenido (decir "sí").
Este tipo de estilos de respuesta difieren del sesgo de deseabilidad social en que no están relacionados con el contenido de la pregunta y pueden estar presentes tanto en contextos socialmente neutrales como socialmente favorables o desfavorables, mientras que el SDR está, por definición, vinculado a este último.