Validez interna

La validez interna es el grado en que una evidencia respalda una afirmación sobre causa y efecto , dentro del contexto de un estudio particular. Es una de las propiedades más importantes de los estudios científicos y es un concepto importante en el razonamiento sobre la evidencia en general. La validez interna está determinada por qué tan bien un estudio puede descartar explicaciones alternativas para sus hallazgos (generalmente, fuentes de error sistemático o "sesgo"). Contrasta con la validez externa , el grado en que los resultados pueden justificar conclusiones sobre otros contextos (es decir, el grado en que los resultados pueden generalizarse ). Tanto la validez interna como la externa se pueden describir utilizando formas cualitativas o cuantitativas de notación causal .

Detalles

Se dice que las inferencias poseen validez interna si se demuestra adecuadamente una relación causal entre dos variables . ^[1]^[2] Se puede hacer una inferencia causal válida cuando se satisfacen tres criterios:

la "causa" precede al "efecto" en el tiempo (precedencia temporal),
la "causa" y el "efecto" tienden a ocurrir juntos (covariación), y
No existen explicaciones alternativas plausibles para la covariación observada (no espuria). ^[2]

En entornos experimentales científicos, los investigadores a menudo cambian el estado de una variable (la variable independiente ) para ver qué efecto tiene sobre una segunda variable (la variable dependiente ). ^[3] Por ejemplo, un investigador podría manipular la dosis de un medicamento en particular entre diferentes grupos de personas para ver qué efecto tiene sobre la salud. En este ejemplo, el investigador quiere hacer una inferencia causal, es decir, que diferentes dosis del fármaco pueden ser consideradas responsables de los cambios o diferencias observados. Cuando el investigador puede atribuir con confianza los cambios o diferencias observados en la variable dependiente a la variable independiente (es decir, cuando el investigador observa una asociación entre estas variables y puede descartar otras explicaciones o hipótesis rivales ), entonces se dice que la inferencia causal tener validez interna. ^[4]

Sin embargo, en muchos casos, la magnitud de los efectos encontrados en la variable dependiente puede no depender sólo de

variaciones en la variable independiente,
el poder de los instrumentos y procedimientos estadísticos utilizados para medir y detectar los efectos, y
la elección de los métodos estadísticos (ver: Validez de las conclusiones estadísticas ).

Más bien, una serie de variables o circunstancias no controladas (o incontrolables) pueden conducir a explicaciones adicionales o alternativas (a) para los efectos encontrados y/o (b) para la magnitud de los efectos encontrados. La validez interna, por lo tanto, es más una cuestión de grado que de una u otra, y es exactamente por eso que los diseños de investigación distintos de los verdaderos experimentos también pueden producir resultados con un alto grado de validez interna.

Para permitir inferencias con un alto grado de validez interna, se pueden tomar precauciones durante el diseño del estudio. Como regla general, las conclusiones basadas en la manipulación directa de la variable independiente permiten una mayor validez interna que las conclusiones basadas en una asociación observada sin manipulación.

Cuando se considera únicamente la validez interna, los diseños experimentales verdaderos altamente controlados (es decir, con selección aleatoria, asignación aleatoria al grupo de control o experimental, instrumentos confiables, procesos de manipulación confiables y salvaguardias contra factores de confusión) pueden ser el "estándar de oro" de la investigación científica. . Sin embargo, los propios métodos utilizados para aumentar la validez interna también pueden limitar la generalización o la validez externa de los hallazgos. Por ejemplo, estudiar el comportamiento de los animales en un zoológico puede hacer que sea más fácil sacar inferencias causales válidas dentro de ese contexto, pero es posible que estas inferencias no se generalicen al comportamiento de los animales en la naturaleza. En general, un experimento típico en un laboratorio, que estudia un proceso particular, puede dejar de lado muchas variables que normalmente afectan fuertemente ese proceso en la naturaleza.

Ejemplos de amenazas

Para recordar ocho de estas amenazas a la validez interna, utilice el acrónimo mnemotécnico , THIS MESS , ^[5] que significa:

Pruebas,
Historia,
cambio de instrumento,
Regresión estadística hacia la media,
Maduración,
Mortalidad experimental,
Selección, y
Interacción de selección.

Precedencia temporal ambigua

Cuando no se sabe qué variable cambió primero, puede resultar difícil determinar qué variable es la causa y cuál el efecto.

confuso

Una amenaza importante a la validez de las inferencias causales es la confusión : los cambios en la variable dependiente pueden atribuirse más bien a variaciones en una tercera variable que está relacionada con la variable manipulada. Cuando no se pueden descartar relaciones espurias , se pueden desarrollar hipótesis rivales de la inferencia causal original.

Sesgo de selección

El sesgo de selección se refiere al problema de que, en la prueba previa, existen diferencias entre grupos que pueden interactuar con la variable independiente y, por lo tanto, ser "responsables" del resultado observado. Los investigadores y participantes aportan al experimento una infinidad de características, algunas aprendidas y otras inherentes. Por ejemplo, sexo, peso, color de cabello, ojos y piel, personalidad, capacidades mentales y físicas, pero también actitudes como la motivación o la voluntad de participar.

Durante la etapa de selección del estudio de investigación, si un número desigual de sujetos de prueba tienen variables similares relacionadas con el sujeto, existe una amenaza a la validez interna. Por ejemplo, un investigador creó dos grupos de prueba, el experimental y el de control. Los sujetos de ambos grupos no son iguales con respecto a la variable independiente, pero sí en una o más de las variables relacionadas con el sujeto.

La autoselección también tiene un efecto negativo sobre el poder interpretativo de la variable dependiente. Esto ocurre a menudo en encuestas en línea donde personas de grupos demográficos específicos optan por participar en la prueba en mayor proporción que otros grupos demográficos.

Historia

Eventos fuera del estudio/experimento o entre medidas repetidas de la variable dependiente pueden afectar las respuestas de los participantes a los procedimientos experimentales. A menudo, se trata de eventos a gran escala (desastre natural, cambios políticos, etc.) que afectan las actitudes y comportamientos de los participantes de tal manera que resulta imposible determinar si algún cambio en las medidas dependientes se debe a la variable independiente o al evento histórico. .

Maduración

Los sujetos cambian durante el transcurso del experimento o incluso entre mediciones. Por ejemplo, los niños pequeños pueden madurar y su capacidad de concentración puede cambiar a medida que crecen. Tanto los cambios permanentes, como el crecimiento físico, como los temporales, como la fatiga, proporcionan explicaciones alternativas "naturales"; por tanto, pueden cambiar la forma en que un sujeto reaccionaría ante la variable independiente. Por lo tanto, al finalizar el estudio, es posible que el investigador no pueda determinar si la causa de la discrepancia se debe al tiempo o a la variable independiente.

Pruebas repetidas (también conocidas como efectos de prueba)

Medir repetidamente a los participantes puede generar sesgos. Los participantes pueden recordar las respuestas correctas o pueden estar condicionados a saber que están siendo evaluados. Realizar repetidamente pruebas de inteligencia (iguales o similares) generalmente conduce a mejoras en la puntuación, pero en lugar de concluir que las habilidades subyacentes han cambiado para siempre, esta amenaza a la validez interna proporciona una buena hipótesis rival.

Cambio de instrumento (instrumentalidad)

El instrumento utilizado durante el proceso de prueba puede cambiar el experimento. Esto también se refiere a que los observadores están más concentrados o preparados, o han cambiado inconscientemente los criterios que utilizan para emitir juicios. Esto también puede ser un problema con las medidas de autoinforme dadas en diferentes momentos. En este caso, el impacto puede mitigarse mediante el uso de pruebas previas retrospectivas. Si se produce algún cambio en la instrumentación, la validez interna de la conclusión principal se ve afectada, ya que hay explicaciones alternativas disponibles.

Regresión hacia la media

Este tipo de error ocurre cuando los sujetos son seleccionados en base a puntuaciones extremas (una muy alejada de la media) durante una prueba. Por ejemplo, cuando se selecciona a niños con las peores puntuaciones en lectura para participar en un curso de lectura, las mejoras al final del curso podrían deberse a una regresión hacia la media y no a la eficacia del curso. Si los niños hubieran sido evaluados nuevamente antes de que comenzara el curso, probablemente habrían obtenido mejores puntajes de todos modos. Del mismo modo, es más probable que se capturen valores atípicos extremos en las puntuaciones individuales en una sola instancia de prueba, pero probablemente evolucionarán hacia una distribución más normal con pruebas repetidas.

Mortalidad/deserción diferencial

Este error ocurre si las inferencias se hacen basándose únicamente en aquellos participantes que han participado desde el principio hasta el final. Sin embargo, es posible que los participantes hayan abandonado el estudio antes de completarlo, y tal vez incluso debido al estudio, programa o experimento en sí. Por ejemplo, se encontró que el porcentaje de miembros del grupo que habían dejado de fumar en la prueba posterior era mucho mayor en un grupo que había recibido un programa de capacitación para dejar de fumar que en el grupo de control. Sin embargo, en el grupo experimental sólo el 60% ha completado el programa. Si este desgaste se relaciona sistemáticamente con alguna característica del estudio, la administración de la variable independiente, la instrumentación, o si el abandono conduce a un sesgo relevante entre grupos, es posible toda una clase de explicaciones alternativas que expliquen las diferencias observadas.

Interacción selección-maduración

Esto ocurre cuando interactúan las variables relacionadas con el sujeto, color de cabello, color de piel, etc., y las variables relacionadas con el tiempo, edad, tamaño físico, etc. Si se produce una discrepancia entre los dos grupos entre las pruebas, la discrepancia puede deberse a las diferencias de edad en las categorías de edad.

Difusión

Si los efectos del tratamiento se extienden de los grupos de tratamiento a los grupos de control, se puede observar una falta de diferencias entre los grupos experimentales y de control. Esto no significa, sin embargo, que la variable independiente no tenga ningún efecto o que no exista relación entre la variable dependiente y la independiente.

Rivalidad compensatoria/desmoralización resentida

El comportamiento en los grupos de control puede alterarse como resultado del estudio. Por ejemplo, los miembros del grupo de control pueden trabajar más duro para asegurarse de que no se demuestre la superioridad esperada del grupo experimental. Nuevamente, esto no significa que la variable independiente no haya producido ningún efecto o que no exista relación entre la variable dependiente y la independiente. Viceversa, los cambios en la variable dependiente sólo pueden verse afectados debido a un grupo de control desmoralizado, que trabaja menos o está menos motivado, no debido a la variable independiente.

Sesgo del experimentador

El sesgo del experimentador ocurre cuando los individuos que están realizando un experimento afectan inadvertidamente el resultado al comportarse inconscientemente de manera diferente a los miembros de los grupos de control y experimentales. Es posible eliminar la posibilidad de sesgo del experimentador mediante el uso de diseños de estudio doble ciego , en los que el experimentador no es consciente de la condición a la que pertenece un participante.

Problema de validez interna mutua

Los experimentos que tienen una alta validez interna pueden producir fenómenos y resultados que no tienen relevancia en la vida real, lo que resulta en el problema de la validez interna mutua. ^[6]^[7] Surge cuando los investigadores utilizan resultados experimentales para desarrollar teorías y luego usan esas teorías para diseñar experimentos de prueba de teorías. Esta retroalimentación mutua entre experimentos y teorías puede conducir a teorías que explican sólo fenómenos y resultados en entornos de laboratorio artificiales, pero no en la vida real.

Ver también

Referencias

^ Cervecero, M. (2000). Diseño de investigación y cuestiones de validez. En Reis, H. y Judd, C. (eds.) Manual de métodos de investigación en psicología social y de la personalidad. Cambridge: Prensa de la Universidad de Cambridge.
^ ab Shadish, W., Cook, T. y Campbell, D. (2002). Diseños experimentales y cuasiexperimentales para la inferencia causal generalizada Boston: Houghton Mifflin.
^ Levine, G. y Parkinson, S. (1994). Métodos experimentales en psicología. Hillsdale, Nueva Jersey: Lawrence Erlbaum.
^ Liebert, RM y Liebert, LL (1995). Ciencia y comportamiento: una introducción a los métodos de investigación psicológica. Englewood Cliffs, Nueva Jersey: Prentice Hall.
^ Wortman, PM (1983). "Investigación en evaluación - Una perspectiva metodológica". Revista Anual de Psicología . 34 : 223–260. doi : 10.1146/annurev.ps.34.020183.001255.
^ Schram, Arthur (1 de junio de 2005). "Artificialidad: la tensión entre validez interna y externa en experimentos económicos". Revista de Metodología Económica . 12 (2): 225–237. doi :10.1080/13501780500086081. ISSN 1350-178X. S2CID 145588503.
^ Lin, casa; Werner, Kaitlyn M.; Inzlicht, Michael (16 de febrero de 2021). "Promesas y peligros de la experimentación: el problema de la validez interna mutua". Perspectivas de la ciencia psicológica . 16 (4): 854–863. doi :10.1177/1745691620974773. ISSN 1745-6916. PMID 33593177. S2CID 231877717.

enlaces externos

Validez interna (Métodos de investigación social)
Validez interna