Los experimentos de campo son experimentos que se llevan a cabo fuera del entorno de laboratorio .
Asignan aleatoriamente sujetos (u otras unidades de muestreo) a grupos de tratamiento o de control para probar afirmaciones de relaciones causales . La asignación aleatoria ayuda a establecer la comparabilidad del grupo de tratamiento y control de modo que cualquier diferencia entre ellos que surja después de que se haya administrado el tratamiento refleje plausiblemente la influencia del tratamiento en lugar de diferencias preexistentes entre los grupos. Las características distintivas de los experimentos de campo son que se llevan a cabo en entornos del mundo real y, a menudo, de manera discreta y controlan no solo el grupo de sujetos, sino también la selección y la franqueza, como lo definen líderes como John A. List . Esto contrasta con los experimentos de laboratorio, que imponen el control científico al probar una hipótesis en el entorno artificial y altamente controlado de un laboratorio. Los experimentos de campo también tienen algunas diferencias contextuales con respecto a los experimentos que ocurren naturalmente y los cuasi experimentos. [1] Mientras que los experimentos que ocurren naturalmente dependen de una fuerza externa (por ejemplo, un gobierno, una organización sin fines de lucro, etc.) que controla la asignación aleatoria del tratamiento y la implementación, los experimentos de campo requieren que los investigadores mantengan el control sobre la aleatorización y la implementación. Los cuasi-experimentos ocurren cuando los tratamientos se administran como si fueran aleatorios (por ejemplo, distritos del Congreso de los EE. UU. donde los candidatos ganan con márgenes estrechos, [2] patrones climáticos, desastres naturales, etc.).
Los experimentos de campo abarcan una amplia gama de diseños experimentales, cada uno con distintos grados de generalidad. Algunos criterios de generalidad (por ejemplo, la autenticidad de los tratamientos, los participantes, los contextos y las medidas de resultados) se refieren a las similitudes contextuales entre los sujetos de la muestra experimental y el resto de la población. Se utilizan cada vez más en las ciencias sociales para estudiar los efectos de las intervenciones relacionadas con las políticas en ámbitos como la salud, la educación, la delincuencia, el bienestar social y la política.
En la asignación aleatoria, los resultados de los experimentos de campo reflejan el mundo real porque los sujetos se asignan a grupos en función de probabilidades no deterministas. [3] Otros dos supuestos básicos sustentan la capacidad del investigador para recopilar resultados potenciales imparciales: excluibilidad y no interferencia. [4] [5] El supuesto de excluibilidad establece que el único agente causal relevante es la recepción del tratamiento. Las asimetrías en la asignación, administración o medición de los grupos de tratamiento y control violan este supuesto. El supuesto de no interferencia, o Supuesto de Valor de Tratamiento Unitario Estable (SUTVA), indica que el valor del resultado depende solo de si al sujeto se le asigna o no el tratamiento y no de si otros sujetos son asignados o no al tratamiento. Cuando se cumplen estos tres supuestos básicos, los investigadores tienen más probabilidades de proporcionar estimaciones imparciales a través de experimentos de campo.
Después de diseñar el experimento de campo y reunir los datos, los investigadores pueden utilizar pruebas de inferencia estadística para determinar el tamaño y la fuerza del efecto de la intervención en los sujetos. Los experimentos de campo permiten a los investigadores recopilar diversas cantidades y tipos de datos. Por ejemplo, un investigador podría diseñar un experimento que utilice información previa y posterior al ensayo en un método de inferencia estadística adecuado para ver si una intervención tiene un efecto sobre los cambios en los resultados a nivel de los sujetos.
Los experimentos de campo ofrecen a los investigadores una forma de probar teorías y responder preguntas con mayor validez externa porque simulan sucesos del mundo real. [6] Algunos investigadores sostienen que los experimentos de campo son una mejor protección contra el sesgo potencial y los estimadores sesgados . Además, los experimentos de campo pueden actuar como puntos de referencia para comparar datos observacionales con resultados experimentales. El uso de experimentos de campo como puntos de referencia puede ayudar a determinar los niveles de sesgo en los estudios observacionales y, dado que los investigadores a menudo desarrollan una hipótesis a partir de un juicio a priori, los puntos de referencia pueden ayudar a agregar credibilidad a un estudio. [7] Si bien algunos sostienen que el ajuste de covariables o los diseños de emparejamiento podrían funcionar igual de bien para eliminar el sesgo, los experimentos de campo pueden aumentar la certeza [8] al desplazar el sesgo de variable omitida porque asignan mejor los factores observados y no observados. [9]
Los investigadores pueden utilizar métodos de aprendizaje automático para simular, reponderar y generalizar datos experimentales. [10] Esto aumenta la velocidad y la eficiencia de la recopilación de resultados experimentales y reduce los costos de implementación del experimento. Otra técnica de vanguardia en experimentos de campo es el uso del diseño de bandido multiarmado , [11] que incluye diseños adaptativos similares en experimentos con resultados variables y tratamientos variables a lo largo del tiempo. [12]
Existen limitaciones y argumentos en contra del uso de experimentos de campo en lugar de otros diseños de investigación (por ejemplo, experimentos de laboratorio, experimentos de encuesta, estudios observacionales, etc.). Dado que los experimentos de campo necesariamente tienen lugar en un entorno geográfico y político específico, existe una preocupación sobre la extrapolación de los resultados para formular una teoría general sobre la población de interés. Sin embargo, los investigadores han comenzado a encontrar estrategias para generalizar eficazmente los efectos causales fuera de la muestra comparando los entornos de la población tratada y la población externa, accediendo a la información de un tamaño de muestra más grande y teniendo en cuenta y modelando la heterogeneidad de los efectos del tratamiento dentro de la muestra. [13] Otros han utilizado técnicas de bloqueo de covariables para generalizar desde las poblaciones de experimentos de campo a las poblaciones externas. [14]
Los problemas de incumplimiento que afectan a los experimentos de campo (tanto el incumplimiento unilateral como el bilateral) [15] [16] pueden ocurrir cuando los sujetos que están asignados a un determinado grupo nunca reciben la intervención asignada. Otros problemas para la recopilación de datos incluyen la deserción (cuando los sujetos que reciben tratamiento no proporcionan datos de resultados) que, en determinadas condiciones, sesgará los datos recopilados. Estos problemas pueden conducir a un análisis impreciso de los datos; sin embargo, los investigadores que utilizan experimentos de campo pueden utilizar métodos estadísticos para calcular información útil incluso cuando se producen estas dificultades. [16]
El uso de experimentos de campo también puede generar inquietudes sobre la interferencia [17] entre sujetos. Cuando un sujeto o grupo tratado afecta los resultados del grupo no tratado (a través de condiciones como desplazamiento, comunicación, contagio, etc.), los grupos no tratados podrían no tener un resultado que sea el verdadero resultado sin tratamiento. Un subconjunto de la interferencia es el efecto de derrame, que ocurre cuando el tratamiento de los grupos tratados tiene un efecto sobre los grupos vecinos no tratados.
Los experimentos de campo pueden ser costosos, llevar mucho tiempo, ser difíciles de replicar y estar plagados de problemas éticos. Los sujetos o las poblaciones pueden socavar el proceso de implementación si existe una percepción de injusticia en la selección del tratamiento (por ejemplo, en experimentos de " impuestos negativos a la renta ", las comunidades pueden presionar para que su comunidad obtenga una transferencia de efectivo para que la asignación no sea puramente aleatoria). Existen limitaciones para recopilar formularios de consentimiento de todos los sujetos. Los compañeros que administran intervenciones o recopilan datos podrían contaminar el esquema de aleatorización. Por lo tanto, los datos resultantes podrían ser más variados: mayor desviación estándar , menor precisión y exactitud , etc. Esto conduce al uso de tamaños de muestra más grandes para las pruebas de campo. Sin embargo, otros argumentan que, aunque la replicabilidad es difícil, si los resultados del experimento son importantes, entonces hay una mayor probabilidad de que el experimento se replique. Además, los experimentos de campo pueden adoptar un diseño de " cuña escalonada " que eventualmente dará a toda la muestra acceso a la intervención en diferentes cronogramas de tiempo. [18] Los investigadores también pueden diseñar un experimento de campo ciego para eliminar las posibilidades de manipulación.
La historia de los experimentos en el laboratorio y en el campo ha dejado impactos duraderos en las ciencias físicas, naturales y de la vida. El uso moderno de los experimentos de campo tiene sus raíces en el siglo XVIII, cuando James Lind utilizó un experimento de campo controlado para identificar un tratamiento para el escorbuto . [19]
Otros ejemplos categóricos de ciencias que utilizan experimentos de campo incluyen: