Experimento de campo

Los experimentos de campo son experimentos que se llevan a cabo fuera del entorno de laboratorio .

Asignan aleatoriamente sujetos (u otras unidades de muestreo) a grupos de tratamiento o de control para probar afirmaciones de relaciones causales . La asignación aleatoria ayuda a establecer la comparabilidad del grupo de tratamiento y control de modo que cualquier diferencia entre ellos que surja después de que se haya administrado el tratamiento refleje plausiblemente la influencia del tratamiento en lugar de diferencias preexistentes entre los grupos. Las características distintivas de los experimentos de campo son que se llevan a cabo en entornos del mundo real y, a menudo, de manera discreta y controlan no solo el grupo de sujetos, sino también la selección y la franqueza, como lo definen líderes como John A. List . Esto contrasta con los experimentos de laboratorio, que imponen el control científico al probar una hipótesis en el entorno artificial y altamente controlado de un laboratorio. Los experimentos de campo también tienen algunas diferencias contextuales con respecto a los experimentos que ocurren naturalmente y los cuasi experimentos. ^[1] Mientras que los experimentos que ocurren naturalmente dependen de una fuerza externa (por ejemplo, un gobierno, una organización sin fines de lucro, etc.) que controla la asignación aleatoria del tratamiento y la implementación, los experimentos de campo requieren que los investigadores mantengan el control sobre la aleatorización y la implementación. Los cuasi-experimentos ocurren cuando los tratamientos se administran como si fueran aleatorios (por ejemplo, distritos del Congreso de los EE. UU. donde los candidatos ganan con márgenes estrechos, ^[2] patrones climáticos, desastres naturales, etc.).

Los experimentos de campo abarcan una amplia gama de diseños experimentales, cada uno con distintos grados de generalidad. Algunos criterios de generalidad (por ejemplo, la autenticidad de los tratamientos, los participantes, los contextos y las medidas de resultados) se refieren a las similitudes contextuales entre los sujetos de la muestra experimental y el resto de la población. Se utilizan cada vez más en las ciencias sociales para estudiar los efectos de las intervenciones relacionadas con las políticas en ámbitos como la salud, la educación, la delincuencia, el bienestar social y la política.

Características

En la asignación aleatoria, los resultados de los experimentos de campo reflejan el mundo real porque los sujetos se asignan a grupos en función de probabilidades no deterministas. ^[3] Otros dos supuestos básicos sustentan la capacidad del investigador para recopilar resultados potenciales imparciales: excluibilidad y no interferencia. ^[4]^[5] El supuesto de excluibilidad establece que el único agente causal relevante es la recepción del tratamiento. Las asimetrías en la asignación, administración o medición de los grupos de tratamiento y control violan este supuesto. El supuesto de no interferencia, o Supuesto de Valor de Tratamiento Unitario Estable (SUTVA), indica que el valor del resultado depende solo de si al sujeto se le asigna o no el tratamiento y no de si otros sujetos son asignados o no al tratamiento. Cuando se cumplen estos tres supuestos básicos, los investigadores tienen más probabilidades de proporcionar estimaciones imparciales a través de experimentos de campo.

Después de diseñar el experimento de campo y reunir los datos, los investigadores pueden utilizar pruebas de inferencia estadística para determinar el tamaño y la fuerza del efecto de la intervención en los sujetos. Los experimentos de campo permiten a los investigadores recopilar diversas cantidades y tipos de datos. Por ejemplo, un investigador podría diseñar un experimento que utilice información previa y posterior al ensayo en un método de inferencia estadística adecuado para ver si una intervención tiene un efecto sobre los cambios en los resultados a nivel de los sujetos.

Usos prácticos

Los experimentos de campo ofrecen a los investigadores una forma de probar teorías y responder preguntas con mayor validez externa porque simulan sucesos del mundo real. ^[6] Algunos investigadores sostienen que los experimentos de campo son una mejor protección contra el sesgo potencial y los estimadores sesgados . Además, los experimentos de campo pueden actuar como puntos de referencia para comparar datos observacionales con resultados experimentales. El uso de experimentos de campo como puntos de referencia puede ayudar a determinar los niveles de sesgo en los estudios observacionales y, dado que los investigadores a menudo desarrollan una hipótesis a partir de un juicio a priori, los puntos de referencia pueden ayudar a agregar credibilidad a un estudio. ^[7] Si bien algunos sostienen que el ajuste de covariables o los diseños de emparejamiento podrían funcionar igual de bien para eliminar el sesgo, los experimentos de campo pueden aumentar la certeza ^[8] al desplazar el sesgo de variable omitida porque asignan mejor los factores observados y no observados. ^[9]

Los investigadores pueden utilizar métodos de aprendizaje automático para simular, reponderar y generalizar datos experimentales. ^[10] Esto aumenta la velocidad y la eficiencia de la recopilación de resultados experimentales y reduce los costos de implementación del experimento. Otra técnica de vanguardia en experimentos de campo es el uso del diseño de bandido multiarmado , ^[11] que incluye diseños adaptativos similares en experimentos con resultados variables y tratamientos variables a lo largo del tiempo. ^[12]

Limitaciones

Existen limitaciones y argumentos en contra del uso de experimentos de campo en lugar de otros diseños de investigación (por ejemplo, experimentos de laboratorio, experimentos de encuesta, estudios observacionales, etc.). Dado que los experimentos de campo necesariamente tienen lugar en un entorno geográfico y político específico, existe una preocupación sobre la extrapolación de los resultados para formular una teoría general sobre la población de interés. Sin embargo, los investigadores han comenzado a encontrar estrategias para generalizar eficazmente los efectos causales fuera de la muestra comparando los entornos de la población tratada y la población externa, accediendo a la información de un tamaño de muestra más grande y teniendo en cuenta y modelando la heterogeneidad de los efectos del tratamiento dentro de la muestra. ^[13] Otros han utilizado técnicas de bloqueo de covariables para generalizar desde las poblaciones de experimentos de campo a las poblaciones externas. ^[14]

Los problemas de incumplimiento que afectan a los experimentos de campo (tanto el incumplimiento unilateral como el bilateral) ^[15]^[16] pueden ocurrir cuando los sujetos que están asignados a un determinado grupo nunca reciben la intervención asignada. Otros problemas para la recopilación de datos incluyen la deserción (cuando los sujetos que reciben tratamiento no proporcionan datos de resultados) que, en determinadas condiciones, sesgará los datos recopilados. Estos problemas pueden conducir a un análisis impreciso de los datos; sin embargo, los investigadores que utilizan experimentos de campo pueden utilizar métodos estadísticos para calcular información útil incluso cuando se producen estas dificultades. ^[16]

El uso de experimentos de campo también puede generar inquietudes sobre la interferencia ^[17] entre sujetos. Cuando un sujeto o grupo tratado afecta los resultados del grupo no tratado (a través de condiciones como desplazamiento, comunicación, contagio, etc.), los grupos no tratados podrían no tener un resultado que sea el verdadero resultado sin tratamiento. Un subconjunto de la interferencia es el efecto de derrame, que ocurre cuando el tratamiento de los grupos tratados tiene un efecto sobre los grupos vecinos no tratados.

Los experimentos de campo pueden ser costosos, llevar mucho tiempo, ser difíciles de replicar y estar plagados de problemas éticos. Los sujetos o las poblaciones pueden socavar el proceso de implementación si existe una percepción de injusticia en la selección del tratamiento (por ejemplo, en experimentos de " impuestos negativos a la renta ", las comunidades pueden presionar para que su comunidad obtenga una transferencia de efectivo para que la asignación no sea puramente aleatoria). Existen limitaciones para recopilar formularios de consentimiento de todos los sujetos. Los compañeros que administran intervenciones o recopilan datos podrían contaminar el esquema de aleatorización. Por lo tanto, los datos resultantes podrían ser más variados: mayor desviación estándar , menor precisión y exactitud , etc. Esto conduce al uso de tamaños de muestra más grandes para las pruebas de campo. Sin embargo, otros argumentan que, aunque la replicabilidad es difícil, si los resultados del experimento son importantes, entonces hay una mayor probabilidad de que el experimento se replique. Además, los experimentos de campo pueden adoptar un diseño de " cuña escalonada " que eventualmente dará a toda la muestra acceso a la intervención en diferentes cronogramas de tiempo. ^[18] Los investigadores también pueden diseñar un experimento de campo ciego para eliminar las posibilidades de manipulación.

Ejemplos

La historia de los experimentos en el laboratorio y en el campo ha dejado impactos duraderos en las ciencias físicas, naturales y de la vida. El uso moderno de los experimentos de campo tiene sus raíces en el siglo XVIII, cuando James Lind utilizó un experimento de campo controlado para identificar un tratamiento para el escorbuto . ^[19]

Otros ejemplos categóricos de ciencias que utilizan experimentos de campo incluyen:

Los economistas han utilizado experimentos de campo para analizar la discriminación (por ejemplo, en el mercado laboral, ^[20]^[21] en la vivienda, ^[22] en la economía colaborativa, ^[23] en el mercado crediticio, ^[24] o en la integración ^[25] ), los programas de atención sanitaria , ^[26] la recaudación de fondos de caridad , ^[27] la educación , ^[28] la agregación de información en los mercados y los programas de microfinanzas . ^[29]
Los ingenieros a menudo realizan pruebas de campo de productos prototipo para validar pruebas de laboratorio anteriores y obtener una retroalimentación más amplia.
La psicología social tiene figuras pioneras que utilizaron experimentos de campo, entre ellos Kurt Lewin y Stanley Milgram .
El investigador en ciencias agrícolas RA Fisher analizó datos experimentales de "campo" reales y aleatorios ^[30] para cultivos.
El investigador de ciencias políticas Harold Gosnell realizó un experimento de campo temprano sobre la participación electoral en 1924 y 1925. ^[31]
Ecología Experimento de campo de Joseph H. Connell . ^[32]

Véase también

Investigación de campo

Referencias

^ Meyer, BD (1995). "Experimentos naturales y cuasi-experimentos en economía" (PDF) . Journal of Business & Economic Statistics . 13 (2): 151–161. doi :10.2307/1392369. JSTOR 1392369.
^ Lee, DS; Moretti, E.; Butler, MJ (2004). "¿Los votantes afectan o eligen las políticas? Evidencia de la Cámara de Representantes de Estados Unidos". The Quarterly Journal of Economics . 119 (3): 807–859. doi :10.1162/0033553041502153. JSTOR 25098703.
^ Rubin, Donald B. (2005). "Inferencia causal utilizando resultados potenciales". Revista de la Asociación Estadounidense de Estadística . 100 (469): 322–331. doi :10.1198/016214504000001880. S2CID 842793.
^ Nyman, Pär (2017). "El sondeo puerta a puerta en las elecciones europeas: evidencia de un experimento de campo sueco". Estudios Electorales . 45 : 110–118. doi :10.1016/j.electstud.2016.12.002.
^ Broockman, David E.; Kalla, Joshua L.; Sekhon, Jasjeet S. (2017). "El diseño de experimentos de campo con resultados de encuestas: un marco para seleccionar diseños más eficientes, robustos y éticos". Análisis político . 25 (4): 435–464. doi :10.1017/pan.2017.27. S2CID 233321039.
^ Duflo, Esther (2006). Experimentos de campo en economía del desarrollo (informe). Instituto Tecnológico de Massachusetts.
^ Harrison, GW; List, JA (2004). "Experimentos de campo". Revista de literatura económica . 42 (4): 1009–1055. doi :10.1257/0022051043004577. JSTOR 3594915.
^ LaLonde, RJ (1986). "Evaluación de las evaluaciones econométricas de programas de capacitación con datos experimentales". The American Economic Review . 76 (4): 604–620. JSTOR 1806062.
^ Gordon, Brett R.; Zettelmeyer, Florian; Bhargava, Neha; Chapsky, Dan (2017). "Una comparación de enfoques para la medición de la publicidad: evidencia de grandes experimentos de campo en Facebook". Marketing Science . doi :10.2139/ssrn.3033144. S2CID 197733986.
^ Athey, Susan ; Imbens, Guido (2016). "Particionado recursivo para efectos causales heterogéneos: Tabla 1". Actas de la Academia Nacional de Ciencias . 113 (27): 7353–7360. doi : 10.1073/pnas.1510489113 . PMC 4941430 . PMID 27382149.
^ Scott, Steven L. (2010). "Una mirada bayesiana moderna al bandido multibrazo". Modelos estocásticos aplicados en los negocios y la industria . 26 (6): 639–658. doi :10.1002/asmb.874.
^ Raj, V.; Kalyani, S. (2017). "Domar bandidos no estacionarios: un enfoque bayesiano". arXiv : 1707.09727 [stat.ML].
^ Dehejia, R.; Pop-Eleches, C.; Samii, C. (2015). De lo local a lo global: validez externa en un experimento natural de fertilidad (PDF) (Informe). Oficina Nacional de Investigación Económica. w21459.
^ Egami, Naoki; Hartman, Erin (19 de julio de 2018). "Selección de covariables para generalizar resultados experimentales" (PDF) . Princeton.edu . Archivado desde el original (PDF) el 10 de julio de 2020 . Consultado el 31 de diciembre de 2018 .
^ Blackwell, Matthew (2017). "Métodos de variables instrumentales para efectos condicionales e interacción causal en experimentos de movilización de votantes". Revista de la Asociación Estadounidense de Estadística . 112 (518): 590–599. doi :10.1080/01621459.2016.1246363. S2CID 55878137.
^ ab Aronow, Peter M.; Carnegie, Allison (2013). "Más allá de LATE: estimación del efecto promedio del tratamiento con una variable instrumental". Political Analysis . 21 (4): 492–506. doi :10.1093/pan/mpt013.
^ Aronow, PM; Samii, C. (2017). "Estimación de efectos causales promedio bajo interferencia general, con aplicación a un experimento de redes sociales". Anales de estadística aplicada . 11 (4): 1912–1947. arXiv : 1305.6156 . doi :10.1214/16-AOAS1005. S2CID 26963450.
^ Woertman, W.; de Hoop, E.; Moerbeek, M.; Zuidema, SU; Gerritsen, DL; Teerenstra, S. (2013). "Los diseños de cuña escalonada podrían reducir el tamaño de muestra requerido en ensayos aleatorizados por conglomerados". Journal of Clinical Epidemiology . 66 (7): 752–758. doi : 10.1016/j.jclinepi.2013.01.009 . hdl : 2066/117688 . PMID 23523551.
^ Tröhler, U. (2005). "Lind y el escorbuto: 1747 a 1795". Revista de la Royal Society of Medicine . 98 (11): 519–522. doi :10.1177/014107680509801120. PMC 1276007 . PMID 16260808.
^ Bertrand, Marianne; Mullainathan, Sendhil (2004). "¿Son Emily y Greg más empleables que Lakisha y Jamal? Un experimento de campo sobre discriminación en el mercado laboral" (PDF) . American Economic Review . 94 (4): 991–1013. doi :10.1257/0002828042002561.
^ Gneezy, Uri; List, John A (2006). "Poniendo en práctica la economía conductual: probando el intercambio de regalos en los mercados laborales mediante experimentos de campo" (PDF) . Econometrica . 74 (5): 1365–1384. doi :10.1111/j.1468-0262.2006.00707.x.
^ Ahmed, Ali M; Hammarstedt, Mats (2008). "Discriminación en el mercado de alquiler de viviendas: un experimento de campo en Internet". Journal of Urban Economics . 64 (2): 362–372. doi :10.1016/j.jue.2008.02.004.
^ Edelman, Benjamin; Luca, Michael; Svirsky, Dan (2017). "Discriminación racial en la economía colaborativa: evidencia de un experimento de campo". American Economic Journal: Applied Economics . 9 (2): 1–22. doi : 10.1257/app.20160213 .
^ Pager, Devah; Shepherd, Hana (2008). "La sociología de la discriminación: discriminación racial en el empleo, la vivienda, el crédito y los mercados de consumo". Revista Anual de Sociología . 34 : 181–209. doi :10.1146/annurev.soc.33.040406.131740. PMC 2915460 . PMID 20689680.
^ Nesseler, Cornel; Carlos, Gomez-Gonzalez; Dietl, Helmut (2019). "¿Qué hay en un nombre? Medición del acceso a actividades sociales con un experimento de campo". Palgrave Communications . 5 : 1–7. doi : 10.1057/s41599-019-0372-0 . hdl : 11250/2635691 .
^ Ashraf, Nava; Berry, James; Shapiro, Jesse M (2010). "¿Pueden los precios más altos estimular el uso de productos? Evidencia de un experimento de campo en Zambia" (PDF) . American Economic Review . 100 (5): 2383–2413. doi :10.1257/aer.100.5.2383. S2CID 6392533.
^ Karlan, Dean; List, John A (2007). "¿Importa el precio en las donaciones caritativas? Evidencia de un experimento de campo natural a gran escala" (PDF) . American Economic Review . 97 (5): 1774–1793. doi :10.1257/aer.97.5.1774. S2CID 10041821.
^ Fryer Jr, Roland G (2014). "Inyección de las mejores prácticas de las escuelas charter en las escuelas públicas tradicionales: evidencia de experimentos de campo". The Quarterly Journal of Economics . 129 (3): 1355–1407. doi :10.1093/qje/qju011.
^ Field, Erica; Pande, Rohini (2008). "Frecuencia de reembolso y morosidad en las microfinanzas: evidencia de la India". Revista de la Asociación Económica Europea . 6 (2–3): 501–509. doi :10.1162/JEEA.2008.6.2-3.501.
^ Fisher, RA (1937). El diseño de experimentos (PDF) . Oliver and Boyd Ltd.
^ Gosnell, Harold F. (1926). "Un experimento sobre la estimulación del voto". American Political Science Review . 20 (4): 869–874. doi : 10.1017/S0003055400110524 .
^ Grodwohl, Jean-Baptiste; Porto, Franco; El-Hani, Charbel N. (31 de julio de 2018). "La inestabilidad de los experimentos de campo: la construcción de una tradición de investigación experimental en las costas rocosas (1950-1985)". Historia y filosofía de las ciencias de la vida . 40 (3): 45. doi :10.1007/s40656-018-0209-y. ISSN 1742-6316. PMID 30066110. S2CID 51889466.