stringtranslate.com

Autocorrelación filogenética

La autocorrelación filogenética, también conocida como problema de Galton , en honor a Sir Francis Galton , quien la describió, es el problema de extraer inferencias a partir de datos transculturales , debido al fenómeno estadístico ahora llamado autocorrelación . Ahora se reconoce que el problema es general y se aplica a todos los estudios no experimentales y también al diseño experimental . Se describe más simplemente como el problema de las dependencias externas al realizar estimaciones estadísticas cuando los elementos muestreados no son estadísticamente independientes . Preguntar a dos personas de un mismo hogar si ven televisión, por ejemplo, no proporciona respuestas estadísticamente independientes. El tamaño de muestra, n , para observaciones independientes en este caso es uno, no dos. Una vez que se realicen los ajustes adecuados que aborden las dependencias externas, se aplicarán los axiomas de la teoría de la probabilidad sobre la independencia estadística. Estos axiomas son importantes para derivar medidas de varianza , por ejemplo, o pruebas de significancia estadística .

Origen

En 1888, Galton estuvo presente cuando Sir Edward Tylor presentó un artículo en el Real Instituto Antropológico . Tylor había recopilado información sobre las instituciones de matrimonio y ascendencia para 350 culturas y examinó las asociaciones entre estas instituciones y las medidas de complejidad social. Tylor interpretó sus resultados como indicaciones de una secuencia evolutiva general, en la que las instituciones cambian de enfoque de la línea materna a la línea paterna a medida que las sociedades se vuelven cada vez más complejas. Galton no estuvo de acuerdo, señalando que la similitud entre culturas podría deberse a préstamos, podría deberse a una descendencia común o podría deberse al desarrollo evolutivo; Sostuvo que sin controlar el endeudamiento y la descendencia común no se pueden hacer inferencias válidas sobre el desarrollo evolutivo. La crítica de Galton se ha convertido en el epónimo Problema de Galton , [1] : 175  como lo nombró Raoul Naroll , [2] [3] quien propuso las primeras soluciones estadísticas.

A principios del siglo XX se abandonó el evolucionismo unilineal y, con él, la elaboración de inferencias directas a partir de correlaciones con secuencias evolutivas. Sin embargo, las críticas de Galton resultaron igualmente válidas para inferir relaciones funcionales a partir de correlaciones. El problema de la autocorrelación persistía.

Soluciones

El estadístico William S. Gosset desarrolló en 1914 métodos para eliminar la correlación espuria debido a cómo la posición en el tiempo o el espacio afecta las similitudes. Las encuestas electorales actuales tienen un problema similar: cuanto más cerca están las encuestas de las elecciones, menos personas toman sus decisiones de forma independiente y mayor es la falta de confiabilidad de los resultados de las encuestas, especialmente el margen de error o los límites de confianza . El n efectivo de casos independientes de su muestra disminuye a medida que se acerca la elección. La significación estadística disminuye con un tamaño de muestra efectivo más bajo.

El problema surge en las encuestas por muestreo cuando los sociólogos quieren reducir el tiempo de viaje para realizar sus entrevistas y, por lo tanto, dividen su población en conglomerados locales y toman muestras de los conglomerados al azar, luego vuelven a tomar muestras dentro de los conglomerados. Si entrevistan a n personas en grupos de tamaño m, el tamaño efectivo de la muestra (efs) tendría un límite inferior de 1 + ( n − 1) / m si todos en cada grupo fueran idénticos. Cuando sólo hay similitudes parciales dentro de los grupos, la m en esta fórmula debe reducirse en consecuencia. Una fórmula de este tipo es 1 + d ( n − 1) donde d es la correlación intraclase para la estadística en cuestión. [4] En general, la estimación de los ef apropiados depende de la estadística estimada, como por ejemplo, media , chi-cuadrado , correlación , coeficiente de regresión y sus varianzas .

Para estudios transculturales , Murdock y White [5] estimaron el tamaño de los parches de similitudes en su muestra de 186 sociedades. Las cuatro variables que probaron (idioma, economía, integración política y ascendencia) tenían parches de similitudes que variaban desde el tamaño tres hasta el tamaño diez. Una regla general muy burda podría ser dividir la raíz cuadrada de los tamaños de parches de similitud en n , de modo que los tamaños de muestra efectivos sean 58 y 107 para estos parches, respectivamente. Nuevamente, la significación estadística disminuye con un tamaño de muestra efectivo más bajo.

En el análisis moderno se han modelado rezagos espaciales para estimar el grado de globalización en las sociedades modernas. [6]

La dependencia espacial o autocorrelación es un concepto fundamental en geografía. Los métodos desarrollados por geógrafos que miden y controlan la autocorrelación espacial [7] [8] hacen mucho más que reducir la n efectiva para las pruebas de significancia de una correlación. Un ejemplo es la complicada hipótesis de que "la presencia del juego en una sociedad es directamente proporcional a la presencia de dinero comercial y a la presencia de diferencias socioeconómicas considerables y está inversamente relacionada con si la sociedad es o no una sociedad de pastoreo nómada". [9] Las pruebas de esta hipótesis en una muestra de 60 sociedades no lograron rechazar la hipótesis nula. El análisis de autocorrelación, sin embargo, mostró un efecto significativo de las diferencias socioeconómicas. [10]

¿Qué tan prevalente es la autocorrelación entre las variables estudiadas en la investigación transcultural? Una prueba realizada por Anthon Eff sobre 1700 variables en la base de datos acumulativa para la Muestra Intercultural Estándar , publicada en World Cultures, midió el I de Moran para la autocorrelación espacial (distancia), la autocorrelación lingüística (descendencia común) y la autocorrelación en la complejidad cultural (evolución principal). ). "Los resultados sugieren que... sería prudente probar la autocorrelación espacial y filogenética al realizar análisis de regresión con la Muestra Transcultural Estándar". [11] Se ilustra el uso de pruebas de autocorrelación en el análisis exploratorio de datos, mostrando cómo todas las variables en un estudio determinado pueden evaluarse para determinar la no independencia de los casos en términos de distancia, idioma y complejidad cultural. Luego se explican e ilustran los métodos para estimar estos efectos de autocorrelación para la regresión de mínimos cuadrados ordinarios utilizando nuevamente la medida de significancia de autocorrelación de Moran I.

Cuando hay autocorrelación, a menudo se puede eliminar para obtener estimaciones insesgadas de los coeficientes de regresión y sus varianzas mediante la construcción de una variable dependiente reespecificada que esté "retrasada" por ponderaciones de la variable dependiente en otras ubicaciones, donde las ponderaciones son grados de relación. Esta variable dependiente rezagada es endógena y la estimación requiere métodos de mínimos cuadrados de dos etapas o de máxima verosimilitud . [12]

Recursos

Un servidor público, si se usa externamente en http://SocSciCompute.ss.uci.edu Archivado el 20 de febrero de 2016 en Wayback Machine , ofrece datos etnográficos, variables y herramientas para la inferencia con scripts R de Dow (2007) y Eff y Dow (2009) en un marco Galaxy (http://getgalaxy.org) (https://www.xsede.org) respaldado por NSF para que instructores, estudiantes e investigadores realicen modelos de investigación intercultural "CoSSci Galaxy" Archivado 2016- 20-02 en Wayback Machine con controles para el problema de Galton utilizando variables de muestra transcultural estándar en https://web.archive.org/web/20160402201432/https://dl.dropboxusercontent.com/u/9256203/SCCScodebook. TXT.

Oportunidades

En antropología, donde el problema de Tylor fue reconocido por primera vez por el estadístico Galton en 1889, todavía no se reconoce ampliamente que existen ajustes estadísticos estándar para el problema de parches de similitud en los casos observados y oportunidades para nuevos descubrimientos utilizando métodos de autocorrelación. Algunos investigadores transculturales (ver, por ejemplo, Korotayev y de Munck 2003) [13] han comenzado a darse cuenta de que la evidencia de difusión, origen histórico y otras fuentes de similitud entre sociedades o individuos relacionados deberían denominarse Oportunidad de Galton y Activo de Galton en lugar de que el problema de Galton. Los investigadores ahora utilizan rutinariamente análisis de variación longitudinal, transcultural y regional para analizar todas las hipótesis en competencia: relaciones funcionales, difusión , origen histórico común, evolución multilineal , coadaptación con el medio ambiente y dinámicas complejas de interacción social . [14]

Controversias

Dentro de la antropología, el problema de la auocorrelación filogenética a menudo se presenta como motivo para rechazar por completo los estudios comparativos. Dado que el problema es general, común a las ciencias y a la inferencia estadística en general, esta crítica particular a los estudios transculturales o comparativos –y hay muchas– equivale, lógicamente hablando, a un rechazo total de la ciencia y la estadística. Cualquier dato recopilado y analizado por etnógrafos, por ejemplo, está igualmente sujeto a autocorrelación, entendida en su sentido más general. Una crítica de la crítica anticomparativa no se limita a la comparación estadística, ya que se aplicaría también al análisis de texto. Es decir, el análisis y uso del texto en la argumentación está sujeto a crítica en cuanto a la base probatoria de la inferencia. Depender puramente de la retórica no es protección contra la crítica en cuanto a la validez del argumento y su base probatoria.

Sin embargo, hay pocas dudas de que la comunidad de investigadores transculturales ha sido negligente al ignorar la autocorrelación. La investigación de expertos sobre esta pregunta muestra resultados que "sugieren fuertemente que la extensa información sobre pruebas ingenuas de independencia de chi-cuadrado utilizando conjuntos de datos transculturales durante las últimas décadas ha llevado al rechazo incorrecto de hipótesis nulas en niveles mucho más altos que el 5% esperado". tasa." [15] : 247  El investigador concluye que "las teorías incorrectas que han sido 'salvadas' mediante ingenuas pruebas de chi-cuadrado con datos comparativos pueden aún ser probadas más rigurosamente otro día". [15] : 270  Una vez más, la varianza ajustada de una muestra de conglomerados se da como uno multiplicado por 1 + d ( k + 1) donde k es el tamaño promedio de un conglomerado, y se da una corrección más complicada para la varianza de Correlaciones de la tabla de contingencia con r filas y c columnas. Desde que se publicó esta crítica en 1993, y otras similares, más autores han comenzado a adoptar correcciones para el problema de Galton, pero la mayoría en el campo transcultural no lo ha hecho. En consecuencia, una gran proporción de los resultados publicados que se basan en pruebas de significación ingenuas y que adoptan el estándar P < 0,05 en lugar de un estándar P < 0,005 probablemente sean erróneos porque son más susceptibles al error de tipo I , que consiste en rechazar la hipótesis nula. hipótesis cuando es cierta.

Algunos investigadores transculturales rechazan la gravedad del problema de la autocorrelación porque, sostienen, las estimaciones de correlaciones y medias pueden ser insesgadas incluso si hay autocorrelación, débil o fuerte. Sin embargo, sin investigar la autocorrelación, aún pueden estimar erróneamente las estadísticas que tratan de las relaciones entre variables. En el análisis de regresión , por ejemplo, examinar los patrones de residuos autocorrelacionados puede dar pistas importantes sobre terceros factores que pueden afectar las relaciones entre variables pero que no se han incluido en el modelo de regresión. En segundo lugar, si hay grupos de sociedades similares y relacionadas en la muestra, se subestimarán las medidas de varianza, lo que conducirá a conclusiones estadísticas espurias. por ejemplo, exagerar la importancia estadística de las correlaciones. En tercer lugar, la subestimación de la varianza dificulta probar la replicación de resultados de dos muestras diferentes, ya que con mayor frecuencia los resultados serán rechazados por ser similares.

Ver también

Referencias

  1. ^ Medias, George W. Jr. (1968). "Edward Burnett Tylor". Enciclopedia Internacional de las Ciencias Sociales. David L. Sills, editor, Nueva York, Mcmillan Company: v.16, págs. 170-177.
  2. ^ Raoul Naroll (1961). "Dos soluciones al problema de Galton". Filosofía de la Ciencia . 28 : 15-29. doi :10.1086/287778. S2CID  121671403.
  3. ^ Raoul Naroll (1965). "El problema de Galton: la lógica de la investigación transcultural". Investigación social . 32 : 428–451.
  4. ^ "Tamaño de muestra y efecto de diseño" (PDF) . Archivado desde el original (PDF) el 14 de abril de 2006 . Consultado el 1 de noviembre de 2006 .
  5. ^ George P. Murdock y Douglas R. White (1969). "Muestra transcultural estándar". Etnología . 9 : 329–369.
  6. ^ Jahn, Detlef (2006). "La globalización como problema de Galton: el eslabón perdido en el análisis de los patrones de difusión en el desarrollo del estado de bienestar" (PDF) . Organización Internacional . 60 (2): 401–431. doi :10.1017/s0020818306060127. S2CID  154976704.abstracto
  7. ^ Cliff, AD y JK Ord. 1973. Autocorrelación espacial . Londres: Pion Press.
  8. ^ Cliff, AD y JK Ord. 1981. Procesos espaciales . Londres: Pion Press.
  9. ^ Pryor, Federico (1976). "El método de la posibilidad de difusión: una solución más general y sencilla al problema de Galton". Etnólogo estadounidense . 3 (4). Asociación Antropológica Estadounidense: 731–749. doi :10.1525/ae.1976.3.4.02a00100.
  10. ^ Malcolm M. Dow, Michael L. Burton, Douglas R. White y Karl P. Reitz (1984). "El problema de Galton como autocorrelación de red". Etnólogo estadounidense . 11 (4): 754–770. doi :10.1525/ae.1984.11.4.02a00080. S2CID  143111431.{{cite journal}}: Mantenimiento CS1: varios nombres: lista de autores ( enlace )
  11. ^ E. Anthon Eff (2004). "¿El Sr. Galton todavía tiene algún problema? Autocorrelación en la muestra transcultural estándar" (PDF) . Culturas del mundo . 15 (2): 153–170.
  12. ^ Anselin, Luc. 1988. Econometría espacial: métodos y modelos. Dordrecht: Editores académicos de Kluwer.
  13. ^ Andrey Korotayev y Victor de Munck (2003). "El problema de las flores y los activos de Galton: redes culturales y unidades culturales en la investigación transcultural". Antropólogo estadounidense . 105 (2): 353–358. doi :10.1525/aa.2003.105.2.353.
  14. ^ Maza, Rut; Pagel, Marcos (1994). "El método comparativo en antropología". Antropología actual . 35 (5): 549–564. doi :10.1086/204317. S2CID  146297584.
  15. ^ ab Malcolm M. Dow (1993). "Salvando la teoría: en pruebas de chi-cuadrado con datos de encuestas transculturales". Investigación transcultural . 27 (3–4): 247–276. doi :10.1177/106939719302700305. S2CID  122509821.

Otras lecturas