Inferencia estadística

La inferencia estadística es el proceso de utilizar el análisis de datos para inferir propiedades de una distribución subyacente de probabilidad . ^[1] El análisis estadístico inferencial infiere propiedades de una población , por ejemplo, probando hipótesis y derivando estimaciones. Se supone que el conjunto de datos observados se extrae de una población más grande.

La estadística inferencial puede contrastarse con la estadística descriptiva . La estadística descriptiva se ocupa únicamente de las propiedades de los datos observados y no se basa en la suposición de que los datos provienen de una población más grande. En el aprendizaje automático , el término inferencia a veces se usa en cambio para significar "hacer una predicción, evaluando un modelo ya entrenado"; ^[2] en este contexto, inferir las propiedades del modelo se conoce como entrenamiento o aprendizaje (en lugar de inferencia ), y usar un modelo para la predicción se conoce como inferencia (en lugar de predicción ); consulte también inferencia predictiva .

Introducción

La inferencia estadística permite formular proposiciones sobre una población, utilizando datos extraídos de la población mediante algún tipo de muestreo . Dada una hipótesis sobre una población, para la cual deseamos extraer inferencias, la inferencia estadística consiste en (primero) seleccionar un modelo estadístico del proceso que genera los datos y (segundo) deducir proposiciones a partir del modelo. ^[3]

Konishi y Kitagawa afirman que "la mayoría de los problemas en la inferencia estadística pueden considerarse problemas relacionados con el modelado estadístico". ^[4] En relación con esto, Sir David Cox ha dicho que "la forma en que se realiza la traducción del problema en cuestión al modelo estadístico es a menudo la parte más crítica de un análisis". ^[5]

La conclusión de una inferencia estadística es una proposición estadística . ^[6] Algunas formas comunes de proposición estadística son las siguientes:

una estimación puntual , es decir, un valor particular que mejor se aproxima a algún parámetro de interés;
una estimación de intervalo , por ejemplo un intervalo de confianza (o estimación de conjunto), es decir, un intervalo construido utilizando un conjunto de datos extraído de una población de modo que, bajo un muestreo repetido de dichos conjuntos de datos, dichos intervalos contendrían el verdadero valor del parámetro con la probabilidad en el nivel de confianza establecido ;
un intervalo creíble , es decir, un conjunto de valores que contienen, por ejemplo, el 95% de creencia posterior;
rechazo de una hipótesis ; ^{[nota 1]}
agrupamiento o clasificación de puntos de datos en grupos.

Modelos y suposiciones

Toda inferencia estadística requiere ciertas suposiciones. Un modelo estadístico es un conjunto de suposiciones relativas a la generación de los datos observados y otros similares. Las descripciones de los modelos estadísticos suelen poner énfasis en el papel de las magnitudes de interés de la población sobre las que se desea extraer inferencias. ^[7] Las estadísticas descriptivas se utilizan normalmente como paso preliminar antes de extraer inferencias más formales. ^[8]

Grado de modelos/suposiciones

Los estadísticos distinguen entre tres niveles de supuestos de modelado:

Totalmente paramétrico : Se supone que las distribuciones de probabilidad que describen el proceso de generación de datos están completamente descritas por una familia de distribuciones de probabilidad que involucran solo un número finito de parámetros desconocidos.^[7] Por ejemplo, se puede suponer que la distribución de valores de población es verdaderamente normal, con media y varianza desconocidas, y que los conjuntos de datos se generan mediante un muestreo aleatorio "simple" . La familia de modelos lineales generalizados es una clase de modelos paramétricos ampliamente utilizada y flexible.
No paramétrico : Las suposiciones hechas sobre el proceso que genera los datos son mucho menores que en las estadísticas paramétricas y pueden ser mínimas.^[9] Por ejemplo, cada distribución de probabilidad continua tiene una mediana, que puede estimarse utilizando la mediana de la muestra o el estimador de Hodges-Lehmann-Sen , que tiene buenas propiedades cuando los datos surgen de un muestreo aleatorio simple.
Semiparamétrico : Este término implica típicamente suposiciones "entre" los enfoques totalmente paramétricos y no paramétricos. Por ejemplo, se puede suponer que una distribución de población tiene una media finita. Además, se puede suponer que el nivel de respuesta medio en la población depende de una manera verdaderamente lineal de alguna covariable (una suposición paramétrica) pero no hacer ninguna suposición paramétrica que describa la varianza alrededor de esa media (es decir, sobre la presencia o la posible forma de cualquier heterocedasticidad ). De manera más general, los modelos semiparamétricos a menudo se pueden separar en componentes "estructurales" y "de variación aleatoria". Un componente se trata de manera paramétrica y el otro de manera no paramétrica. El conocido modelo de Cox es un conjunto de suposiciones semiparamétricas.^{[ cita requerida ]}

Importancia de modelos/supuestos válidos

Cualquiera que sea el nivel de suposiciones realizadas, una inferencia correctamente calibrada, en general, requiere que dichas suposiciones sean correctas, es decir, que los mecanismos de generación de datos realmente se hayan especificado correctamente.

Las suposiciones incorrectas de un muestreo aleatorio "simple" pueden invalidar la inferencia estadística. ^[10] Las suposiciones semiparamétricas y totalmente paramétricas más complejas también son motivo de preocupación. Por ejemplo, suponer incorrectamente el modelo de Cox puede en algunos casos llevar a conclusiones erróneas. ^[11] Las suposiciones incorrectas de normalidad en la población también invalidan algunas formas de inferencia basada en la regresión. ^[12] La mayoría de los expertos en muestreo de poblaciones humanas ven con escepticismo el uso de cualquier modelo paramétrico: "la mayoría de los estadísticos de muestreo, cuando tratan con intervalos de confianza, se limitan a afirmaciones sobre [estimadores] basados en muestras muy grandes, donde el teorema del límite central asegura que estos [estimadores] tendrán distribuciones que son casi normales". ^[13] En particular, una distribución normal "sería una suposición totalmente irreal y catastróficamente imprudente de hacer si estuviéramos tratando con cualquier tipo de población económica". ^[13] Aquí, el teorema del límite central establece que la distribución de la media de la muestra "para muestras muy grandes" se distribuye aproximadamente de manera normal, si la distribución no tiene cola pesada.

Distribuciones aproximadas

Dada la dificultad de especificar distribuciones exactas de estadísticas de muestra, se han desarrollado muchos métodos para aproximarlas.

Con muestras finitas, los resultados de aproximación miden qué tan cerca se acerca una distribución limitante a la distribución muestral de la estadística : por ejemplo, con 10,000 muestras independientes la distribución normal se aproxima (a dos dígitos de precisión) a la distribución de la media muestral para muchas distribuciones poblacionales, por el teorema de Berry-Esseen . ^[14] Sin embargo, para muchos propósitos prácticos, la aproximación normal proporciona una buena aproximación a la distribución de la media muestral cuando hay 10 (o más) muestras independientes, según estudios de simulación y la experiencia de los estadísticos. ^[14] Siguiendo el trabajo de Kolmogorov en la década de 1950, las estadísticas avanzadas utilizan la teoría de aproximación y el análisis funcional para cuantificar el error de aproximación. En este enfoque, se estudia la geometría métrica de las distribuciones de probabilidad ; este enfoque cuantifica el error de aproximación con, por ejemplo, la divergencia de Kullback-Leibler , la divergencia de Bregman y la distancia de Hellinger . ^[15]^[16]^[17]

Con muestras indefinidamente grandes, los resultados limitantes como el teorema del límite central describen la distribución limitante de la estadística de muestra si existe una. Los resultados limitantes no son declaraciones sobre muestras finitas y, de hecho, son irrelevantes para muestras finitas. ^[18]^[19]^[20] Sin embargo, la teoría asintótica de distribuciones limitantes se invoca a menudo para trabajar con muestras finitas. Por ejemplo, los resultados limitantes se invocan a menudo para justificar el método generalizado de momentos y el uso de ecuaciones de estimación generalizadas , que son populares en econometría y bioestadística . La magnitud de la diferencia entre la distribución limitante y la distribución verdadera (formalmente, el "error" de la aproximación) se puede evaluar mediante simulación. ^{[21] La aplicación heurística de los resultados limitantes a muestras finitas es una práctica común en muchas aplicaciones, especialmente con}modelos de baja dimensión con probabilidades logarítmicas cóncavas (como con familias exponenciales de un parámetro ).

Modelos basados en aleatorización

Para un conjunto de datos dado que fue producido por un diseño de aleatorización, la distribución de aleatorización de una estadística (bajo la hipótesis nula) se define evaluando la estadística de prueba para todos los planes que podrían haber sido generados por el diseño de aleatorización. En la inferencia frecuentista, la aleatorización permite que las inferencias se basen en la distribución de aleatorización en lugar de un modelo subjetivo, y esto es importante especialmente en el muestreo de encuestas y el diseño de experimentos. ^[22]^[23] La inferencia estadística de estudios aleatorios también es más sencilla que en muchas otras situaciones. ^[24]^[25]^[26] En la inferencia bayesiana , la aleatorización también es importante: en el muestreo de encuestas , el uso del muestreo sin reemplazo asegura la intercambiabilidad de la muestra con la población; en experimentos aleatorios, la aleatorización garantiza una suposición de falta de información aleatoria para la covariable . ^[27]

La aleatorización objetiva permite procedimientos adecuadamente inductivos. ^[28]^[29]^[30]^[31]^[32] Muchos estadísticos prefieren el análisis basado en la aleatorización de datos generados por procedimientos de aleatorización bien definidos. ^[33] (Sin embargo, es cierto que en campos de la ciencia con conocimiento teórico desarrollado y control experimental, los experimentos aleatorios pueden aumentar los costos de la experimentación sin mejorar la calidad de las inferencias. ^[34]^[35] ) De manera similar, los resultados de experimentos aleatorios son recomendados por las principales autoridades estadísticas porque permiten inferencias con mayor confiabilidad que los estudios observacionales de los mismos fenómenos. ^[36] Sin embargo, un buen estudio observacional puede ser mejor que un mal experimento aleatorio.

El análisis estadístico de un experimento aleatorio puede basarse en el esquema de aleatorización establecido en el protocolo experimental y no necesita un modelo subjetivo. ^[37]^[38]

Sin embargo, en cualquier momento, algunas hipótesis no pueden probarse utilizando modelos estadísticos objetivos, que describen con precisión experimentos aleatorios o muestras aleatorias. En algunos casos, esos estudios aleatorios son antieconómicos o poco éticos.

Análisis basado en modelos de experimentos aleatorios

Es una práctica habitual hacer referencia a un modelo estadístico, por ejemplo, un modelo lineal o logístico, al analizar datos de experimentos aleatorios. ^[39] Sin embargo, el esquema de aleatorización guía la elección de un modelo estadístico. No es posible elegir un modelo apropiado sin conocer el esquema de aleatorización. ^[23] Se pueden obtener resultados seriamente engañosos al analizar datos de experimentos aleatorios ignorando el protocolo experimental; los errores comunes incluyen olvidar el bloqueo utilizado en un experimento y confundir mediciones repetidas en la misma unidad experimental con réplicas independientes del tratamiento aplicado a diferentes unidades experimentales. ^[40]

Inferencia de aleatorización sin modelo

Las técnicas sin modelos complementan a los métodos basados en modelos, que emplean estrategias reduccionistas de simplificación de la realidad. Las primeras combinan, desarrollan, agrupan y entrenan algoritmos que se adaptan dinámicamente a las afinidades contextuales de un proceso y aprenden las características intrínsecas de las observaciones. ^[41]^[42]

Por ejemplo, la regresión lineal simple sin modelo se basa en

un diseño aleatorio , donde los pares de observaciones son independientes y están distribuidos de manera idéntica (iid), o $(X_{1},Y_{1}),(X_{2},Y_{2}),\cdots ,(X_{n},Y_{n})$
un diseño determinista , donde las variables son deterministas, pero las variables de respuesta correspondientes son aleatorias e independientes con una distribución condicional común, es decir, , que es independiente del índice . $X_{1},X_{2},\cdots ,X_{n}$ $Y_{1},Y_{2},\cdots,Y_{n}$ $P\left(Y_{j}\leq y|X_{j}=x\right)=D_{x}(y)$ ${\estilo de visualización j}$

En cualquier caso, la inferencia de aleatorización sin modelo para las características de la distribución condicional común se basa en algunas condiciones de regularidad, por ejemplo, suavidad funcional. Por ejemplo, la inferencia de aleatorización sin modelo para la característica de población media condicional , , se puede estimar de manera consistente mediante un promedio local o un ajuste polinomial local, bajo el supuesto de que es suave. Además, confiando en la normalidad asintótica o el remuestreo, podemos construir intervalos de confianza para la característica de población, en este caso, la media condicional , . ^[43] $estilo de visualización D_{x}(.)}$ $\mu(x)=E(Y|X=x)$ $\mu(x)$ $\mu(x)$

Paradigmas para la inferencia

Se han establecido diferentes escuelas de inferencia estadística. Estas escuelas (o "paradigmas") no son mutuamente excluyentes, y los métodos que funcionan bien con un paradigma suelen tener interpretaciones atractivas con otros.

Bandyopadhyay y Forster describen cuatro paradigmas: el paradigma clásico (o frecuentista ), el paradigma bayesiano , el paradigma verosimilitudista y el paradigma basado en el criterio de información de Akaike . ^[44]

Inferencia frecuentista

Este paradigma calibra la plausibilidad de las proposiciones considerando un muestreo repetido (teórico) de una distribución de población para producir conjuntos de datos similares al que se tiene en cuenta. Al considerar las características del conjunto de datos bajo un muestreo repetido, se pueden cuantificar las propiedades frecuentistas de una proposición estadística, aunque en la práctica esta cuantificación puede resultar complicada.

Ejemplos de inferencia frecuentista

valor p
Intervalo de confianza
Prueba de significación de hipótesis nula

Inferencia frecuentista, objetividad y teoría de la decisión

Una interpretación de la inferencia frecuentista (o inferencia clásica) es que es aplicable sólo en términos de probabilidad de frecuencia ; es decir, en términos de muestreo repetido de una población. Sin embargo, el enfoque de Neyman ^[45] desarrolla estos procedimientos en términos de probabilidades previas al experimento. Es decir, antes de emprender un experimento, se decide una regla para llegar a una conclusión tal que la probabilidad de ser correcta se controle de manera adecuada: dicha probabilidad no necesita tener una interpretación frecuentista o de muestreo repetido. Por el contrario, la inferencia bayesiana funciona en términos de probabilidades condicionales (es decir, probabilidades condicionales a los datos observados), en comparación con las probabilidades marginales (pero condicionadas a parámetros desconocidos) utilizadas en el enfoque frecuentista.

Los procedimientos frecuentistas de pruebas de significancia e intervalos de confianza pueden construirse sin tener en cuenta las funciones de utilidad . Sin embargo, algunos elementos de las estadísticas frecuentistas, como la teoría de la decisión estadística , sí incorporan funciones de utilidad . ^{[ cita requerida ]} En particular, los desarrollos frecuentistas de inferencia óptima (como los estimadores insesgados de varianza mínima o las pruebas uniformemente más poderosas ) hacen uso de funciones de pérdida , que desempeñan el papel de funciones de utilidad (negativas). Las funciones de pérdida no necesitan enunciarse explícitamente para que los teóricos estadísticos demuestren que un procedimiento estadístico tiene una propiedad de optimalidad. ^[46] Sin embargo, las funciones de pérdida suelen ser útiles para enunciar propiedades de optimalidad: por ejemplo, los estimadores insesgados de mediana son óptimos bajo funciones de pérdida de valor absoluto , en el sentido de que minimizan la pérdida esperada, y los estimadores de mínimos cuadrados son óptimos bajo funciones de pérdida de error al cuadrado, en el sentido de que minimizan la pérdida esperada.

Si bien los estadísticos que utilizan la inferencia frecuentista deben elegir por sí mismos los parámetros de interés y los estimadores / estadísticos de prueba que se utilizarán, la ausencia de utilidades obviamente explícitas y distribuciones previas ha ayudado a que los procedimientos frecuentistas sean vistos ampliamente como "objetivos". ^[47]

Inferencia bayesiana

El cálculo bayesiano describe los grados de creencia utilizando el "lenguaje" de la probabilidad; las creencias son positivas, se integran en una sola y obedecen a los axiomas de probabilidad. La inferencia bayesiana utiliza las creencias posteriores disponibles como base para hacer proposiciones estadísticas. ^[48] Existen varias justificaciones diferentes para utilizar el enfoque bayesiano.

Ejemplos de inferencia bayesiana

Intervalo creíble para la estimación del intervalo
Factores de Bayes para comparación de modelos

Inferencia bayesiana, subjetividad y teoría de la decisión

Muchas inferencias bayesianas informales se basan en resúmenes "intuitivamente razonables" de la variable posterior. Por ejemplo, la media, la mediana y la moda de la variable posterior, los intervalos de densidad posterior más altos y los factores de Bayes pueden motivarse de esta manera. Si bien no es necesario que se establezca la función de utilidad de un usuario para este tipo de inferencia, todos estos resúmenes dependen (hasta cierto punto) de creencias previas establecidas y, por lo general, se consideran conclusiones subjetivas. (Se han propuesto métodos de construcción previa que no requieren aportes externos, pero aún no se han desarrollado por completo).

Formalmente, la inferencia bayesiana se calibra con referencia a una utilidad explícitamente establecida, o función de pérdida; la "regla de Bayes" es la que maximiza la utilidad esperada, promediada sobre la incertidumbre posterior. Por lo tanto, la inferencia bayesiana formal proporciona automáticamente decisiones óptimas en un sentido teórico de decisión . Dados los supuestos, los datos y la utilidad, la inferencia bayesiana se puede hacer para esencialmente cualquier problema, aunque no toda inferencia estadística necesita tener una interpretación bayesiana. Los análisis que no son formalmente bayesianos pueden ser (lógicamente) incoherentes ; una característica de los procedimientos bayesianos que utilizan valores previos adecuados (es decir, aquellos integrables a uno) es que se garantiza que son coherentes . Algunos defensores de la inferencia bayesiana afirman que la inferencia debe tener lugar en este marco teórico de decisión, y que la inferencia bayesiana no debe concluir con la evaluación y resumen de creencias posteriores.

Inferencia basada en probabilidad

La inferencia basada en verosimilitud es un paradigma utilizado para estimar los parámetros de un modelo estadístico basado en datos observados. El verosimilitud aborda la estadística utilizando la función de verosimilitud , denotada como , cuantifica la probabilidad de observar los datos dados , asumiendo un conjunto específico de valores de parámetros . En la inferencia basada en verosimilitud, el objetivo es encontrar el conjunto de valores de parámetros que maximiza la función de verosimilitud o, equivalentemente, maximiza la probabilidad de observar los datos dados. $L(x|\theta )$ ${\estilo de visualización x}$ ${\estilo de visualización \theta}$

El proceso de inferencia basada en probabilidad generalmente implica los siguientes pasos:

Formulación del modelo estadístico: Se define un modelo estadístico en función del problema en cuestión, especificando los supuestos distribucionales y la relación entre los datos observados y los parámetros desconocidos. El modelo puede ser simple, como una distribución normal con varianza conocida, o complejo, como un modelo jerárquico con múltiples niveles de efectos aleatorios.
Construcción de la función de verosimilitud: Dado el modelo estadístico, la función de verosimilitud se construye evaluando la densidad de probabilidad conjunta o función de masa de los datos observados en función de los parámetros desconocidos. Esta función representa la probabilidad de observar los datos para diferentes valores de los parámetros.
Maximización de la función de verosimilitud: el siguiente paso es encontrar el conjunto de valores de parámetros que maximiza la función de verosimilitud. Esto se puede lograr utilizando técnicas de optimización como algoritmos de optimización numérica. Los valores de parámetros estimados, a menudo denominados , son las estimaciones de máxima verosimilitud (MLE). ${\bar {y}}$
Evaluación de la incertidumbre: una vez obtenidos los valores máximos permisibles, es fundamental cuantificar la incertidumbre asociada a las estimaciones de los parámetros. Esto se puede hacer calculando errores estándar , intervalos de confianza o realizando pruebas de hipótesis basadas en la teoría asintótica o técnicas de simulación como el bootstrap .
Comprobación del modelo: después de obtener las estimaciones de los parámetros y evaluar su incertidumbre, es importante evaluar la idoneidad del modelo estadístico. Esto implica comprobar los supuestos realizados en el modelo y evaluar el ajuste del modelo a los datos mediante pruebas de bondad de ajuste, análisis de residuos o diagnósticos gráficos.
Inferencia e interpretación: Por último, a partir de los parámetros estimados y la evaluación del modelo, se puede realizar una inferencia estadística, que implica extraer conclusiones sobre los parámetros de la población, hacer predicciones o probar hipótesis en función del modelo estimado.

Inferencia basada en AIC

El criterio de información de Akaike (AIC) es un estimador de la calidad relativa de los modelos estadísticos para un conjunto de datos determinado. Dada una colección de modelos para los datos, el AIC estima la calidad de cada modelo en relación con cada uno de los otros modelos. Por lo tanto, el AIC proporciona un medio para la selección de modelos .

El AIC se basa en la teoría de la información : ofrece una estimación de la información relativa que se pierde cuando se utiliza un modelo determinado para representar el proceso que generó los datos (para ello, se ocupa del equilibrio entre la bondad del ajuste del modelo y su simplicidad).

Otros paradigmas para la inferencia

Longitud mínima de descripción

El principio de longitud mínima de descripción (MDL) se ha desarrollado a partir de ideas de la teoría de la información ^[49] y la teoría de la complejidad de Kolmogorov ^[50] . El principio (MDL) selecciona modelos estadísticos que comprimen al máximo los datos; la inferencia procede sin asumir "mecanismos de generación de datos" contrafácticos o no falsables o modelos de probabilidad para los datos, como podría hacerse en enfoques frecuentistas o bayesianos.

Sin embargo, si en realidad existe un "mecanismo de generación de datos", entonces, según el teorema de codificación de fuentes de Shannon, proporciona la descripción MDL de los datos, en promedio y de manera asintótica. ^[51] Al minimizar la longitud de la descripción (o complejidad descriptiva), la estimación MDL es similar a la estimación de máxima verosimilitud y la estimación máxima a posteriori (utilizando valores a priori bayesianos de máxima entropía ). Sin embargo, MDL evita asumir que se conoce el modelo de probabilidad subyacente; el principio MDL también se puede aplicar sin suposiciones de que, por ejemplo, los datos surgieron de un muestreo independiente. ^[51]^[52]

El principio MDL se ha aplicado en la teoría de codificación de comunicaciones, en la teoría de la información , en la regresión lineal ^[52] y en la minería de datos . ^[50]

La evaluación de procedimientos inferenciales basados en MDL a menudo utiliza técnicas o criterios de la teoría de la complejidad computacional . ^[53]

Inferencia fiducial

La inferencia fiducial fue un enfoque de inferencia estadística basado en la probabilidad fiducial , también conocida como "distribución fiducial". En trabajos posteriores, este enfoque ha sido calificado de mal definido, extremadamente limitado en su aplicabilidad e incluso falaz. ^[54]^[55] Sin embargo, este argumento es el mismo que muestra ^[56] que una denominada distribución de confianza no es una distribución de probabilidad válida y, dado que esto no ha invalidado la aplicación de intervalos de confianza , no invalida necesariamente las conclusiones extraídas de los argumentos fiduciales. Se intentó reinterpretar el trabajo temprano del argumento fiducial de Fisher como un caso especial de una teoría de inferencia que utiliza probabilidades superiores e inferiores . ^[57]

Inferencia estructural

Desarrollando las ideas de Fisher y de Pitman entre 1938 y 1939, ^[58] George A. Barnard desarrolló la "inferencia estructural" o "inferencia pivotal", ^[59] un enfoque que utiliza probabilidades invariantes en familias de grupos . Barnard reformuló los argumentos detrás de la inferencia fiducial en una clase restringida de modelos en los que los procedimientos "fiduciales" estarían bien definidos y serían útiles. Donald AS Fraser desarrolló una teoría general para la inferencia estructural ^[60] basada en la teoría de grupos y la aplicó a modelos lineales. ^[61] La teoría formulada por Fraser tiene vínculos estrechos con la teoría de la decisión y las estadísticas bayesianas y puede proporcionar reglas de decisión frecuentistas óptimas si existen. ^[62]

Temas de inferencia

Los temas que aparecen a continuación suelen estar incluidos en el área de inferencia estadística .

Supuestos estadísticos
Teoría de la decisión estadística
Teoría de la estimación
Prueba de hipótesis estadística
Revisando opiniones en estadísticas
Diseño de experimentos , análisis de varianza y regresión.
Muestreo de encuesta
Resumen de datos estadísticos

Inferencia predictiva

La inferencia predictiva es un enfoque de la inferencia estadística que enfatiza la predicción de observaciones futuras basadas en observaciones pasadas.

Inicialmente, la inferencia predictiva se basaba en parámetros observables y era el principal propósito del estudio de la probabilidad , ^{[ cita requerida ]} pero cayó en desgracia en el siglo XX debido a un nuevo enfoque paramétrico iniciado por Bruno de Finetti . El enfoque modelaba los fenómenos como un sistema físico observado con error (por ejemplo, la mecánica celeste ). La idea de intercambiabilidad de De Finetti —que las observaciones futuras deberían comportarse como las observaciones pasadas— llamó la atención del mundo angloparlante con la traducción del francés en 1974 de su artículo de 1937, ^[63] y desde entonces ha sido propuesta por estadísticos como Seymour Geisser . ^[64]

Véase también

Notas

^ Según Peirce, la aceptación significa que la investigación sobre esta cuestión cesa por el momento. En ciencia, todas las teorías científicas son revisables.

Referencias

Citas

^ Upton, G., Cook, I. (2008) Diccionario Oxford de Estadística , OUP. ISBN 978-0-19-954145-4 .
^ "Inferencia de TensorFlow Lite". El término inferencia se refiere al proceso de ejecución de un modelo de TensorFlow Lite en el dispositivo para realizar predicciones basadas en datos de entrada.
^ Johnson, Richard (12 de marzo de 2016). «Inferencia estadística». Enciclopedia de matemáticas . Springer: The European Mathematical Society . Consultado el 26 de octubre de 2022 .
^ Konishi y Kitagawa (2008), pág. 75.
^ Cox (2006), pág. 197.
^ "Inferencia estadística - Enciclopedia de matemáticas". www.encyclopediaofmath.org . Consultado el 23 de enero de 2019 .
^ ab Cox (2006) página 2
^ Evans, Michael; et al. (2004). Probabilidad y estadística: la ciencia de la incertidumbre. Freeman and Company. pág. 267. ISBN 9780716747420.
^ van der Vaart, AW (1998) Estadística asintótica Cambridge University Press. ISBN 0-521-78450-6 (página 341)
^ Kruskal 1988
^ Freedman, DA (2008) "Análisis de supervivencia: ¿un riesgo epidemiológico?". The American Statistician (2008) 62: 110-119. (Reimpreso como Capítulo 11 (páginas 169-192) de Freedman (2010)).
^ Berk, R. (2003) Análisis de regresión: una crítica constructiva (Técnicas cuantitativas avanzadas en las ciencias sociales) (v. 11) Sage Publications. ISBN 0-7619-2904-5
^ ab Brewer, Ken (2002). Inferencia de muestreo de encuesta combinada: pesaje de los elefantes de Basu . Hodder Arnold. pág. 6. ISBN 978-0340692295.
^ de Jörgen Hoffman-Jörgensen, Probabilidad con vistas a la estadística , Volumen I. Página 399 ^{[ cita completa necesaria ]}
^ Le Cam (1986) ^{[ página necesaria ]}
^ Erik Torgerson (1991) Comparison of Statistical Experiments , volumen 36 de la Encyclopedia of Mathematics. Cambridge University Press. ^{[ cita completa necesaria ]}
^ Liese, Friedrich y Miescke, Klaus-J. (2008). Teoría de la decisión estadística: estimación, prueba y selección . Saltador. ISBN 978-0-387-73193-3.
^ Kolmogorov (1963, p.369): "El concepto de frecuencia, basado en la noción de frecuencia límite a medida que el número de ensayos aumenta hasta el infinito, no aporta nada para fundamentar la aplicabilidad de los resultados de la teoría de la probabilidad a problemas prácticos reales en los que siempre tenemos que lidiar con un número finito de ensayos".
^ "De hecho, los teoremas del límite 'como tiende al infinito' carecen lógicamente de contenido sobre lo que sucede en cualquier caso particular . Todo lo que pueden hacer es sugerir ciertos enfoques cuyo desempeño debe luego comprobarse en el caso en cuestión". — Le Cam (1986) (página xiv) ${\estilo de visualización n}$ ${\estilo de visualización n}$
^ Pfanzagl (1994): "El inconveniente crucial de la teoría asintótica: lo que esperamos de la teoría asintótica son resultados que se mantengan aproximadamente... Lo que la teoría asintótica tiene para ofrecer son teoremas límite". (página ix) "Lo que cuenta para las aplicaciones son las aproximaciones, no los límites". (página 188)
^ Pfanzagl (1994): "Si tomamos un teorema límite como aproximadamente verdadero para muestras de gran tamaño, cometemos un error cuyo tamaño es desconocido. [...] Se puede obtener información realista sobre los errores restantes mediante simulaciones". (página ix)
^ Neyman, J. (1934) "Sobre los dos aspectos diferentes del método representativo: el método de muestreo estratificado y el método de selección intencional", Journal of the Royal Statistical Society , 97 (4), 557–625 JSTOR 2342192
^ de Hinkelmann y Kempthorne (2008) ^{[ página necesaria ]}
^ Directrices de la ASA para el primer curso de estadística para no estadísticos (disponibles en el sitio web de la ASA)
^ Estadísticas de David A. Freedman et alia .
^ Moore y otros (2015).
^ Gelman A. et al. (2013). Análisis de datos bayesianos ( Chapman & Hall ).
^ Peirce (1877-1878)
^ Peirce (1883)
^ Freedman, Pisani y Purves 1978.
^ David A. Freedman Modelos estadísticos .
^ Rao, CR (1997) Estadísticas y verdad: poner la suerte a trabajar , World Scientific. ISBN 981-02-3111-3
^ Peirce; Freedman; Moore y otros (2015). ^{[ cita requerida ]}
^ Box, GEP y amigos (2006) Mejorando casi cualquier cosa: ideas y ensayos, edición revisada , Wiley. ISBN 978-0-471-72755-2
^ Cox (2006), pág. 196.
^
Directrices de la ASA para el primer curso de estadística para no estadísticos (disponibles en el sitio web de la ASA)
- David A. Freedman y alias Estadísticas .
- Moore y otros (2015).
^ Neyman, Jerzy. 1923 [1990]. "Sobre la aplicación de la teoría de la probabilidad a los experimentos agrícolas. Ensayo sobre principios. Sección 9". Statistical Science 5 (4): 465–472. Trad. Dorota M. Dabrowska y Terence P. Speed.
^ Hinkelmann y Kempthorne (2008) ^{[ página necesaria ]}
^ Dinov, Ivo; Palanimalai, Selvam; Khare, Ashwini; Christou, Nicolas (2018). "Inferencia estadística basada en aleatorización: una infraestructura de remuestreo y simulación". Teaching Statistics . 40 (2): 64–73. doi :10.1111/test.12156. PMC 6155997 . PMID 30270947.
^ Hinkelmann y Kempthorne (2008) Capítulo 6.
^ Dinov, Ivo; Palanimalai, Selvam; Khare, Ashwini; Christou, Nicolas (2018). "Inferencia estadística basada en aleatorización: una infraestructura de remuestreo y simulación". Teaching Statistics . 40 (2): 64–73. doi :10.1111/test.12156. PMC 6155997 . PMID 30270947.
^ Tang, Ming; Gao, Chao; Goutman, Stephen; Kalinin, Alexandr; Mukherjee, Bhramar; Guan, Yuanfang; Dinov, Ivo (2019). "Técnicas basadas en modelos y sin modelos para la predicción del diagnóstico de esclerosis lateral amiotrófica y la agrupación de pacientes". Neuroinformática . 17 (3): 407–421. doi :10.1007/s12021-018-9406-9. PMC 6527505 . PMID 30460455.
^ Politis, DN (2019). "Inferencia sin modelos en estadística: cómo y por qué". Boletín IMS . 48 .
^ Bandyopadhyay y Forster (2011). Véase la Introducción del libro (p. 3) y la "Sección III: Cuatro paradigmas de la estadística".
^ Neyman, J. (1937). "Esquema de una teoría de estimación estadística basada en la teoría clásica de la probabilidad". Philosophical Transactions of the Royal Society of London A . 236 (767): 333–380. Bibcode :1937RSPTA.236..333N. doi : 10.1098/rsta.1937.0005 . JSTOR 91337.
^ Prefacio a Pfanzagl.
^ Little, Roderick J. (2006). "Bayes calibrado: una hoja de ruta bayesiana/frecuentista". The American Statistician . 60 (3): 213–223. doi :10.1198/000313006X117837. ISSN 0003-1305. JSTOR 27643780. S2CID 53505632.
^ Lee, Se Yoon (2021). "Inferencia variacional mediante el muestreador de Gibbs y el ascenso de coordenadas: una revisión de la teoría de conjuntos". Communications in Statistics - Theory and Methods . 51 (6): 1549–1568. arXiv : 2008.01006 . doi :10.1080/03610926.2021.1921214. S2CID 220935477.
^ Sufi (2000)
^ por Hansen y Yu (2001)
^ ab Hansen y Yu (2001), página 747.
^ de Rissanen (1989), página 84
^ Joseph F. Traub, GW Wasilkowski y H. Wozniakowski. (1988) ^{[ página necesaria ]}
^ Neyman (1956)
^ Zabell (1992)
^ Cox (2006) página 66
^ Hampel 2003.
^ Davison, página 12. ^{[ cita completa necesaria ]}
^ Barnard, GA (1995) "Modelos pivotales y el argumento fiducial", International Statistical Review, 63 (3), 309–323. JSTOR 1403482
^ Fraser, DAS (1968). La estructura de la inferencia. Nueva York: Wiley. ISBN 0-471-27548-4.OCLC 440926 .
^ Fraser, DAS (1979). Inferencia y modelos lineales. Londres: McGraw-Hill. ISBN 0-07-021910-9.OCLC 3559629 .
^ Taraldsen, Gunnar; Lindqvist, Bo Henry (1 de febrero de 2013). "Teoría fiducial e inferencia óptima". Anales de estadística . 41 (1). arXiv : 1301.1717 . doi :10.1214/13-AOS1083. ISSN 0090-5364. S2CID 88520957.
^ De Finetti, Bruno (1937). "La Prévision: ses lois logiques, ses fuentes subjetivas". Anales del Instituto Henri Poincaré . 7 (1): 1–68. ISSN 0365-320X.Traducido en De Finetti, Bruno (1992). "La previsión: sus leyes lógicas, sus fuentes subjetivas". Avances en estadística . Springer Series in Statistics. págs. 134–174. doi :10.1007/978-1-4612-0919-5_10. ISBN 978-0-387-94037-3.
^ Geisser, Seymour (1993) Inferencia predictiva: una introducción , CRC Press. ISBN 0-412-03471-9

Fuentes

Bandyopadhyay, PS; Forster, MR, eds. (2011), Filosofía de la estadística , Elsevier.
Bickel, Peter J.; Doksum, Kjell A. (2001). Estadística matemática: temas básicos y selectos . Vol. 1 (Segunda edición (edición actualizada en 2007). Prentice Hall . ISBN 978-0-13-850363-5.Sr. 0443141 .
Cox, DR (2006). Principios de inferencia estadística , Cambridge University Press . ISBN 0-521-68567-2 .
Fisher, RA (1955), "Métodos estadísticos e inducción científica", Journal of the Royal Statistical Society , Serie B , 17, 69–78. (crítica de las teorías estadísticas de Jerzy Neyman y Abraham Wald )
Freedman, DA (2009). Modelos estadísticos: teoría y práctica (edición revisada). Cambridge University Press . pp. xiv+442 pp. ISBN 978-0-521-74385-3.Señor 2489600 .
Freedman, DA (2010). Modelos estadísticos e inferencias causales: un diálogo con las ciencias sociales (Editado por David Collier , Jasjeet Sekhon y Philip B. Stark), Cambridge University Press .
Hampel, Frank R. (febrero de 2003). "El argumento fiduciario adecuado". Seminario de estadística, Eidgenössische Technische Hochschule (ETH) . 114 . doi : 10.3929/ethz-a-004526011.
Hansen, Mark H.; Yu, Bin (junio de 2001). "Selección de modelos y el principio de longitud mínima de descripción: artículo de revisión". Journal of the American Statistical Association . 96 (454): 746–774. CiteSeerX 10.1.1.43.6581 . doi :10.1198/016214501753168398. JSTOR 2670311. MR 1939352. S2CID 14460386. Archivado desde el original el 16 de noviembre de 2004.
Hinkelmann, Klaus; Kempthorne, Oscar (2008). Introducción al diseño experimental (segunda edición). Wiley. ISBN 978-0-471-72756-9.
Kolmogorov, Andrei N. (1963). "Sobre las tablas de números aleatorios". Sankhyā Ser. A . 25 : 369–375. MR 0178484.Reimpreso como Kolmogorov, Andrei N. (1998). "Sobre tablas de números aleatorios". Ciencias de la Computación Teórica . 207 (2): 387–395. doi : 10.1016/S0304-3975(98)00075-9 . MR 1643414.
Konishi S., Kitagawa G. (2008), Criterios de información y modelado estadístico , Springer.
Kruskal, William (diciembre de 1988). "Milagros y estadísticas: la asunción casual de independencia (discurso presidencial de la ASA)". Revista de la Asociación Estadounidense de Estadística . 83 (404): 929–940. doi : 10.2307/2290117 . JSTOR 2290117.
Le Cam, Lucian . (1986) Métodos asintóticos de la teoría de la decisión estadística , Springer. ISBN 0-387-96307-3
Moore, DS ; McCabe, GP; Craig, BA (2015), Introducción a la práctica de la estadística , octava edición, Macmillan.
Neyman, Jerzy (1956). "Nota sobre un artículo de Sir Ronald Fisher". Journal of the Royal Statistical Society, Serie B . 18 (2): 288–294. doi :10.1111/j.2517-6161.1956.tb00236.x. JSTOR 2983716.(respuesta a Fisher 1955)
Peirce, CS (1877–1878), «Ilustraciones de la lógica de la ciencia» (serie), Popular Science Monthly , vols. 12–13. Artículos individuales relevantes:
- (marzo de 1878), "La doctrina de las probabilidades", Popular Science Monthly , v. 12, número de marzo, págs. 604–615. Internet Archive Eprint.
- (abril de 1878), "La probabilidad de la inducción", Popular Science Monthly , v. 12, págs. 705–718. Internet Archive Eprint.
- (junio de 1878), "El orden de la naturaleza", Popular Science Monthly , v. 13, págs. 203-217. Internet Archive Eprint.
- (agosto de 1878), "Deducción, inducción e hipótesis", Popular Science Monthly , v. 13, págs. 470–482. Internet Archive Eprint.
Peirce, CS (1883), "Una teoría de la inferencia probable", Estudios de lógica , págs. 126-181, Little, Brown, and Company. (Reimpreso en 1983, John Benjamins Publishing Company , ISBN 90-272-3271-7 )
Freedman, DA ; Pisani, R.; Purves, RA (1978). Estadísticas . Nueva York: WW Norton & Company.
Pfanzagl, Johann; con la ayuda de R. Hamböker (1994). Teoría estadística paramétrica . Berlín: Walter de Gruyter . ISBN 978-3-11-013863-4.Señor 1291393 .
Rissanen, Jorma (1989). Complejidad estocástica en la investigación estadística . Serie en Ciencias de la Computación. Vol. 15. Singapur: World Scientific . ISBN 978-9971-5-0859-3.Señor 1082556 .
Soofi, Ehsan S. (diciembre de 2000). "Principales enfoques teóricos de la información (Viñetas para el año 2000: teoría y métodos, ed. por George Casella)". Revista de la Asociación Estadounidense de Estadística . 95 (452): 1349–1353. doi :10.1080/01621459.2000.10474346. JSTOR 2669786. MR 1825292. S2CID 120143121.
Traub, Joseph F .; Wasilkowski, GW; Wozniakowski, H. (1988). Complejidad basada en la información . Academic Press. ISBN 978-0-12-697545-1.
Zabell, SL (agosto de 1992). "RA Fisher y el argumento fiducial". Ciencia estadística . 7 (3): 369–387. doi : 10.1214/ss/1177011233 . JSTOR 2246073.

Lectura adicional

Casella, G. , Berger, RL (2002). Inferencia estadística . Duxbury Press. ISBN 0-534-24312-6
Freedman, DA (1991). "Modelos estadísticos y cuero de calzado". Metodología sociológica . 21 : 291–313. doi :10.2307/270939. JSTOR 270939.
Held L., Bové DS (2014). Inferencia estadística aplicada: verosimilitud y Bayes (Springer).
Lenhard, Johannes (2006). "Modelos e inferencia estadística: la controversia entre Fisher y Neyman–Pearson" (PDF) . British Journal for the Philosophy of Science . 57 : 69–91. doi :10.1093/bjps/axi152. S2CID 14136146.
Lindley, D (1958). "Distribución fiducial y teorema de Bayes". Journal of the Royal Statistical Society, Serie B. 20 : 102–7. doi : 10.1111/j.2517-6161.1958.tb00278.x.
Rahlf, Thomas (2014). "Inferencia estadística", en Claude Diebolt y Michael Haupert (eds.), "Manual de cliometría (Springer Reference Series)", Berlín/Heidelberg: Springer.
Reid, N.; Cox, DR (2014). "Sobre algunos principios de inferencia estadística". Revista estadística internacional . 83 (2): 293–308. doi :10.1111/insr.12067. hdl : 10.1111/insr.12067 . S2CID 17410547.
Sagitov, Serik (2022). "Inferencia estadística". Wikilibros. http://upload.wikimedia.org/wikipedia/commons/f/f9/Statistical_Inference.pdf
Young, GA, Smith, RL (2005). Fundamentos de inferencia estadística , CUP. ISBN 0-521-83971-8

Enlaces externos

Wikimedia Commons tiene medios relacionados con Inferencia estadística .

Wikiversidad tiene recursos de aprendizaje sobre inferencia estadística

Inferencia estadística: conferencia sobre la plataforma OpenCourseWare del MIT
Inferencia estadística: conferencia del Programa Nacional de Aprendizaje Mejorado por la Tecnología
Hay disponible una demostración/calculadora bayesiana (MCMC) en línea en causaScientia