Estimación de intervalo

En estadística , la estimación de intervalo es el uso de datos de muestra para estimar un intervalo de posibles valores de un parámetro de interés. Esto contrasta con la estimación puntual , que da un valor único. ^[1]

Las formas más frecuentes de estimación de intervalos son los intervalos de confianza (un método frecuentista ) y los intervalos de credibilidad (un método bayesiano ). ^[2] Las formas menos comunes incluyen intervalos de probabilidad , intervalos fiduciales , intervalos de tolerancia e intervalos de predicción . Para un método no estadístico, las estimaciones de intervalo se pueden deducir de la lógica difusa .

Tipos de estimación de intervalos

Intervalos de confianza

Los intervalos de confianza se utilizan para estimar el parámetro de interés a partir de un conjunto de datos muestreados, comúnmente la media o la desviación estándar . Un intervalo de confianza indica que hay un 100γ% de confianza de que el parámetro de interés está dentro de un límite superior e inferior. Un error común sobre los intervalos de confianza es que el 100γ% del conjunto de datos se ajusta dentro o por encima o por debajo de los límites, lo que se denomina intervalo de tolerancia, que se analiza a continuación.

Existen múltiples métodos que se utilizan para construir un intervalo de confianza; la elección correcta depende de los datos que se analizan. Para una distribución normal con una varianza conocida , se usa la tabla z para crear un intervalo donde se puede obtener un nivel de confianza del 100γ% centrado alrededor de la media muestral a partir de un conjunto de datos de n mediciones. Para una distribución binomial , los intervalos de confianza se pueden aproximar utilizando el método aproximado de Wald , el intervalo de Jeffreys y el intervalo de Clopper-Pearson . El método de Jeffrey también se puede utilizar para aproximar intervalos de una distribución de Poisson . ^[3] Si se desconoce la distribución subyacente, se puede utilizar el arranque para crear límites sobre la mediana del conjunto de datos.

Intervalos creíbles

A diferencia de un intervalo de confianza, un intervalo creíble requiere un supuesto previo , modificando el supuesto utilizando un factor de Bayes y determinando una distribución posterior . Utilizando la distribución posterior, se puede determinar una probabilidad del 100γ% de que se incluya el parámetro de interés, a diferencia del intervalo de confianza donde se puede tener una confianza del 100γ% de que se incluye una estimación dentro de un intervalo. ^[4]

${\text{Posterior}}\ \propto \ {\text{Probabilidad}}\times {\text{Anterior}}$

Si bien una suposición previa es útil para proporcionar más datos para construir un intervalo, elimina la objetividad de un intervalo de confianza. Se utilizará un anterior para informar un posterior; si no se cuestiona, este anterior puede conducir a predicciones incorrectas. ^[5]

Los límites del intervalo de credibilidad son variables, a diferencia del intervalo de confianza. Existen varios métodos para determinar dónde deben ubicarse los límites superior e inferior correctos. Las técnicas comunes para ajustar los límites del intervalo incluyen el intervalo de densidad posterior más alta (HPDI), el intervalo de colas iguales o la elección del centro del intervalo alrededor de la media.

Formas menos comunes

Basado en probabilidad

Utiliza los principios de una función de verosimilitud para estimar el parámetro de interés. Utilizando el método basado en la verosimilitud, se pueden encontrar intervalos de confianza para medias exponenciales, de Weibull y lognormales. Además, los enfoques basados en la probabilidad pueden proporcionar intervalos de confianza para la desviación estándar. También es posible crear un intervalo de predicción combinando la función de probabilidad y la variable aleatoria futura. ^[3]

Fiducial

La inferencia fiducial utiliza un conjunto de datos, elimina cuidadosamente el ruido y recupera un estimador de distribución, la Distribución Fiducial Generalizada (GFD). Sin el uso del teorema de Bayes, no se supone un previo, como los intervalos de confianza.

La inferencia fiducial es una forma menos común de inferencia estadística . El fundador, RA Fisher , que había estado desarrollando métodos de probabilidad inversa, tenía sus propias dudas sobre la validez del proceso. Si bien la inferencia fiducial se desarrolló a principios del siglo XX, a finales del siglo XX se creía que el método era inferior a los enfoques frecuentista y bayesiano, pero ocupaba un lugar importante en el contexto histórico de la inferencia estadística. Sin embargo, los enfoques modernos han generalizado el intervalo fiducial en Inferencia Fiducial Generalizada (GFI), que puede usarse para estimar conjuntos de datos discretos y continuos. ^[6]

Tolerancia

Los intervalos de tolerancia utilizan la población del conjunto de datos recopilados para obtener un intervalo, dentro de los límites de tolerancia, que contenga valores del 100γ%. Los ejemplos típicamente utilizados para describir los intervalos de tolerancia incluyen la fabricación. En este contexto, se evalúa un porcentaje de un conjunto de productos existente para garantizar que un porcentaje de la población esté incluido dentro de los límites de tolerancia. Al crear intervalos de tolerancia, los límites se pueden escribir en términos de un límite de tolerancia superior e inferior, utilizando la media muestral , y la desviación estándar muestral , s. $\mu$

$(l_{b},u_{b})=\mu \pm k_{2}s$ para intervalos bilaterales

para intervalos bilaterales

Y en el caso de intervalos unilaterales donde la tolerancia sólo se requiere por encima o por debajo de un valor crítico,

$l_{b}=\mu -k_{1}s$

$u_{b}=\mu +k_{1}s$

${\ Displaystyle k_ {i}}$ varía según la distribución y el número de lados, i, en la estimación del intervalo. En una distribución normal, se puede expresar como ^[7] ${\ Displaystyle k_ {2}}$

$k_{2}=z_{\alpha /2}{\sqrt {\frac {\nu (1+{\frac {1}{N}})}{\chi _{1-\alpha ,\ nu }^{2}}}}$

Dónde,

$\chi _{1-\alpha ,\nu }^{2}$ es el valor crítico de la distribución chi-cuadrado que utiliza grados de libertad que se exceden con probabilidad . ${\displaystyle\nu}$ $\alpha$

$z_{\alpha /2}$ son los valores críticos obtenidos de la distribución normal.

Predicción

Un intervalo de predicción estima el intervalo que contiene muestras futuras con cierta confianza, γ. Los intervalos de predicción se pueden utilizar tanto para contextos bayesianos como frecuentistas . Estos intervalos se utilizan normalmente en conjuntos de datos de regresión, pero los intervalos de predicción no se utilizan para la extrapolación más allá de los parámetros controlados experimentalmente de los datos anteriores. ^[8]

Lógica difusa

La lógica difusa se utiliza para manejar la toma de decisiones de forma no binaria para la inteligencia artificial, las decisiones médicas y otros campos. En general, toma entradas, las mapea a través de sistemas de inferencia difusa y produce una decisión de salida. Este proceso implica fusificación, evaluación de reglas de lógica difusa y desfusificación. Cuando se analiza la evaluación de reglas de lógica difusa, las funciones de membresía convierten nuestra información de entrada no binaria en variables tangibles. Estas funciones de membresía son esenciales para predecir la incertidumbre del sistema.

Unilateral versus bilateral

Los intervalos bilaterales estiman un parámetro de interés, Θ, con un nivel de confianza, γ, utilizando un límite inferior ( ) y superior ( ). Los ejemplos pueden incluir la estimación de la altura promedio de los hombres en una región geográfica o la longitud de un escritorio en particular fabricado por un fabricante. Estos casos tienden a estimar el valor central de un parámetro. Normalmente, esto se presenta en una forma similar a la siguiente ecuación. ${\ Displaystyle l_ {b}}$ ${\ Displaystyle u_ {b}}$

${\ Displaystyle P (l_ {b} <\ Theta <u_ {b}) = \ gamma}$

A diferencia del intervalo bilateral, el intervalo unilateral utiliza un nivel de confianza, γ, para construir un límite mínimo o máximo que predice el parámetro de interés con una probabilidad γ*100%. Normalmente, se requiere un intervalo unilateral cuando el límite mínimo o máximo de la estimación no es de interés. Cuando nos preocupamos por el valor mínimo predicho de Θ, ya no es necesario encontrar un límite superior de la estimación, lo que lleva a una forma reducida de dos colas.

$P(l_{b}<\Theta )=\gamma$

Como resultado de eliminar el límite superior y mantener la confianza, el límite inferior ( ) aumentará. Del mismo modo, cuando se trata de encontrar sólo un límite superior de la estimación de un parámetro, el límite superior disminuirá. Un intervalo unilateral se encuentra comúnmente en el aseguramiento de la calidad de la producción de materiales , donde un valor esperado de la resistencia de un material, Θ, debe estar por encima de un cierto valor mínimo ( ) con cierta confianza (100γ%). En este caso, al fabricante no le preocupa producir un producto que sea demasiado fuerte, no existe un límite superior ( ). ${\ Displaystyle l_ {b}}$ ${\ Displaystyle l_ {b}}$ ${\ Displaystyle u_ {b}}$

Precaución al utilizar y elaborar estimaciones.

Al determinar la importancia de un parámetro, es mejor comprender los datos y sus métodos de recopilación. Antes de recopilar datos, se debe planificar un experimento de modo que la incertidumbre de los datos sea la variabilidad de la muestra, en lugar de un sesgo estadístico . ^[9] Después de experimentar, un primer paso típico en la creación de estimaciones de intervalo es trazar utilizando varios métodos gráficos. A partir de esto, se puede determinar la distribución de muestras del conjunto de datos. Producir límites de intervalo con suposiciones incorrectas basadas en la distribución hace que la predicción sea errónea. ^[10]

Cuando se informan estimaciones de intervalo, deben tener una interpretación común dentro y fuera de la comunidad científica. Las estimaciones de intervalos derivadas de la lógica difusa tienen significados mucho más específicos de la aplicación.

En situaciones que ocurren comúnmente, deben existir conjuntos de procedimientos estándar que puedan usarse, sujetos a la verificación y validez de cualquier suposición requerida. Esto se aplica tanto a los intervalos de confianza como a los intervalos de credibilidad. Sin embargo, en situaciones más novedosas debería haber orientación sobre cómo formular estimaciones de intervalo. En este sentido, los intervalos de confianza y los intervalos de credibilidad tienen una posición similar, pero existen dos diferencias. En primer lugar, los intervalos creíbles pueden abordar fácilmente información previa, mientras que los intervalos de confianza no. En segundo lugar, los intervalos de confianza son más flexibles y pueden usarse prácticamente en más situaciones que los intervalos creíbles: un área donde los intervalos creíbles sufren en comparación es cuando se trata de modelos no paramétricos .

Debería haber formas de probar el desempeño de los procedimientos de estimación de intervalos. Esto surge porque muchos de estos procedimientos implican aproximaciones de diversos tipos y existe la necesidad de comprobar que la ejecución real de un procedimiento se aproxima a lo que se afirma. El uso de simulaciones estocásticas hace que esto sea sencillo en el caso de intervalos de confianza, pero es algo más problemático para intervalos creíbles donde es necesario tener debidamente en cuenta la información previa. La verificación de intervalos creíbles se puede realizar para situaciones que no representan información previa, pero la verificación implica verificar las propiedades de frecuencia a largo plazo de los procedimientos.

Severini analiza las condiciones bajo las cuales los intervalos creíbles y los intervalos de confianza producirán resultados similares, y también analiza tanto las probabilidades de cobertura de los intervalos creíbles como las probabilidades posteriores asociadas con los intervalos de confianza. ^[11]

En la teoría de la decisión , que es un enfoque común y una justificación de la estadística bayesiana, la estimación de intervalos no es de interés directo. El resultado es una decisión, no una estimación de intervalo y, por tanto, los teóricos de la decisión bayesiana utilizan una acción de Bayes : minimizan la pérdida esperada de una función de pérdida con respecto a toda la distribución posterior, no a un intervalo específico.

Aplicaciones

Las aplicaciones de intervalos de confianza se utilizan para resolver una variedad de problemas relacionados con la incertidumbre. Katz (1975) propone varios desafíos y beneficios al utilizar estimaciones de intervalo en procedimientos legales. ^[12] Para su uso en investigación médica, Altmen (1990) analiza el uso de intervalos de confianza y pautas para su uso. ^[13] En la fabricación, también es común encontrar estimaciones de intervalos que estiman la vida útil de un producto, o para evaluar las tolerancias de un producto. Meeker y Escobar (1998) presentan métodos para analizar datos de confiabilidad bajo estimación paramétrica y no paramétrica, incluida la predicción de variables aleatorias futuras (intervalos de predicción). ^[14]

Ver también

Regla 68–95–99,7
inferencia algorítmica
Probabilidad de cobertura
Estadísticas de estimación
Inducción (filosofía)
Margen de error
Múltiples comparaciones
Filosofía de la estadística
Inferencia predictiva
Problema de Behrens-Fisher Este ha jugado un papel importante en el desarrollo de la teoría detrás de las metodologías estadísticas aplicables.

Referencias

^ Neyman, J. (1937). "Esquema de una teoría de estimación estadística basada en la teoría clásica de la probabilidad". Transacciones filosóficas de la Royal Society de Londres. Serie A, Ciencias Matemáticas y Físicas . 236 (767). La Sociedad de la Realeza: 333–380. Código bibliográfico : 1937RSPTA.236..333N. doi : 10.1098/rsta.1937.0005 . ISSN 0080-4614. JSTOR 91337. S2CID 19584450 . Consultado el 15 de julio de 2021 .
^ Severini, Thomas A. (1991). "Sobre la relación entre estimaciones de intervalos bayesianos y no bayesianos". Revista de la Royal Statistical Society, Serie B (Metodológica) . 53 (3). Wiley: 611–618. doi :10.1111/j.2517-6161.1991.tb01849.x. ISSN 0035-9246.
^ ab Meeker, William Q.; Hahn, Gerald J.; Escobar, Luis A. (27 de marzo de 2017). Intervalos estadísticos: una guía para profesionales e investigadores . Serie Wiley en probabilidad y estadística (1 ed.). Wiley. doi :10.1002/9781118594841. ISBN 978-0-471-68717-7.
^ Hespanhol, Luiz; Vallio, Caio Saín; Costa, Luciola Menezes; Saragiotto, Bruno T (1 de julio de 2019). "Comprensión e interpretación de intervalos de confianza y creíbles en torno a las estimaciones de efectos". Revista Brasileña de Fisioterapia . 23 (4): 290–301. doi :10.1016/j.bjpt.2018.12.006. ISSN 1413-3555. PMC 6630113 . PMID 30638956.
^ Lee, Peter M. (2012). Estadísticas bayesianas: una introducción (4. ed., 1. ed. publ.). Chichester: Wiley. ISBN 978-1-118-33257-3.
^ Hannig, enero; Iyer, Hari; Lai, Randy CS; Lee, Thomas CM (2 de julio de 2016). "Inferencia fiducial generalizada: una revisión y nuevos resultados". Revista de la Asociación Estadounidense de Estadística . 111 (515): 1346-1361. doi :10.1080/01621459.2016.1165102. ISSN 0162-1459.
^ Howe, WG (junio de 1969). "Límites de tolerancia bilateral para poblaciones normales, algunas mejoras". Revista de la Asociación Estadounidense de Estadística . 64 (326): 610. doi : 10.2307/2283644. ISSN 0162-1459.
^ Vardeman, Stephen B. (1992). "¿Qué pasa con los otros intervalos?". El estadístico estadounidense . 46 (3): 193-197. doi :10.2307/2685212. ISSN 0003-1305.
^ Hahn, Gerald J.; Meeker, William Q. (1993). "Supuestos para la inferencia estadística". El estadístico estadounidense . 47 (1): 1–11. doi :10.2307/2684774. ISSN 0003-1305.
^ Hahn, Gerald J.; Doganaksoy, Necip; Meeker, William Q. (1 de agosto de 2019). "Intervalos estadísticos, no importancia estadística". Significado . 16 (4): 20–22. doi : 10.1111/j.1740-9713.2019.01298.x . ISSN 1740-9705.
^ Severini, Thomas A. (1993). "Estimaciones de intervalos bayesianos que también son intervalos de confianza". Revista de la Real Sociedad de Estadística. Serie B (Metodológica) . 55 (2): 533–540. ISSN 0035-9246.
^ Katz, Leo (1975). "Presentación de una Estimación del Intervalo de Confianza como Prueba en un Proceso Judicial". El estadístico estadounidense . 29 (4): 138-142. doi :10.2307/2683480. ISSN 0003-1305.
^ Altman, Douglas G., ed. (2011). Estadísticas con confianza: intervalos de confianza y directrices estadísticas; [incluye disco] (2. ed., [Nachdr.] ed.). Londres: BMJ Books. ISBN 978-0-7279-1375-3.
^ Más manso, William Q.; Escobar, Luis A. (1998). Métodos estadísticos para datos de confiabilidad . Serie de Wiley en probabilidad y estadística Sección de probabilidad y estadística aplicada. Weinheim de Nueva York: Wiley. ISBN 978-0-471-14328-4.

Bibliografía

Kendall, MG y Stuart, A. (1973). La teoría avanzada de la estadística. Vol 2: Inferencia y relación (3.ª edición). Griffin, Londres.

En lo anterior, el Capítulo 20 cubre los intervalos de confianza, mientras que el Capítulo 21 cubre los intervalos fiduciales y los intervalos bayesianos y analiza la comparación de los tres enfoques. Tenga en cuenta que este trabajo es anterior a las metodologías modernas computacionalmente intensivas. Además, el capítulo 21 analiza el problema de Behrens-Fisher.

Meeker, WQ, Hahn, GJ y Escobar, LA (2017). Intervalos estadísticos: una guía para profesionales e investigadores (segunda edición). John Wiley e hijos.

enlaces externos

Introducciones a las matemáticas difusas https://web.archive.org/web/20061205114153/http://blog.peltarion.com/2006/10/25/fuzzy-math-part-1-the-theory
¿Qué es la lógica difusa? https://www.youtube.com/watch?v=__0nZuG4sTw