Intervalo de tolerancia

Un intervalo de tolerancia ( TI ) es un intervalo estadístico dentro del cual, con un cierto nivel de confianza , cae una proporción muestreada específica de una población. "Más específicamente, un intervalo de tolerancia $100\times$ $p$ $%/100\times(1-α)$ proporciona límites dentro de los cuales cae al menos una cierta proporción ( p ) de la población con un nivel de confianza dado (1−α)". ^[1] "Un intervalo de tolerancia (TI) ( p , 1−α) basado en una muestra se construye de modo que incluya al menos una proporción p de la población muestreada con una confianza de 1−α; un TI de este tipo se conoce generalmente como TI de cobertura de contenido p − (1−α)". ^{[2] "Un}límite superior de tolerancia (TL) (p, 1−α) es simplemente un límite superior de confianza de 1−α para el percentil 100 p de la población". ^[2]

Definición

Dado

Observaciones que son la realización de variables aleatorias independientes que tienen una distribución común , con parámetros desconocidos. $\mathbf {x} =(x_{1},\ldots ,x_{n})$ $\mathbf {X} =(X_{1},\ldots ,X_{n})$ $F_{\theta}$ ${\estilo de visualización \theta}$
una variable aleatoria de la misma distribución e independiente de las primeras variables. $Estilo de visualización X_{0}$ $F_{\theta}$ ${\estilo de visualización n}$

Luego, un intervalo de tolerancia con puntos finales que tiene la propiedad definitoria: , sin hacer referencia a una muestra . $(L(\mathbf {x} ),U(\mathbf {x} )]$ $\inf _{\theta }\{{\Pr }_{\theta }\left(F_{\theta }(U(\mathbf {X} ))-F_{\theta }(L(\mathbf {X} )\right)\geq p)\}=100(1-\alpha )$ $Estilo de visualización X_{0}$

Esto contrasta con un intervalo de predicción con puntos finales que tiene la propiedad definitoria . $[l(\mathbf {x}),u(\mathbf {x})]$ $\inf _{\theta }\{{\Pr }_{\theta }(X_{0}\in [l(\mathbf {X} ),u(\mathbf {X} )])\}=100(1-\alpha )$

Cálculo

Los intervalos de tolerancia normales unilaterales tienen una solución exacta en términos de la media de la muestra y la varianza de la muestra según la distribución t no central . ^[3] Los intervalos de tolerancia normales bilaterales se pueden estimar utilizando la distribución de chi-cuadrado . ^[3]

Relación con otros intervalos

"En el caso de parámetros conocidos, un intervalo de tolerancia del 95% y un intervalo de predicción del 95% son lo mismo". ^[4] Si conociéramos los parámetros exactos de una población, podríamos calcular un rango dentro del cual se encuentra una determinada proporción de la población. Por ejemplo, si sabemos que una población se distribuye normalmente con una media y una desviación estándar de , entonces el intervalo incluye el 95% de la población (1,96 es la puntuación z para una cobertura del 95% de una población distribuida normalmente). ${\estilo de visualización \mu}$ $\sigma$ $\mu \pm 1.96\sigma$

Sin embargo, si sólo tenemos una muestra de la población, sólo conocemos la media de la muestra y la desviación estándar de la muestra , que son sólo estimaciones de los parámetros verdaderos. En ese caso, no necesariamente incluirá el 95% de la población, debido a la varianza en estas estimaciones. Un intervalo de tolerancia limita esta varianza introduciendo un nivel de confianza , que es la confianza con la que este intervalo incluye realmente la proporción especificada de la población. Para una población distribuida normalmente, una puntuación z se puede transformar en un " factor k " o factor de tolerancia ^[5] para un determinado a través de tablas de búsqueda o varias fórmulas de aproximación. ^[6] "A medida que los grados de libertad se acercan al infinito, los intervalos de predicción y tolerancia se vuelven iguales". ^[7] ${\hat {\mu }}$ ${\hat {\sigma }}$ ${\hat {\mu }}\pm 1.96{\hat {\sigma }}$ $\gamma$ $\gamma$

El intervalo de tolerancia es menos conocido que el intervalo de confianza y el intervalo de predicción , una situación que algunos educadores han lamentado, ya que puede llevar a un mal uso de los otros intervalos donde un intervalo de tolerancia es más apropiado. ^[8]^[9]

El intervalo de tolerancia se diferencia de un intervalo de confianza en que el intervalo de confianza limita un parámetro de población de un solo valor (la media o la varianza , por ejemplo) con cierta confianza, mientras que el intervalo de tolerancia limita el rango de valores de datos que incluye una proporción específica de la población. Mientras que el tamaño de un intervalo de confianza se debe completamente al error de muestreo y se acercará a un intervalo de ancho cero en el parámetro de población real a medida que aumenta el tamaño de la muestra, el tamaño de un intervalo de tolerancia se debe en parte al error de muestreo y en parte a la varianza real en la población, y se acercará al intervalo de probabilidad de la población a medida que aumenta el tamaño de la muestra. ^[8]^[9]

El intervalo de tolerancia está relacionado con un intervalo de predicción en el sentido de que ambos establecen límites a la variación en muestras futuras. Sin embargo, el intervalo de predicción solo limita una única muestra futura, mientras que un intervalo de tolerancia limita a toda la población (equivalentemente, una secuencia arbitraria de muestras futuras). En otras palabras, un intervalo de predicción cubre una proporción específica de una población en promedio , mientras que un intervalo de tolerancia la cubre con un cierto nivel de confianza , lo que hace que el intervalo de tolerancia sea más apropiado si se pretende que un único intervalo limite múltiples muestras futuras. ^[9]^[10]

Ejemplos

^[8] da el siguiente ejemplo:

Consideremos, pues, una vez más el caso típico de una prueba de kilometraje de la EPA , en la que se prueban varios automóviles nominalmente idénticos de un modelo determinado para obtener cifras de kilometraje . Si se procesan esos datos para obtener un intervalo de confianza del 95% para el kilometraje medio del modelo, es posible, por ejemplo, utilizarlo para proyectar el consumo medio o total de gasolina de la flota fabricada de esos automóviles durante sus primeras 5.000 millas de uso. Sin embargo, un intervalo de ese tipo no sería de mucha ayuda para una persona que alquilase uno de esos coches y se preguntara si el depósito de gasolina (lleno) de 10 galones sería suficiente para recorrer las 350 millas hasta su destino. Para esa tarea, un intervalo de predicción sería mucho más útil. (Consideremos las diferentes implicaciones de estar "95% seguro" de que, en contraposición a estar "95% seguro" de que .) Pero ni un intervalo de confianza ni un intervalo de predicción para un único kilometraje adicional es exactamente lo que necesita un ingeniero de diseño encargado de determinar qué tamaño de tanque de gasolina necesita realmente el modelo para garantizar que el 99% de los autos producidos tengan una autonomía de crucero de 400 millas. Lo que el ingeniero realmente necesita es un intervalo de tolerancia para una fracción de los kilometrajes de dichos autos. $y_{1},y_{2},...,y_{n}$ $\mu \geq 35$ $y_{n+1}\geq 35$ $\mu$ $p=.99$

Otro ejemplo lo da: ^[10]

Los niveles de plomo en el aire se recogieron en diferentes áreas dentro de las instalaciones. Se observó que los niveles de plomo transformados logarítmicamente se ajustaban bien a una distribución normal (es decir, los datos son de una distribución logarítmica normal . Sea y , respectivamente, la media y la varianza de la población para los datos transformados logarítmicamente. Si denota la variable aleatoria correspondiente, tenemos entonces . Observamos que es el nivel medio de plomo en el aire. Se puede construir un intervalo de confianza para de la forma habitual, con base en la distribución t ; esto a su vez proporcionará un intervalo de confianza para el nivel medio de plomo en el aire. Si y denotan la media muestral y la desviación estándar de los datos transformados logarítmicamente para una muestra de tamaño n, un intervalo de confianza del 95% para viene dado por , donde denota el cuantil de una distribución t con grados de libertad. También puede ser interesante derivar un límite superior de confianza del 95% para el nivel medio de plomo en el aire. Dicho límite para viene dado por . En consecuencia, un límite superior de confianza del 95% para el nivel medio de plomo en el aire viene dado por . Ahora supongamos que queremos predecir el nivel de plomo en el aire en un área particular dentro del laboratorio. Un límite superior de predicción del 95% para el nivel de plomo transformado logarítmicamente se da por . Se puede calcular de manera similar un intervalo de predicción bilateral. El significado y la interpretación de estos intervalos son bien conocidos. Por ejemplo, si el intervalo de confianza se calcula repetidamente a partir de muestras independientes, el 95% de los intervalos calculados incluirán el valor verdadero de , a largo plazo. En otras palabras, el intervalo está destinado a proporcionar información sobre el parámetro únicamente. Un intervalo de predicción tiene una interpretación similar y está destinado a proporcionar información sobre un solo nivel de plomo únicamente. Ahora supongamos que queremos utilizar la muestra para concluir si al menos el 95% de los niveles de plomo de la población están por debajo de un umbral. El intervalo de confianza y el intervalo de predicción no pueden responder a esta pregunta, ya que el intervalo de confianza es solo para el nivel de plomo medio y el intervalo de predicción es solo para un solo nivel de plomo. Lo que se requiere es un intervalo de tolerancia; más específicamente, un límite superior de tolerancia. El límite superior de tolerancia se debe calcular sujeto a la condición de que al menos el 95% de los niveles de plomo de la población estén por debajo del límite, con un cierto nivel de confianza, digamos 99%. $n=15$ $\mu$ $\sigma ^{2}$ $X$ $X\sim {\mathcal {N}}(\mu ,\sigma ^{2})$ $\exp(\mu )$ $\mu$ ${\bar {X}}$ $S$ $\mu$ ${\bar {X}}\pm t_{n-1,0.975}S/{\sqrt {n}}$ $t_{m,1-\alpha }$ $1-\alpha$ $m$ $\mu$ ${\bar {X}}+t_{n-1,0.95}S/{\sqrt {n}}$ $\exp {\left({\bar {X}}+t_{n-1,0.95}S/{\sqrt {n}}\right)}$ ${\bar {X}}+t_{n-1,0.95}S{\sqrt {\left(1+1/n\right)}}$ ${\bar {X}}\pm t_{n-1,0.975}S/{\sqrt {n}}$ $\mu$ $\mu$

Véase también

Referencias

^ DS Young (2010), Reseñas de libros: "Regiones de tolerancia estadística: teoría, aplicaciones y computación", TECHNOMETRICS, FEBRERO DE 2010, VOL. 52, N.º 1, págs. 143-144.
^ ab Krishnamoorthy, K. y Lian, Xiaodong (2011) 'Intervalos de tolerancia aproximados de forma cerrada para algunos modelos lineales generales y estudios de comparación', Journal of Statistical Computation and Simulation, publicado por primera vez el: 13 de junio de 2011 doi :10.1080/00949655.2010.545061
^ ab Derek S. Young (agosto de 2010). «tolerancia: un paquete R para estimar intervalos de tolerancia». Journal of Statistical Software . 36 (5): 1–39. ISSN 1548-7660 . Consultado el 19 de febrero de 2013 ., pág. 23
^ Thomas P. Ryan (22 de junio de 2007). Estadística de ingeniería moderna. John Wiley & Sons. pp. 222–. ISBN 978-0-470-12843-5. Recuperado el 22 de febrero de 2013 .
^ "Interpretación estadística de datos — Parte 6: Determinación de intervalos de tolerancia estadística". ISO 16269-6. 2014. pág. 2.
^ "Intervalos de tolerancia para una distribución normal". Manual de estadística de ingeniería . NIST/Sematech. 2010. Consultado el 26 de agosto de 2011 .
^ De Gryze, S.; Langhans, I.; Vandebroek, M. (2007). "Uso de los intervalos correctos para la predicción: un tutorial sobre intervalos de tolerancia para la regresión de mínimos cuadrados ordinarios". Quimiometría y sistemas de laboratorio inteligentes . 87 (2): 147. doi :10.1016/j.chemolab.2007.03.002.
^ abc Stephen B. Vardeman (1992). "¿Qué pasa con los otros intervalos?". The American Statistician . 46 (3): 193–197. doi :10.2307/2685212. JSTOR 2685212.
^ abc Mark J. Nelson (14 de agosto de 2011). "Quizás le convenga un intervalo de tolerancia" . Consultado el 26 de agosto de 2011 .
^ ab K. Krishnamoorthy (2009). Regiones de tolerancia estadística: teoría, aplicaciones y computación . John Wiley and Sons. págs. 1–6. ISBN 978-0-470-38026-0.

Lectura adicional

Hahn, Gerald J.; Meeker, William Q.; Escobar, Luis A. (2017). Intervalos estadísticos: una guía para profesionales e investigadores (2.ª ed.). John Wiley & Sons, Incorporated. ISBN 978-0-471-68717-7.

K. Krishnamoorthy (2009). Regiones de tolerancia estadística: teoría, aplicaciones y computación . John Wiley and Sons. ISBN 978-0-470-38026-0.; El capítulo 1, "Preliminares", está disponible en http://media.wiley.com/product_data/excerpt/68/04703802/0470380268.pdf
Derek S. Young (agosto de 2010). «tolerancia: un paquete R para estimar intervalos de tolerancia». Journal of Statistical Software . 36 (5): 1–39. ISSN 1548-7660 . Consultado el 19 de febrero de 2013 .
ISO 16269-6, Interpretación estadística de datos, Parte 6: Determinación de intervalos de tolerancia estadística, Comité Técnico ISO/TC 69, Aplicaciones de métodos estadísticos. Disponible en http://standardsproposals.bsigroup.com/home/getpdf/458