stringtranslate.com

Intervalo de confianza de proporción binomial

En estadística , un intervalo de confianza de proporción binomial es un intervalo de confianza para la probabilidad de éxito calculado a partir del resultado de una serie de experimentos de éxito-fracaso ( ensayos de Bernoulli ). En otras palabras, un intervalo de confianza de proporción binomial es una estimación de intervalo de una probabilidad de éxito cuando sólo se conocen el número de experimentos y el número de éxitos .

Existen varias fórmulas para un intervalo de confianza binomial, pero todas se basan en el supuesto de una distribución binomial . En general, se aplica una distribución binomial cuando un experimento se repite un número fijo de veces, cada prueba del experimento tiene dos resultados posibles (éxito y fracaso), la probabilidad de éxito es la misma para cada prueba y las pruebas son estadísticamente independientes . . Debido a que la distribución binomial es una distribución de probabilidad discreta (es decir, no continua) y difícil de calcular para un gran número de ensayos, se utiliza una variedad de aproximaciones para calcular este intervalo de confianza, todas con sus propias compensaciones en precisión e intensidad computacional.

Un ejemplo simple de distribución binomial es el conjunto de varios resultados posibles, y sus probabilidades, para el número de caras que se observa cuando se lanza una moneda diez veces. La proporción binomial observada es la fracción de lanzamientos que resultan cara. Dada esta proporción observada, el intervalo de confianza para la probabilidad real de que la moneda caiga en cara es un rango de proporciones posibles, que pueden contener o no la proporción real. Por ejemplo, un intervalo de confianza del 95% para la proporción contendrá la proporción verdadera el 95% de las veces que se emplee el procedimiento para construir el intervalo de confianza. [1]

Problemas con el uso de una aproximación normal o "intervalo de Wald"

Trazar el intervalo de aproximación normal en una curva logística arbitraria revela problemas de sobrepaso e intervalos de ancho cero . [2]

Una fórmula comúnmente utilizada para un intervalo de confianza binomial se basa en aproximar la distribución del error sobre una observación distribuida binomialmente, con una distribución normal . [3] La aproximación normal depende del teorema de Moivre-Laplace (la versión original, solo binomial , del teorema del límite central ) y se vuelve poco confiable cuando viola las premisas de los teoremas, a medida que el tamaño de la muestra se vuelve pequeño o la probabilidad de éxito crece. cerca de 0 o 1  . [4]

Utilizando la aproximación normal, la probabilidad de éxito se estima mediante

¿Dónde está la proporción de éxitos en un proceso de prueba de Bernoulli y un estimador de la distribución de Bernoulli subyacente ? La fórmula equivalente en términos de recuentos de observaciones es

donde los datos son el resultado de ensayos que arrojaron éxitos y fracasos. El argumento de la función de distribución es el cuantil de una distribución normal estándar (es decir, el probit ) correspondiente a la tasa de error objetivo. Para un nivel de confianza del 95%, el error so y

Cuando se utiliza la fórmula de Wald para estimar , o simplemente se consideran los posibles resultados de este cálculo, inmediatamente se hacen evidentes dos problemas:

(Otra versión del segundo problema, el de sobreimpulso, surge cuando, en cambio, cae por debajo del mismo límite superior: probabilidad demasiado alta/demasiado cercana a 1  ).

Una derivación teórica importante de este intervalo de confianza implica la inversión de una prueba de hipótesis. Según esta formulación, el intervalo de confianza representa aquellos valores del parámetro poblacional que tendrían valores grandes si se probaran como una proporción poblacional hipotética . [ se necesita aclaración ] La colección de valores para los cuales la aproximación normal es válida se puede representar como

¿Dónde está el cuantil inferior de una distribución normal estándar , frente a cuál es el cuantil superior ?

Dado que la prueba en medio de la desigualdad es una prueba de Wald , el intervalo de aproximación normal a veces se denomina intervalo de Wald o método de Wald , en honor a Abraham Wald , pero fue descrito por primera vez por Laplace (1812). [5]

Poner entre corchetes el intervalo de confianza

Ampliando los conceptos de aproximación normal y de intervalo de Wald-Laplace, Michael Short ha demostrado que las desigualdades en el error de aproximación entre la distribución binomial y la distribución normal se pueden utilizar para delimitar con precisión la estimación del intervalo de confianza alrededor de [6]

con

y donde está nuevamente la proporción (desconocida) de éxitos en un proceso de prueba de Bernoulli (a diferencia de lo que la estima) medida con pruebas que arrojan éxitos, es el cuantil de una distribución normal estándar (es decir, el probit) correspondiente a la tasa de error objetivo y las constantes y son funciones algebraicas simples de [6] Para un valor fijo (y por lo tanto ), las desigualdades anteriores dan intervalos de uno o dos lados fácilmente calculables que abarcan los límites de confianza superior e inferior binomial exactos correspondientes a la tasa de error.

Error estándar de una estimación de proporción cuando se utilizan datos ponderados

Sea una muestra aleatoria simple donde cada una sea iid de una distribución de Bernoulli (p) y el peso sea el peso de cada observación, con los pesos (positivos) normalizados para que sumen 1  . La proporción muestral ponderada es: Dado que cada una de ellas es independiente de todas las demás, y cada una tiene varianza para cada la varianza muestral de la proporción por lo tanto es: [7]

El error estándar de es la raíz cuadrada de esta cantidad. Como no lo sabemos, tenemos que estimarlo. Aunque hay muchos estimadores posibles, uno convencional es utilizar la media muestral e introducirla en la fórmula. Eso da:

Para datos que de otro modo no estarían ponderados, las ponderaciones efectivas son uniformes, lo que conduce a las fórmulas familiares, lo que demuestra que el cálculo para datos ponderados es una generalización directa de ellas.

Intervalo de puntuación de Wilson

Intervalos de puntuación de Wilson trazados en una curva logística, lo que revela asimetría y buen rendimiento para n pequeño y donde p está en o cerca de 0 o 1.

El intervalo de puntuación de Wilson fue desarrollado por EB Wilson (1927). [8] Es una mejora con respecto al intervalo de aproximación normal en múltiples aspectos: a diferencia del intervalo de aproximación normal simétrico (arriba), el intervalo de puntuación de Wilson es asimétrico y no sufre los problemas de sobreimpulso ni de intervalos de ancho cero que afectan el intervalo normal. Puede emplearse de forma segura con muestras pequeñas y observaciones sesgadas. [3] La probabilidad de cobertura observada es consistentemente más cercana al valor nominal, [2]

Al igual que el intervalo normal, el intervalo se puede calcular directamente a partir de una fórmula.

Wilson comenzó con la aproximación normal al binomio:

donde es el ancho medio del intervalo normal estándar correspondiente a la confianza deseada. La fórmula analítica para una desviación estándar de una muestra binomial es

o

Transformar la relación en una ecuación cuadrática de forma estándar para tratar y como valores conocidos de la muestra (ver sección anterior), y usar el valor de que corresponde a la confianza deseada para la estimación de da esto:

donde hay una abreviatura de

Una expresión equivalente que utiliza los recuentos de observaciones y es

con los recuentos anteriores: el recuento de "éxitos" observados, el recuento de "fracasos" observados y su suma es el número total de observaciones

En pruebas prácticas de los resultados de la fórmula, los usuarios encuentran que este intervalo tiene buenas propiedades incluso para un pequeño número de ensayos y/o los extremos de la estimación de probabilidad, [2] [3] [9]

Intuitivamente, el valor central de este intervalo es el promedio ponderado de y con mayor peso a medida que aumenta el tamaño de la muestra. Formalmente, el valor central corresponde al uso de un pseudoconteo del número de desviaciones estándar del intervalo de confianza: agregue este número al recuento de éxitos y fracasos para obtener la estimación de la proporción. Para las dos desviaciones estándar comunes en cada intervalo de dirección (aproximadamente 95% de cobertura, que a su vez es aproximadamente 1,96 desviaciones estándar), esto produce la estimación que se conoce como la "regla más cuatro".

Aunque la cuadrática se puede resolver explícitamente, en la mayoría de los casos las ecuaciones de Wilson también se pueden resolver numéricamente usando la iteración de punto fijo.

con

El intervalo de Wilson también se puede derivar de la prueba z de muestra única o de la prueba chi-cuadrado de Pearson con dos categorías. El intervalo resultante,

(con el cuantil inferior ) se puede resolver para producir el intervalo de puntuación de Wilson. La prueba en medio de la desigualdad es una prueba de puntuación .

El principio de igualdad de intervalos

La función de densidad de probabilidad ( PDF ) para el intervalo de puntuación de Wilson, más las PDF en los límites del intervalo. Las áreas de la cola son iguales.

Dado que el intervalo se deriva resolviendo a partir de la aproximación normal al binomio, el intervalo de puntuación de Wilson tiene la propiedad de garantizar la obtención del mismo resultado que la prueba z equivalente o la prueba de chi cuadrado .

Esta propiedad se puede visualizar trazando la función de densidad de probabilidad para el intervalo de puntuación de Wilson ( ver Wallis). [9] (págs. 297-313) Después de eso, también trazar un PDF normal en cada encuadernación. Las áreas de la cola de las distribuciones normal y de Wilson resultantes representan la probabilidad de que un resultado significativo, en esa dirección, debe ser igual.

El intervalo de puntuación de Wilson corregido por continuidad y el intervalo de Clopper-Pearson también cumplen con esta propiedad. La importancia práctica es que estos intervalos pueden emplearse como pruebas de significancia , con resultados idénticos a los de la prueba fuente, y se pueden derivar nuevas pruebas mediante geometría. [9]

Intervalo de puntuación de Wilson con corrección de continuidad

El intervalo de Wilson puede modificarse empleando una corrección de continuidad , para alinear la probabilidad de cobertura mínima , en lugar de la probabilidad de cobertura promedio, con el valor nominal.

Así como el intervalo de Wilson refleja la prueba chi-cuadrado de Pearson , el intervalo de Wilson con corrección de continuidad refleja la prueba equivalente de chi-cuadrado de Yates .

Las siguientes fórmulas para los límites inferior y superior del intervalo de puntuación de Wilson con corrección de continuidad se derivan de Newcombe: [2]

Para y

Si entonces, en su lugar, debe establecerse en Si , entonces, en su lugar, debe establecerse en

Wallis (2021) [9] identifica un método más simple para calcular intervalos de Wilson corregidos por continuidad que emplea una función especial basada en la fórmula del límite inferior de Wilson: en la notación de Wallis, para el límite inferior, sea

¿Dónde está el nivel de error tolerable seleccionado para Entonces?

Este método tiene la ventaja de ser aún más descomponible.

intervalo de jeffrey

El intervalo de Jeffreys tiene una derivación bayesiana, pero buenas propiedades frecuentistas (superando a la mayoría de las construcciones frecuentistas). En particular, tiene propiedades de cobertura similares a las del intervalo de Wilson, pero es uno de los pocos intervalos con la ventaja de tener colas iguales (por ejemplo, para un intervalo de confianza del 95%, las probabilidades del intervalo que se encuentra por encima o por debajo del valor real están ambos cerca del 2,5%). Por el contrario, el intervalo de Wilson tiene un sesgo sistemático tal que se centra demasiado cerca de [10]

El intervalo de Jeffreys es el intervalo de credibilidad bayesiano obtenido al utilizar el previo de Jeffreys no informativo para la proporción binomial. El intervalo de Jeffreys para este problema es una distribución Beta con parámetros a priori conjugado . Después de observar éxitos en las pruebas, la distribución posterior es una distribución Beta con parámetros

Cuándo y el intervalo de Jeffreys se considera el intervalo de probabilidad posterior de colas iguales, es decir, los cuantiles y de una distribución Beta con parámetros

Para evitar que la probabilidad de cobertura tienda a cero cuando o 1  , cuando el límite superior se calcula como antes pero el límite inferior se establece en 0  , y cuando el límite inferior se calcula como antes pero el límite superior se establece en 1  . [4]

El intervalo de Jeffreys también se puede considerar como un intervalo frecuentista basado en invertir el valor p de la prueba G después de aplicar la corrección de Yates para evitar un valor potencialmente infinito para la estadística de prueba.

Intervalo de Clopper-Pearson

El intervalo de Clopper-Pearson es un método temprano y muy común para calcular intervalos de confianza binomiales. [11] Esto a menudo se denomina método "exacto", ya que alcanza el nivel de cobertura nominal en un sentido exacto, lo que significa que el nivel de cobertura nunca es menor que el nominal [2]

El intervalo de Clopper-Pearson se puede escribir como

o equivalente,

con

y

donde es el número de éxitos observados en la muestra y es una variable aleatoria binomial con ensayos y probabilidad de éxito

De manera equivalente podemos decir que el intervalo de Clopper-Pearson tiene un nivel de confianza si es el mínimo de aquellos tales que las siguientes pruebas de hipótesis tienen éxito con significancia

  1. H 0 : con H A :
  2. H 0 : con H A :

Debido a una relación entre la distribución binomial y la distribución beta , el intervalo de Clopper-Pearson a veces se presenta en un formato alternativo que utiliza cuantiles de la distribución beta. [12]

donde es el número de éxitos, es el número de intentos y es el pésimo cuantil de una distribución beta con parámetros de forma y

Así, donde:

El intervalo de confianza de la proporción binomial es entonces el siguiente a partir de la relación entre la función de distribución acumulativa de la distribución binomial y la función beta incompleta regularizada .

Cuando es 0 o hay disponibles expresiones en forma cerrada para los límites del intervalo: cuando el intervalo es

y cuando es

[12]

La distribución beta está, a su vez, relacionada con la distribución F, por lo que se puede escribir una tercera formulación del intervalo de Clopper-Pearson utilizando F cuantiles:

donde es el número de éxitos, es el número de ensayos y es el cuantil de una distribución F con y grados de libertad. [13]

El intervalo de Clopper-Pearson es un intervalo "exacto", ya que se basa directamente en la distribución binomial en lugar de cualquier aproximación a la distribución binomial. Este intervalo nunca tiene una cobertura inferior a la nominal para cualquier proporción de población, pero eso significa que suele ser conservador. Por ejemplo, la verdadera tasa de cobertura de un intervalo de Clopper-Pearson del 95% puede estar muy por encima del 95%, dependiendo de y [4] Por lo tanto, el intervalo puede ser más amplio de lo necesario para lograr un 95% de confianza y más amplio que otros intervalos. . Por el contrario, vale la pena señalar que otros intervalos de confianza pueden tener niveles de cobertura inferiores al nominal , es decir, el intervalo de aproximación normal (o "estándar"), el intervalo de Wilson, [8] el intervalo de Agresti-Coull, [13] , etc. , con una cobertura nominal del 95% puede en realidad cubrir menos del 95%, [4] incluso para muestras de gran tamaño. [12]

La definición del intervalo de Clopper-Pearson también se puede modificar para obtener intervalos de confianza exactos para diferentes distribuciones. Por ejemplo, también se puede aplicar al caso en el que las muestras se extraen sin reemplazo de una población de tamaño conocido, en lugar de extracciones repetidas de una distribución binomial. En este caso, la distribución subyacente sería la distribución hipergeométrica .

Los límites del intervalo se pueden calcular con funciones numéricas qbeta [14] en R y scipy.stats.beta.ppf [15] en Python.

de  scipy.stats  importe  beta k  =  20 n  =  400 alfa  =  0,05 p_u ,  p_o  =  beta . ppf ([ alfa / 2 ,  1  -  alfa / 2 ],  [ k ,  k  +  1 ],  [ n  -  k  +  1 ,  n  -  k ])

Intervalo de Agresti-Coull

El intervalo de Agresti-Coull es también otro intervalo de confianza binomial aproximado. [13]

Dados los éxitos en los ensayos, defina

y

Entonces, un intervalo de confianza para está dado por

donde es el cuantil de una distribución normal estándar, como antes (por ejemplo, un intervalo de confianza del 95% requiere producir ). Según Brown , Cai y DasGupta (2001), [4] tomar en lugar de 1,96 produce el intervalo de "sumar 2 éxitos y 2 fracasos" descrito previamente por Agresti y Coull . [13]

Este intervalo se puede resumir empleando el ajuste del punto central del intervalo de puntuación de Wilson y luego aplicando la aproximación Normal a este punto. [3] [4]

Transformación arcoseno

La transformación arcoseno tiene el efecto de sacar los extremos de la distribución. [16] Si bien puede estabilizar la varianza (y por lo tanto los intervalos de confianza) de los datos de proporciones, su uso ha sido criticado en varios contextos. [17]

Sea el número de éxitos en las pruebas y sea la varianza de es

Usando la transformada arcoseno , la varianza del arcoseno de es [18]

Entonces, el intervalo de confianza en sí tiene la forma

donde es el cuantil de una distribución normal estándar.

Este método se puede utilizar para estimar la varianza de pero su uso es problemático cuando está cerca de 0 o 1  .

t una transformación

Sea la proporción de éxitos. Para

Esta familia es una generalización de la transformada logit, que es un caso especial con a = 1 y se puede utilizar para transformar una distribución de datos proporcional en una distribución aproximadamente normal . El parámetro a debe estimarse para el conjunto de datos.

Regla de tres: para cuando no se observen éxitos

La regla de tres se utiliza para proporcionar una forma sencilla de establecer un intervalo de confianza aproximado del 95% en el caso especial de que no se hayan observado éxitos ( ). [19] El intervalo es

Por simetría, en el caso de sólo éxitos ( ), el intervalo es

Comparación y discusión

Existen varios artículos de investigación que comparan estos y otros intervalos de confianza para la proporción binomial. [3] [2] [20] [21]

Tanto Ross (2003) [22] como Agresti y Coull (1998) [13] señalan que los métodos exactos como el intervalo de Clopper-Pearson pueden no funcionar tan bien como algunas aproximaciones. El intervalo de aproximación normal y su presentación en los libros de texto ha sido fuertemente criticado, y muchos estadísticos abogan por que no se utilice. [4] Los principales problemas son el exceso (los límites exceden ), intervalos de ancho cero en o 1 (lo que implica falsamente certeza), [2] y la inconsistencia general con las pruebas de significancia. [3]

De las aproximaciones enumeradas anteriormente, se ha demostrado que los métodos de intervalo de puntuación de Wilson (con o sin corrección de continuidad) son los más precisos y sólidos, [3] [4] [2] aunque algunos prefieren el enfoque de Agresti y Coulls para muestras más grandes. tamaños. [4] Los métodos de Wilson y Clopper-Pearson obtienen resultados consistentes con las pruebas de significancia de la fuente, [9] y esta propiedad es decisiva para muchos investigadores.

Muchos de estos intervalos se pueden calcular en R usando paquetes como binom . [23]

Ver también

Referencias

  1. ^ Sullivan, Lisa (27 de octubre de 2017). "Intervalos de confianza". sphweb.bumc.bu.edu (notas del curso). Boston, MA: Escuela de Salud Pública de la Universidad de Boston . BS704.
  2. ^ abcdefgh Newcombe, RG (1998). "Intervalos de confianza bilaterales para una proporción única: comparación de siete métodos". Estadística en Medicina . 17 (8): 857–872. doi :10.1002/(SICI)1097-0258(19980430)17:8<857::AID-SIM777>3.0.CO;2-E. PMID  9595616.
  3. ^ abcdefg Wallis, Sean A. (2013). "Intervalos de confianza binomiales y pruebas de contingencia: fundamentos matemáticos y evaluación de métodos alternativos" (PDF) . Revista de Lingüística Cuantitativa . 20 (3): 178–208. doi :10.1080/09296174.2013.799918. S2CID  16741749.
  4. ^ abcdefghi Brown, Lawrence D .; Cai, T. Tony ; DasGupta, Anirban (2001). "Estimación de intervalos para una proporción binomial". Ciencia estadística . 16 (2): 101-133. CiteSeerX 10.1.1.50.3025 . doi :10.1214/ss/1009213286. SEÑOR  1861069. Zbl  1059.62533. 
  5. ^ Laplace, PS (1812). Théorie analytique des probabilités [ Teoría analítica de la probabilidad ] (en francés). Ve. Mensajero. pag. 283.
  6. ^ ab Short, Michael (8 de noviembre de 2021). "Sobre límites binomiales de cuantiles y proporciones: con aplicaciones en ingeniería e informática". Comunicaciones en Estadística - Teoría y Métodos . 52 (12): 4183–4199. doi : 10.1080/03610926.2021.1986540 . ISSN  0361-0926. S2CID  243974180.
  7. ^ "¿Cómo calcular el error estándar de una proporción utilizando datos ponderados?". stats.stackexchange.com . 159220/253.
  8. ^ ab Wilson, EB (1927). "Inferencia probable, ley de sucesión e inferencia estadística". Revista de la Asociación Estadounidense de Estadística . 22 (158): 209–212. doi :10.1080/01621459.1927.10502953. JSTOR  2276774.
  9. ^ abcde Wallis, Sean A. (2021). Estadística en Lingüística de Corpus: un nuevo enfoque. Nueva York, Nueva York: Routledge. ISBN 9781138589384.
  10. ^ Cai, TT (2005). "Intervalos de confianza unilaterales en distribuciones discretas". Revista de planificación e inferencia estadística . 131 (1): 63–88. doi :10.1016/j.jspi.2004.01.005.
  11. ^ Cloper, C.; Pearson, ES (1934). "El uso de límites de confianza o fiduciarios ilustrados en el caso del binomio". Biometrika . 26 (4): 404–413. doi :10.1093/biomet/26.4.404.
  12. ^ abc Thulin, Måns (1 de enero de 2014). "El costo de utilizar intervalos de confianza exactos para una proporción binomial". Revista Electrónica de Estadística . 8 (1): 817–840. arXiv : 1303.1288 . doi :10.1214/14-EJS909. ISSN  1935-7524. S2CID  88519382.
  13. ^ abcdeAgresti , Alan ; Coull, Brent A. (1998). "Aproximado es mejor que 'exacto' para la estimación de intervalos de proporciones binomiales". El estadístico estadounidense . 52 (2): 119-126. doi :10.2307/2685469. JSTOR  2685469. SEÑOR  1628435.
  14. ^ "La distribución Beta". stat.ethz.ch (documento de software). Manual R. Consultado el 2 de diciembre de 2023 .
  15. ^ "scipy.stats.beta". Manual de ciencia ficción. docs.scipy.org (documento de software) (1.11.4 ed.) . Consultado el 2 de diciembre de 2023 .
  16. ^ Holanda, Steven. "Transformaciones de proporciones y porcentajes". estrata.uga.edu . Consultado el 8 de septiembre de 2020 .
  17. ^ Warton, David I.; Hui, Francis KC (enero de 2011). "El arcoseno es una tontería: el análisis de proporciones en ecología". Ecología . 92 (1): 3–10. Código Bib :2011Ecol...92....3W. doi :10.1890/10-0340.1. hdl : 1885/152287 . ISSN  0012-9658. PMID  21560670.
  18. ^ Shao, J. (1998). Estadística Matemática . Nueva York, Nueva York: Springer.
  19. ^ Simón, Steve (2010). "Intervalo de confianza con cero eventos". Pregúntele al profesor Mean. Kansas City, MO: Hospital Infantil Mercy. Archivado desde el original el 15 de octubre de 2011.Temas estadísticos sobre Investigación Médica
  20. ^ Sauro, J.; Lewis, JR (2005). Comparación de la calculadora de intervalos Wald, Adj-Wald, exacto y Wilson (PDF) . Sociedad de Factores Humanos y Ergonomía, 49ª Reunión Anual (HFES 2005). Orlando, Florida. págs. 2100-2104. Archivado desde el original (PDF) el 18 de junio de 2012.
  21. ^ Reiczigel, J. (2003). "Intervalos de confianza para el parámetro binomial: algunas consideraciones nuevas" (PDF) . Estadística en Medicina . 22 (4): 611–621. doi :10.1002/sim.1320. PMID  12590417. S2CID  7715293.
  22. ^ Ross, TD (2003). "Intervalos de confianza precisos para la proporción binomial y la estimación de la tasa de Poisson". Computadoras en Biología y Medicina . 33 (6): 509–531. doi :10.1016/S0010-4825(03)00019-2. PMID  12878234.
  23. ^ Dorai-Raj, Sundar (2 de mayo de 2022). binom: Intervalos de confianza binomiales para varias parametrizaciones (documento de software) . Consultado el 2 de diciembre de 2023 .