stringtranslate.com

Lema de Neyman-Pearson

En estadística , el lema de Neyman-Pearson describe la existencia y unicidad de la razón de verosimilitud como una prueba uniformemente más poderosa en ciertos contextos. Fue introducido por Jerzy Neyman y Egon Pearson en un artículo en 1933. [1] El lema de Neyman-Pearson es parte de la teoría de Neyman-Pearson de pruebas estadísticas, que introdujo conceptos como errores de segundo tipo , función de potencia y comportamiento inductivo. [2] [3] [4] La teoría fisheriana anterior de pruebas de significación postulaba solo una hipótesis. Al introducir una hipótesis en competencia, la versión Neyman-Pearsoniana de las pruebas estadísticas permite investigar los dos tipos de errores . Los casos triviales en los que uno siempre rechaza o acepta la hipótesis nula son de poco interés, pero sí prueban que uno no debe renunciar al control sobre un tipo de error mientras calibra el otro. En consecuencia, Neyman y Pearson procedieron a restringir su atención a la clase de pruebas de todos los niveles, mientras que posteriormente minimizaron el error de tipo II, tradicionalmente denotado por . Su artículo seminal de 1933, incluido el lema de Neyman-Pearson, llega al final de este esfuerzo, no solo mostrando la existencia de pruebas con la mayor potencia que retienen un nivel preespecificado de error de tipo I ( ), sino también proporcionando una manera de construir tales pruebas. El teorema de Karlin-Rubin extiende el lema de Neyman-Pearson a entornos que involucran hipótesis compuestas con razones de verosimilitud monótonas.

Declaración

Consideremos una prueba con hipótesis y , donde la función de densidad de probabilidad (o función de masa de probabilidad ) es para .

Para cualquier prueba de hipótesis con conjunto de rechazo y cualquier , decimos que satisface la condición si

donde es un conjunto despreciable en ambos casos y : .

Para cualquier , sea el conjunto de pruebas de nivel el conjunto de todas las pruebas de hipótesis con un tamaño como máximo . Es decir, siendo su conjunto de rechazo , tenemos .

Lema de Neyman-Pearson [5]  —  Existencia:

Si una prueba de hipótesis satisface una condición, entonces es una prueba uniformemente más poderosa (UMP) en el conjunto de pruebas de nivel.

Unicidad: Si existe una prueba de hipótesis que satisface la condición, con , entonces cada prueba UMP en el conjunto de pruebas de nivel satisface la condición con el mismo .

Además, la prueba y la prueba concuerdan con la probabilidad de si o .

En la práctica, la razón de verosimilitud se suele utilizar directamente para construir pruebas (véase prueba de razón de verosimilitud ). Sin embargo, también se puede utilizar para sugerir estadísticas de prueba particulares que podrían ser de interés o para sugerir pruebas simplificadas (para esto, se considera la manipulación algebraica de la razón para ver si hay estadísticas clave relacionadas con el tamaño de la razón (es decir, si una estadística grande corresponde a una razón pequeña o a una grande).

Prueba

Dada cualquier prueba de hipótesis con conjunto de rechazo , defina su función de potencia estadística .

Existencia:

Dada una prueba de hipótesis que satisface la condición, llámese su región de rechazo (donde NP significa Neyman-Pearson).

Para cualquier prueba de hipótesis de nivel con región de rechazo tenemos excepto en algún conjunto ignorable .

Luego lo integramos para obtener

Como y , encontramos que .

Por tanto, la prueba de rechazo es una prueba UMP en el conjunto de pruebas de nivel.

Unicidad:

Para cualquier otra prueba de nivel UMP, con región de rechazo , tenemos de la parte de Existencia, .

Como la prueba es UMP, el lado izquierdo debe ser cero. Como el lado derecho da , la prueba tiene un tamaño .

Dado que el integrando no es negativo y se integra a cero, debe ser exactamente cero excepto en algún conjunto ignorable .

Dado que la prueba satisface la condición, sea el conjunto ignorable en la definición de la condición .

es ignorable, ya que para todo , tenemos .

De igual manera, es ignorable.

Definir (donde significa diferencia simétrica ). Es la unión de tres conjuntos ignorables, por lo tanto es un conjunto ignorable.

Entonces tenemos y . Por lo tanto, la prueba de rechazo satisface la condición con el mismo .

Dado que es ignorable, su subconjunto también lo es. En consecuencia, las dos pruebas coinciden con la probabilidad de que sea o .

Ejemplo

Sea una muestra aleatoria de la distribución donde se conoce la media y supongamos que deseamos probar para contra . La probabilidad para este conjunto de datos distribuidos normalmente es

Podemos calcular la razón de verosimilitud para encontrar la estadística clave en esta prueba y su efecto en el resultado de la prueba:

Esta relación solo depende de los datos hasta . Por lo tanto, por el lema de Neyman-Pearson, la prueba más poderosa de este tipo de hipótesis para estos datos dependerá solo de . Además, por inspección, podemos ver que si , entonces es una función decreciente de . Por lo tanto, deberíamos rechazar si es suficientemente grande. El umbral de rechazo depende del tamaño de la prueba. En este ejemplo, se puede demostrar que la estadística de prueba es una variable aleatoria distribuida con chi-cuadrado escalado y se puede obtener un valor crítico exacto.

Aplicación en economía

Una variante del lema de Neyman-Pearson ha encontrado aplicación en el ámbito aparentemente no relacionado de la economía del valor de la tierra. Uno de los problemas fundamentales de la teoría del consumidor es calcular la función de demanda del consumidor dados los precios. En particular, dado un patrimonio de tierra heterogéneo, una medida del precio sobre la tierra y una medida de utilidad subjetiva sobre la tierra, el problema del consumidor es calcular la mejor parcela de tierra que puede comprar, es decir, la parcela de tierra con la mayor utilidad, cuyo precio sea como máximo el que se ajuste a su presupuesto. Resulta que este problema es muy similar al problema de encontrar la prueba estadística más potente, por lo que se puede utilizar el lema de Neyman-Pearson. [6]

Usos en ingeniería eléctrica

El lema de Neyman-Pearson es muy útil en ingeniería electrónica , concretamente en el diseño y uso de sistemas de radar , sistemas de comunicación digital y en sistemas de procesamiento de señales . En los sistemas de radar, el lema de Neyman-Pearson se utiliza para establecer primero la tasa de detecciones fallidas en un nivel deseado (bajo) y luego minimizar la tasa de falsas alarmas , o viceversa. Ni las falsas alarmas ni las detecciones fallidas se pueden establecer en tasas arbitrariamente bajas, incluido cero. Todo lo anterior se aplica también a muchos sistemas de procesamiento de señales.

Usos en física de partículas

El lema de Neyman-Pearson se aplica a la construcción de razones de verosimilitud específicas del análisis, utilizadas, por ejemplo, para probar firmas de nueva física frente a la predicción nominal del Modelo Estándar en conjuntos de datos de colisión protón-protón recopilados en el LHC . [7]

Descubrimiento del lema

Neyman escribió sobre el descubrimiento del lema de la siguiente manera. [8] Se han insertado saltos de párrafo.

Puedo señalar el momento particular en que comprendí cómo formular el problema no dogmático de la prueba más poderosa de una hipótesis estadística simple frente a una alternativa simple fija. En la actualidad [probablemente 1968], el problema parece completamente trivial y al alcance de un estudiante principiante. Pero, con un cierto grado de vergüenza, debo confesar que tomó algo así como media década de esfuerzo combinado de ESP [Egon Pearson] y yo para poner las cosas en orden.

La solución de la cuestión en cuestión se me ocurrió una tarde en la que me encontraba solo en mi habitación del Laboratorio de Estadística de la Escuela de Agricultura de Varsovia, pensando intensamente en algo que debería haber sido obvio mucho antes. El edificio estaba cerrado y, alrededor de las 8 de la tarde, oí voces afuera que me llamaban. Era mi esposa, con algunos amigos, diciéndome que era hora de ir al cine.

Mi primera reacción fue de fastidio. Y luego, al levantarme de mi escritorio para responder a la llamada, comprendí de repente: para cualquier región crítica dada y para cualquier hipótesis alternativa dada, es posible calcular la probabilidad del error de segundo tipo; está representada por esta integral particular. Una vez hecho esto, la región crítica óptima sería la que minimiza esta misma integral, sujeta a la condición secundaria relativa a la probabilidad del error de primer tipo. Estamos ante un problema particular del cálculo de variaciones, probablemente un problema simple.

Estos pensamientos me vinieron de golpe, antes de llegar a la ventana para hacerle una señal a mi esposa. El incidente está nítido en mi memoria, pero no tengo recuerdos de la película que vimos. Puede que fuera Buster Keaton.

Véase también

Referencias

  1. ^ Neyman, J.; Pearson, ES (16 de febrero de 1933). "IX. Sobre el problema de las pruebas más eficientes de hipótesis estadísticas". Phil. Trans. R. Soc. Lond. A . 231 (694–706): 289–337. Bibcode :1933RSPTA.231..289N. doi : 10.1098/rsta.1933.0009 . ISSN  0264-3952.
  2. ^ Las teorías de Fisher, Neyman–Pearson para probar hipótesis: ¿una teoría o dos?: Journal of the American Statistical Association: vol. 88, n.º 424: Las teorías de Fisher, Neyman–Pearson para probar hipótesis: ¿una teoría o dos?: Journal of the American Statistical Association: vol. 88, n.º 424
  3. ^ Wald: Capítulo II: La teoría de Neyman-Pearson para probar una hipótesis estadística: Wald: Capítulo II: La teoría de Neyman-Pearson para probar una hipótesis estadística
  4. ^ El imperio del azar: El imperio del azar
  5. ^ Casella, George (2002). Inferencia estadística. Roger L. Berger (2.ª ed.). Australia: Thomson Learning. pp. 388, Teorema 8.3.12. ISBN 0-534-24312-6.OCLC 46538638  .
  6. ^ Berliant, M. (1984). "Una caracterización de la demanda de tierra". Journal of Economic Theory . 33 (2): 289–300. doi :10.1016/0022-0531(84)90091-7.
  7. ^ van Dyk, David A. (2014). "El papel de la estadística en el descubrimiento del bosón de Higgs". Revista anual de estadística y su aplicación . 1 (1): 41–59. Bibcode :2014AnRSA...1...41V. doi : 10.1146/annurev-statistics-062713-085841 .
  8. ^ Neyman, J. (1970). Una mirada a algunas de mis experiencias personales en el proceso de investigación. En Scientists at Work: Festschrift in honour of Herman Wold . Editado por T. Dalenius, G. Karlsson, S. Malmquist. Almqvist & Wiksell, Estocolmo. https://worldcat.org/en/title/195948

Enlaces externos