La distribución de Cauchy , llamada así por Augustin-Louis Cauchy , es una distribución de probabilidad continua . También se la conoce, especialmente entre los físicos , como distribución de Lorentz (en honor a Hendrik Lorentz ), distribución de Cauchy-Lorentz , función de Lorentz(iana) o distribución de Breit-Wigner . La distribución de Cauchy es la distribución de la intersección con el eje x de un rayo que sale de con un ángulo distribuido uniformemente. También es la distribución del cociente de dos variables aleatorias independientes distribuidas normalmente con media cero.
La distribución de Cauchy se utiliza a menudo en estadística como el ejemplo canónico de una distribución " patológica ", ya que tanto su valor esperado como su varianza no están definidos (pero véase § Momentos más adelante). La distribución de Cauchy no tiene momentos finitos de orden mayor o igual a uno; solo existen momentos absolutos fraccionarios. [1] La distribución de Cauchy no tiene función generadora de momentos .
Una función con la forma de la función de densidad de la distribución de Cauchy fue estudiada geométricamente por Fermat en 1659, y más tarde fue conocida como la bruja de Agnesi , después de que Maria Gaetana Agnesi la incluyera como ejemplo en su libro de texto de cálculo de 1748. A pesar de su nombre, el primer análisis explícito de las propiedades de la distribución de Cauchy fue publicado por el matemático francés Poisson en 1824, y Cauchy solo se asoció con ella durante una controversia académica en 1853. [2] Poisson notó que si se tomaba la media de las observaciones que seguían tal distribución, la desviación estándar no convergía a ningún número finito. Como tal, el uso que hizo Laplace del teorema del límite central con tal distribución era inapropiado, ya que asumía una media y una varianza finitas. A pesar de esto, Poisson no consideró que el tema fuera importante, en contraste con Bienaymé , quien entablaría una larga disputa con Cauchy sobre el asunto.
Construcciones
Aquí se muestran las construcciones más importantes.
Simetría rotacional
Si uno se para frente a una línea y patea una pelota con una dirección (más precisamente, un ángulo) uniformemente aleatoria hacia la línea, entonces la distribución del punto donde la pelota golpea la línea es una distribución de Cauchy.
De manera más formal, considere un punto en el plano xy y seleccione una línea que pase por el punto, con su dirección (ángulo con el eje -) elegida uniformemente (entre -90° y +90°) al azar. La intersección de la línea con el eje x es la distribución de Cauchy con ubicación y escala .
Esta definición proporciona una forma sencilla de tomar muestras de la distribución estándar de Cauchy. Sea una muestra de una distribución uniforme de , entonces podemos generar una muestra, de la distribución estándar de Cauchy utilizando
El valor máximo o amplitud de la PDF de Cauchy es , ubicado en .
A veces es conveniente expresar la PDF en términos del parámetro complejo
El caso especial cuando y se llama distribución de Cauchy estándar con la función de densidad de probabilidad [5] [6]
En física, a menudo se utiliza una función lorentziana de tres parámetros:
donde es la altura del pico. La función lorentziana de tres parámetros indicada no es, en general, una función de densidad de probabilidad, ya que no integra a 1, excepto en el caso especial donde
De ello se deduce que el primer y el tercer cuartil son , y por lo tanto el rango intercuartil es .
Para la distribución estándar, la función de distribución acumulativa se simplifica a la función arcotangente :
Otras construcciones
La distribución de Cauchy estándar es la distribución t de Student con un grado de libertad, por lo que puede construirse mediante cualquier método que construya la distribución t de Student. [7]
Si es una matriz de covarianza positiva-semidefinida con entradas diagonales estrictamente positivas, entonces para cualquier vector aleatorio independiente e idénticamente distribuido y independiente de y tal que y (que define una distribución categórica ) se cumple que
[8]
Propiedades
La distribución de Cauchy es un ejemplo de distribución que no tiene media , varianza ni momentos superiores definidos. Su moda y mediana están bien definidas y ambas son iguales a .
Suma de variables aleatorias distribuidas según Cauchy
Si se trata de una muestra IID de la distribución estándar de Cauchy, entonces la media de la muestra también se distribuye según la distribución estándar de Cauchy. En particular, el promedio no converge a la media, por lo que la distribución estándar de Cauchy no sigue la ley de los grandes números.
Esto se puede demostrar mediante la integración repetida con la PDF, o más convenientemente, utilizando la función característica de la distribución de Cauchy estándar (ver más abajo): Con esto, tenemos , y por lo tanto tiene una distribución de Cauchy estándar.
En términos más generales, si son independientes y se distribuyen con parámetros de ubicación y escalas de Cauchy , y son números reales, entonces se distribuyen con parámetros de ubicación y escala de Cauchy. Vemos que no existe una ley de los grandes números para ninguna suma ponderada de distribuciones de Cauchy independientes.
Esto demuestra que no se puede descartar la condición de varianza finita del teorema del límite central . También es un ejemplo de una versión más generalizada del teorema del límite central que es característica de todas las distribuciones estables , de las cuales la distribución de Cauchy es un caso especial.
Teorema del límite central
Si son y IID muestran una PDF tal que es finita, pero distinta de cero, entonces converge en distribución a una distribución de Cauchy con escala . [11]
Función característica
Sea una variable aleatoria con distribución de Cauchy. La función característica de la distribución de Cauchy está dada por
que es simplemente la transformada de Fourier de la densidad de probabilidad. La densidad de probabilidad original puede expresarse en términos de la función característica, básicamente utilizando la transformada de Fourier inversa:
El momento n de una distribución es la derivada n de la función característica evaluada en . Obsérvese que la función característica no es diferenciable en el origen: esto corresponde al hecho de que la distribución de Cauchy no tiene momentos bien definidos superiores al momento cero.
Divergencia de Kullback-Leibler
La divergencia de Kullback-Leibler entre dos distribuciones de Cauchy tiene la siguiente fórmula simétrica de forma cerrada: [12]
La distribución de Cauchy se utiliza habitualmente como contraejemplo ilustrativo en cursos de probabilidad elemental, como una distribución sin momentos bien definidos (o "indefinidos").
Momentos de muestra
Si tomamos una muestra de IID de la distribución estándar de Cauchy, entonces la secuencia de su media muestral es , que también tiene la distribución estándar de Cauchy. En consecuencia, sin importar cuántos términos tomemos, la media muestral no converge.
De manera similar, la varianza de la muestra tampoco converge.
Una trayectoria típica de parece ser la de largos períodos de convergencia lenta hacia cero, interrumpidos por grandes saltos que se alejan del cero, pero que nunca se alejan demasiado. Una trayectoria típica de parece similar, pero los saltos se acumulan más rápido que la decadencia, divergiendo hacia el infinito. Estos dos tipos de trayectorias se representan en la figura.
Los momentos de la muestra de orden inferior a 1 convergerían a cero. Los momentos de la muestra de orden superior a 2 divergirían hasta el infinito incluso más rápido que la varianza de la muestra.
Para que exista la integral (incluso como un valor infinito), al menos uno de los términos de esta suma debe ser finito, o ambos deben ser infinitos y tener el mismo signo. Pero en el caso de la distribución de Cauchy, ambos términos de esta suma ( 2 ) son infinitos y tienen signo opuesto. Por lo tanto, ( 1 ) no está definido y, por lo tanto, tampoco lo está la media. [16] Cuando la media de una función de distribución de probabilidad (PDF) no está definida, nadie puede calcular un promedio confiable sobre los puntos de datos experimentales, independientemente del tamaño de la muestra.
Obsérvese que el valor principal de Cauchy de la media de la distribución de Cauchy es
que es cero. Por otra parte, la integral relacionada no
es cero, como se puede ver al calcular la integral. Esto demuestra nuevamente que la media ( 1 ) no puede existir.
Los momentos absolutos para están definidos. Porque tenemos
Momentos más elevados
La distribución de Cauchy no tiene momentos finitos de ningún orden. Algunos de los momentos brutos superiores sí existen y tienen un valor infinito, por ejemplo, el segundo momento bruto:
Al reorganizar la fórmula, se puede ver que el segundo momento es esencialmente la integral infinita de una constante (aquí 1). Los momentos brutos de potencia par superior también se evaluarán como infinito. Sin embargo, los momentos brutos de potencia impar no están definidos, lo que es claramente diferente de existir con el valor de infinito. Los momentos brutos de potencia impar no están definidos porque sus valores son esencialmente equivalentes a , ya que las dos mitades de la integral divergen y tienen signos opuestos. El primer momento bruto es la media, que, al ser impar, no existe. (Véase también la discusión anterior sobre esto.) Esto, a su vez, significa que todos los momentos centrales y momentos estandarizados no están definidos, ya que todos se basan en la media. La varianza, que es el segundo momento central, es igualmente inexistente (a pesar del hecho de que el segundo momento bruto existe con el valor infinito).
Los resultados para momentos superiores se derivan de la desigualdad de Hölder , que implica que los momentos superiores (o mitades de momentos) divergen si lo hacen los inferiores.
Momentos de distribuciones truncadas
Consideremos la distribución truncada definida restringiendo la distribución de Cauchy estándar al intervalo [−10 100 , 10 100 ] . Una distribución truncada de este tipo tiene todos los momentos (y el teorema del límite central se aplica para las observaciones iid de ella); sin embargo, para casi todos los fines prácticos se comporta como una distribución de Cauchy. [17]
Estimación de parámetros
Debido a que los parámetros de la distribución de Cauchy no corresponden a una media y una varianza, intentar estimar los parámetros de la distribución de Cauchy utilizando una media de muestra y una varianza de muestra no tendrá éxito. [18] Por ejemplo, si se toma una muestra iid de tamaño n de una distribución de Cauchy, se puede calcular la media de muestra como:
Aunque los valores de la muestra se concentrarán en torno al valor central , la media de la muestra se tornará cada vez más variable a medida que se tomen más observaciones, debido a la mayor probabilidad de encontrar puntos de muestra con un valor absoluto grande. De hecho, la distribución de la media de la muestra será igual a la distribución de las propias observaciones; es decir, la media de la muestra de una muestra grande no es mejor (ni peor) estimador de que cualquier observación individual de la muestra. De manera similar, el cálculo de la varianza de la muestra dará como resultado valores que se harán más grandes a medida que se tomen más observaciones.
Por lo tanto, se necesitan medios más robustos para estimar el valor central y el parámetro de escala . Un método simple es tomar el valor mediano de la muestra como estimador de y la mitad del rango intercuartil de la muestra como estimador de . Se han desarrollado otros métodos más precisos y robustos [19] [20] Por ejemplo, la media truncada del 24% medio de las estadísticas de orden de la muestra produce una estimación para que es más eficiente que usar la mediana de la muestra o la media de la muestra completa. [21] [22] Sin embargo, debido a las colas gruesas de la distribución de Cauchy, la eficiencia del estimador disminuye si se usa más del 24% de la muestra. [21] [22]
La máxima verosimilitud también se puede utilizar para estimar los parámetros y . Sin embargo, esto tiende a complicarse por el hecho de que requiere encontrar las raíces de un polinomio de alto grado, y puede haber múltiples raíces que representen máximos locales. [23] Además, si bien el estimador de máxima verosimilitud es asintóticamente eficiente, es relativamente ineficiente para muestras pequeñas. [24] [25] La función de log-verosimilitud para la distribución de Cauchy para el tamaño de la muestra es:
Maximizar la función de verosimilitud logarítmica con respecto a y tomando la primera derivada produce el siguiente sistema de ecuaciones:
Tenga en cuenta que
es una función monótona en y que la solución debe satisfacer
Para resolver solo para se requiere resolver un polinomio de grado , [23] y para resolver solo para se requiere resolver un polinomio de grado . Por lo tanto, ya sea para resolver un parámetro o para ambos parámetros simultáneamente, normalmente se requiere una solución numérica en una computadora. El beneficio de la estimación de máxima verosimilitud es la eficiencia asintótica; la estimación utilizando la mediana de la muestra es solo alrededor del 81% tan eficiente asintóticamente como la estimación por máxima verosimilitud. [22] [26] La media de la muestra truncada utilizando las estadísticas de orden medio del 24% es un estimador de aproximadamente el 88% tan eficiente asintóticamente como la estimación de máxima verosimilitud. [22] Cuando se utiliza el método de Newton para encontrar la solución para la estimación de máxima verosimilitud, las estadísticas de orden medio del 24% se pueden utilizar como una solución inicial para .
La forma se puede estimar utilizando la mediana de valores absolutos, ya que para la ubicación 0 variables de Cauchy , el parámetro de forma.
Distribución de Cauchy multivariante
Se dice que un vector aleatorio tiene una distribución de Cauchy multivariada si cada combinación lineal de sus componentes tiene una distribución de Cauchy. Es decir, para cualquier vector constante , la variable aleatoria debería tener una distribución de Cauchy univariante. [27] La función característica de una distribución de Cauchy multivariada viene dada por:
donde y son funciones reales con una función homogénea de grado uno y una función homogénea positiva de grado uno. [27] Más formalmente: [27]
Para todos .
Un ejemplo de una distribución de Cauchy bivariada puede darse por: [28]
También podemos escribir esta fórmula para una variable compleja. Entonces, la función de densidad de probabilidad de Cauchy compleja es:
Así como la distribución de Cauchy estándar es la distribución t de Student con un grado de libertad, la densidad de Cauchy multidimensional es la distribución de Student multivariada con un grado de libertad. La densidad de una distribución de Student dimensional con un grado de libertad es:
Las propiedades de la distribución de Cauchy multidimensional son entonces casos especiales de la distribución de Student multivariada.
Las aplicaciones de la distribución de Cauchy o su transformación se pueden encontrar en campos que trabajan con crecimiento exponencial . Un artículo de 1958 de White [33] derivó la estadística de prueba para estimadores de para la ecuación y donde el estimador de máxima verosimilitud se encuentra utilizando mínimos cuadrados ordinarios mostró que la distribución de muestreo de la estadística es la distribución de Cauchy.
La distribución de Cauchy suele ser la distribución de observaciones de objetos que giran. La referencia clásica para esto se denomina problema del faro de Gull [35] y, como en la sección anterior, distribución de Breit-Wigner en física de partículas.
En hidrología, la distribución de Cauchy se aplica a eventos extremos, como las precipitaciones máximas diarias anuales y los caudales fluviales. La imagen azul ilustra un ejemplo de ajuste de la distribución de Cauchy a las precipitaciones máximas diarias mensuales clasificadas, mostrando también el rango de confianza del 90 % basado en la distribución binomial . Los datos de precipitaciones se representan mediante el trazado de posiciones como parte del análisis de frecuencia acumulada .
La expresión de la parte imaginaria de la permitividad eléctrica compleja , según el modelo de Lorentz, es una distribución de Cauchy.
^ abc NL Johnson; S. Kotz; N. Balakrishnan (1994). Distribuciones univariadas continuas, volumen 1. Nueva York: Wiley., Capítulo 16.
^ Cauchy y la bruja de Agnesi en Estadísticas sobre la mesa , SM Stigler Harvard 1999 Capítulo 18
^ Feller, William (1971). Introducción a la teoría de la probabilidad y sus aplicaciones, volumen II (2.ª ed.). Nueva York: John Wiley & Sons Inc., págs. 704. ISBN978-0-471-25709-7.
^ "Función de Lorentz". MathWorld . Wolfram Research . Consultado el 27 de octubre de 2024 .
^ Riley, Ken F.; Hobson, Michael P.; Bence, Stephen J. (2006). Métodos matemáticos para la física y la ingeniería (3.ª ed.). Cambridge, Reino Unido: Cambridge University Press. pp. 1333. ISBN978-0-511-16842-0.
^ Balakrishnan, N.; Nevrozov, VB (2003). Introducción a las distribuciones estadísticas (1.ª ed.). Hoboken, Nueva Jersey: John Wiley & Sons Inc., págs. 305. ISBN0-471-42798-5.
^ Li, Rui; Nadarajah, Saralees (1 de marzo de 2020). "Una revisión de la distribución t de Student y sus generalizaciones". Economía empírica . 58 (3): 1461–1490. doi :10.1007/s00181-018-1570-0. ISSN 1435-8921.
^ Pillai N.; Meng, XL (2016). "Un encuentro inesperado con Cauchy y Lévy". Anales de Estadística . 44 (5): 2089–2097. arXiv : 1505.01957 . doi :10.1214/15-AOS1407. S2CID 31582370.
^ "Actualizaciones del límite central de Cauchy". Cálculo cuántico . 13 de noviembre de 2022 . Consultado el 21 de junio de 2023 .
^ Frederic, Chyzak; Nielsen, Frank (2019). "Una fórmula de forma cerrada para la divergencia de Kullback-Leibler entre distribuciones de Cauchy". arXiv : 1905.10965 [cs.IT].
^ Nielsen, Frank; Okamura, Kazuki (2023). "Sobre las divergencias f entre distribuciones de Cauchy". IEEE Transactions on Information Theory . 69 (5): 3150–3171. arXiv : 2101.12459 . doi :10.1109/TIT.2022.3231645. S2CID 231728407.
^ Vasicek, Oldrich (1976). "Una prueba de normalidad basada en la entropía de la muestra". Journal of the Royal Statistical Society, Serie B . 38 (1): 54–59. doi :10.1111/j.2517-6161.1976.tb01566.x.
^ Park, Sung Y.; Bera, Anil K. (2009). "Modelo de heterocedasticidad condicional autorregresiva de máxima entropía" (PDF) . Journal of Econometrics . 150 (2). Elsevier: 219–230. doi :10.1016/j.jeconom.2008.12.014. Archivado desde el original (PDF) el 2011-09-30 . Consultado el 2011-06-02 .
^ de Kyle Siegrist. «Distribución de Cauchy». Aleatorio . Archivado desde el original el 9 de julio de 2021. Consultado el 5 de julio de 2021 .
^ Hampel, Frank (1998), "¿Es la estadística demasiado difícil?" (PDF) , Canadian Journal of Statistics , 26 (3): 497–513, doi :10.2307/3315772, hdl : 20.500.11850/145503 , JSTOR 3315772, S2CID 53117661, archivado desde el original el 25 de enero de 2022 , consultado el 25 de septiembre de 2019.
^ "Ilustración de la inestabilidad de las medias muestrales". Archivado desde el original el 24 de marzo de 2017. Consultado el 22 de noviembre de 2014 .
^ Cane, Gwenda J. (1974). "Estimación lineal de parámetros de la distribución de Cauchy basada en cuantiles de muestra". Revista de la Asociación Estadounidense de Estadística . 69 (345): 243–245. doi :10.1080/01621459.1974.10480163. JSTOR 2285535.
^ Zhang, Jin (2010). "Un estimador L altamente eficiente para el parámetro de ubicación de la distribución de Cauchy". Computational Statistics . 25 (1): 97–105. doi :10.1007/s00180-009-0163-y. S2CID 123586208.
^ ab Rothenberg, Thomas J.; Fisher, Franklin, M.; Tilanus, CB (1964). "Una nota sobre la estimación a partir de una muestra de Cauchy". Revista de la Asociación Estadounidense de Estadística . 59 (306): 460–463. doi :10.1080/01621459.1964.10482170.{{cite journal}}: CS1 maint: multiple names: authors list (link)
^ abcd Bloch, Daniel (1966). "Una nota sobre la estimación de los parámetros de localización de la distribución de Cauchy". Revista de la Asociación Estadounidense de Estadística . 61 (316): 852–855. doi :10.1080/01621459.1966.10480912. JSTOR 2282794.
^ ab Ferguson, Thomas S. (1978). "Estimaciones de máxima verosimilitud de los parámetros de la distribución de Cauchy para muestras de tamaño 3 y 4". Revista de la Asociación Estadounidense de Estadística . 73 (361): 211–213. doi :10.1080/01621459.1978.10480031. JSTOR 2286549.
^ Cohen Freue, Gabriella V. (2007). "El estimador Pitman del parámetro de localización de Cauchy" (PDF) . Journal of Statistical Planning and Inference . 137 (6): 1901. doi :10.1016/j.jspi.2006.05.002. Archivado desde el original (PDF) el 2011-08-16.
^ Wilcox, Rand (2012). Introducción a la estimación robusta y a las pruebas de hipótesis . Elsevier.
^ Barnett, VD (1966). "Estimadores estadísticos de orden de la ubicación de la distribución de Cauchy". Revista de la Asociación Estadounidense de Estadística . 61 (316): 1205–1218. doi :10.1080/01621459.1966.10482205. JSTOR 2283210.
^ abc Ferguson, Thomas S. (1962). "Una representación de la distribución de Cauchy bivariada simétrica". Anales de estadística matemática . 33 (4): 1256–1266. doi : 10.1214/aoms/1177704357 . JSTOR 2237984 . Consultado el 7 de enero de 2017 .
^ ab Molenberghs, Geert; Lesaffre, Emmanuel (1997). "Ecuaciones integrales no lineales para aproximar densidades bivariadas con marginales y función de dependencia dadas" (PDF) . Statistica Sinica . 7 : 713–738. Archivado desde el original (PDF) el 14 de septiembre de 2009.
^ Lemons, Don S. (2002), "Introducción a los procesos estocásticos en física", American Journal of Physics , 71 (2), The Johns Hopkins University Press: 35, Bibcode :2003AmJPh..71..191L, doi :10.1119/1.1526134, ISBN0-8018-6866-1
^ ab McCullagh, P. , "Inferencia condicional y modelos de Cauchy", Biometrika , volumen 79 (1992), páginas 247–259. PDF Archivado el 10 de junio de 2010 en Wayback Machine desde la página de inicio de McCullagh.
^ Kyprianou, Andreas (2009). Procesos de Lévy y procesos de ramificación en estado continuo: parte I (PDF) . p. 11. Archivado (PDF) desde el original el 2016-03-03 . Consultado el 2016-05-04 .
^ White, JS (diciembre de 1958). "La distribución limitante del coeficiente de correlación serial en el caso explosivo". Anales de estadística matemática . 29 (4): 1188–1197. doi : 10.1214/aoms/1177706450 .
^ "CumFreq, software libre para análisis de frecuencias acumulativas y ajuste de distribuciones de probabilidad". Archivado desde el original el 21 de febrero de 2018.
^ Gull, SF (1988) Inferencia inductiva bayesiana y máxima entropía. Kluwer Academic Publishers, Berlín. https://doi.org/10.1007/978-94-009-3049-0_4 Archivado el 25 de enero de 2022 en Wayback Machine.
^ Tong Liu (2012), Una distribución intermedia entre las distribuciones gaussiana y de Cauchy. https://arxiv.org/pdf/1208.5109.pdf Archivado el 24 de junio de 2020 en Wayback Machine.