stringtranslate.com

Función característica (teoría de la probabilidad)

Función característica de una variable aleatoria uniforme U (–1,1). Esta función tiene valores reales porque corresponde a una variable aleatoria que es simétrica en torno al origen; sin embargo, las funciones características pueden tener valores complejos en general.

En teoría de la probabilidad y estadística , la función característica de cualquier variable aleatoria de valor real define completamente su distribución de probabilidad . Si una variable aleatoria admite una función de densidad de probabilidad , entonces la función característica es la transformada de Fourier (con inversión de signo) de la función de densidad de probabilidad. Por lo tanto, proporciona una ruta alternativa para obtener resultados analíticos en comparación con el trabajo directo con funciones de densidad de probabilidad o funciones de distribución acumulativa . Hay resultados particularmente simples para las funciones características de distribuciones definidas por las sumas ponderadas de variables aleatorias.

Además de las distribuciones univariadas , se pueden definir funciones características para variables aleatorias con valores vectoriales o matriciales, y también se pueden extender a casos más genéricos.

La función característica siempre existe cuando se la trata como una función de un argumento de valor real, a diferencia de la función generadora de momentos . Existen relaciones entre el comportamiento de la función característica de una distribución y las propiedades de la distribución, como la existencia de momentos y la existencia de una función de densidad.

Introducción

La función característica es una forma de describir una variable aleatoria . La función característica ,

Una función de t determina el comportamiento y las propiedades de la distribución de probabilidad de la variable aleatoria X. Equivale a una función de densidad de probabilidad o a una función de distribución acumulativa en el sentido de que conociendo una de las funciones siempre es posible encontrar las otras, aunque proporcionan diferentes perspectivas para comprender las características de la variable aleatoria. Además, en casos particulares, puede haber diferencias en cuanto a si estas funciones se pueden representar como expresiones que involucren funciones estándar simples.

Si una variable aleatoria admite una función de densidad , entonces la función característica es su dual de Fourier , en el sentido de que cada una de ellas es una transformada de Fourier de la otra. Si una variable aleatoria tiene una función generadora de momentos , entonces el dominio de la función característica puede extenderse al plano complejo, y

[1]

Obsérvese, sin embargo, que la función característica de una distribución está bien definida para todos los valores reales de t , incluso cuando la función generadora de momentos no está bien definida para todos los valores reales de t .

El enfoque de la función característica es particularmente útil en el análisis de combinaciones lineales de variables aleatorias independientes: una prueba clásica del Teorema del Límite Central utiliza funciones características y el Teorema de Continuidad de Lévy . Otra aplicación importante es la teoría de la descomponibilidad de variables aleatorias.

Definición

Para una variable aleatoria escalar X, la función característica se define como el valor esperado de e itX , donde i es la unidad imaginaria y tR es el argumento de la función característica:

Aquí F X es la función de distribución acumulativa de X , f X es la función de densidad de probabilidad correspondiente , Q X ( p ) es la función de distribución acumulativa inversa correspondiente también llamada función cuantil , [2] y las integrales son del tipo Riemann–Stieltjes . Si una variable aleatoria X tiene una función de densidad de probabilidad entonces la función característica es su transformada de Fourier con inversión de signo en la exponencial compleja [3] [ página necesaria ] . [4] Esta convención para las constantes que aparecen en la definición de la función característica difiere de la convención habitual para la transformada de Fourier. [5] Por ejemplo, algunos autores [6] definen φ X ( t ) = E[ e −2 πitX ] , que es esencialmente un cambio de parámetro. Se pueden encontrar otras notaciones en la literatura: como la función característica para una medida de probabilidad p , o como la función característica correspondiente a una densidad f .

Generalizaciones

La noción de funciones características se generaliza a variables aleatorias multivariadas y elementos aleatorios más complejos . El argumento de la función característica siempre pertenecerá al dual continuo del espacio donde la variable aleatoria X toma sus valores. Para los casos comunes, dichas definiciones se enumeran a continuación:

Ejemplos

Oberhettinger (1973) proporciona tablas extensas de funciones características.

Propiedades

Continuidad

La biyección enunciada anteriormente entre distribuciones de probabilidad y funciones características es secuencialmente continua . Es decir, siempre que una secuencia de funciones de distribución F j ( x ) converge (débilmente) a alguna distribución F ( x ) , la secuencia correspondiente de funciones características φ j ( t ) también convergerá, y el límite φ ( t ) corresponderá a la función característica de la ley F . Más formalmente, esto se enuncia como

Teorema de continuidad de Lévy : Una secuencia X j devariables aleatorias de n variables converge en distribución a la variable aleatoria X si y solo si la secuencia φ X j converge puntualmente a una función φ que es continua en el origen. Dondeφ es la función característica de X. [13]

Este teorema se puede utilizar para demostrar la ley de los grandes números y el teorema del límite central .

Fórmula de inversión

Existe una correspondencia biunívoca entre las funciones de distribución acumulativa y las funciones características, por lo que es posible hallar una de estas funciones si conocemos la otra. La fórmula de la definición de función característica nos permite calcular φ cuando conocemos la función de distribución F (o densidad f ). Si, por otro lado, conocemos la función característica φ y queremos hallar la función de distribución correspondiente, entonces se puede utilizar uno de los siguientes teoremas de inversión .

Teorema . Si la función característica φ X de una variable aleatoria X es integrable , entonces F X es absolutamente continua y, por lo tanto, X tiene una función de densidad de probabilidad . En el caso univariado (es decir, cuando X tiene un valor escalar), la función de densidad está dada por

En el caso multivariado es

¿Dónde está el producto escalar ?

La función de densidad es la derivada de Radon-Nikodym de la distribución μ X con respecto a la medida de Lebesgue λ :

Teorema (Lévy) . [nota 1] Si φ X es función característica de la función de distribución F X , dos puntos a < b son tales que { x | a < x < b } es un conjunto de continuidad de μ X (en el caso univariado esta condición es equivalente a la continuidad de F X en los puntos a y b ), entonces

Teorema . Si a es (posiblemente) un átomo de X (en el caso univariado esto significa un punto de discontinuidad de F X ) entonces

Teorema (Gil-Pelaez) . [16] Para una variable aleatoria univariante X , si x es un punto de continuidad de F X entonces

donde la parte imaginaria de un número complejo está dada por .

Y su función de densidad es:

La integral puede no ser integrable según el método de Lebesgue ; por ejemplo, cuando X es la variable aleatoria discreta que siempre es 0, se convierte en la integral de Dirichlet .

Existen fórmulas de inversión para distribuciones multivariadas. [14] [17]

Criterios para funciones características

El conjunto de todas las funciones características se cierra bajo ciertas operaciones:

Es bien sabido que cualquier función càdlàg no decreciente F con límites F (−∞) = 0 , F (+∞) = 1 corresponde a una función de distribución acumulativa de alguna variable aleatoria. También existe interés en encontrar criterios simples similares para cuando una función dada φ podría ser la función característica de alguna variable aleatoria. El resultado central aquí es el teorema de Bochner , aunque su utilidad es limitada porque la condición principal del teorema, la definitividad no negativa , es muy difícil de verificar. También existen otros teoremas, como el de Khinchine, el de Mathias o el de Cramér, aunque su aplicación es igualmente difícil. El teorema de Pólya , por otro lado, proporciona una condición de convexidad muy simple que es suficiente pero no necesaria. Las funciones características que satisfacen esta condición se denominan de tipo Pólya. [18]

Teorema de Bochner . Una función arbitraria φ  : R nC es la función característica de alguna variable aleatoria si y solo si φ es definida positiva , continua en el origen y si φ (0) = 1 .

Criterio de Khinchine . Una función compleja, absolutamente continua φ , con φ (0) = 1 , es una función característica si y sólo si admite la representación

Teorema de Mathias . Una función φ real, par, continua y absolutamente integrable , con φ (0) = 1 , es una función característica si y sólo si

para n = 0,1,2,... , y todos los p > 0 . Aquí H 2 n denota el polinomio de Hermite de grado 2 n .

El teorema de Pólya se puede utilizar para construir un ejemplo de dos variables aleatorias cuyas funciones características coinciden en un intervalo finito pero son diferentes en el resto del tiempo.

Teorema de Pólya . Si es una función continua, par y de valores reales que satisface las condiciones

entonces φ ( t ) es la función característica de una distribución absolutamente continua simétrica respecto de 0.

Usos

Debido al teorema de continuidad , las funciones características se utilizan en la demostración más frecuente del teorema del límite central . La técnica principal que se utiliza para realizar cálculos con una función característica es reconocer la función como la función característica de una distribución particular.

Manipulaciones básicas de distribuciones

Las funciones características son particularmente útiles para trabajar con funciones lineales de variables aleatorias independientes . Por ejemplo, si X 1 , X 2 , ..., X n es una secuencia de variables aleatorias independientes (y no necesariamente idénticamente distribuidas), y

donde a i son constantes, entonces la función característica para S n está dada por

En particular, φ X+Y ( t ) = φ X ( t ) φ Y ( t ) . Para comprobarlo, escriba la definición de función característica:

Se requiere la independencia de X e Y para establecer la igualdad de las expresiones tercera y cuarta.

Otro caso especial de interés para las variables aleatorias distribuidas de forma idéntica es cuando a i = 1 / n y entonces S n es la media de la muestra. En este caso, escribiendo X para la media,

Momentos

Las funciones características también se pueden utilizar para hallar momentos de una variable aleatoria. Siempre que exista el momento n - ésimo , la función característica se puede derivar n veces:

Esto se puede escribir formalmente utilizando las derivadas de la función delta de Dirac : que permite una solución formal al problema del momento . Por ejemplo, supongamos que X tiene una distribución de Cauchy estándar . Entonces φ X ( t ) = e −| t | . Esto no es diferenciable en t = 0 , lo que demuestra que la distribución de Cauchy no tiene esperanza . Además, la función característica de la media muestral X de n observaciones independientes tiene función característica φ X ( t ) = ( e −| t |/ n ) n = e −| t | , utilizando el resultado de la sección anterior. Esta es la función característica de la distribución de Cauchy estándar: por tanto, la media muestral tiene la misma distribución que la propia población.

Como ejemplo adicional, supongamos que X sigue una distribución gaussiana , es decir , . Entonces y

Un cálculo similar muestra y es más fácil de realizar que aplicar la definición de expectativa y utilizar la integración por partes para evaluar .

El logaritmo de una función característica es una función generadora de cumulantes , que es útil para encontrar cumulantes ; algunos, en cambio, definen la función generadora de cumulantes como el logaritmo de la función generadora de momentos , y llaman al logaritmo de la función característica la segunda función generadora de cumulantes.

Análisis de datos

Las funciones características se pueden utilizar como parte de los procedimientos para ajustar distribuciones de probabilidad a muestras de datos. Los casos en los que esto proporciona una opción practicable en comparación con otras posibilidades incluyen el ajuste de la distribución estable , ya que no se encuentran disponibles expresiones de forma cerrada para la densidad, lo que dificulta la implementación de la estimación de máxima verosimilitud . Hay procedimientos de estimación disponibles que hacen coincidir la función característica teórica con la función característica empírica , calculada a partir de los datos. Paulson et al. (1975) [19] y Heathcote (1977) [20] proporcionan algunos antecedentes teóricos para dicho procedimiento de estimación. Además, Yu (2004) [21] describe aplicaciones de funciones características empíricas para ajustar modelos de series temporales donde los procedimientos de verosimilitud son poco prácticos. Ansari et al. (2020) [22] y Li et al. (2020) [23] también han utilizado funciones características empíricas para entrenar redes generativas adversarias .

Ejemplo

La distribución gamma con parámetro de escala θ y un parámetro de forma k tiene la función característica

Ahora supongamos que tenemos

con X e Y independientes entre sí, y deseamos saber cuál es la distribución de X + Y. Las funciones características son

lo cual por independencia y las propiedades básicas de la función característica conduce a

Esta es la función característica del parámetro de escala de distribución gamma θ y del parámetro de forma k 1 + k 2 , y por lo tanto concluimos

El resultado se puede ampliar a n variables aleatorias distribuidas gamma independientes con el mismo parámetro de escala y obtenemos

Funciones características completas

Como se definió anteriormente, el argumento de la función característica se trata como un número real; sin embargo, ciertos aspectos de la teoría de funciones características se avanzan extendiendo la definición al plano complejo mediante continuación analítica , en los casos en que esto es posible. [24]

Conceptos relacionados

Los conceptos relacionados incluyen la función generadora de momentos y la función generadora de probabilidad . La función característica existe para todas las distribuciones de probabilidad. Este no es el caso de la función generadora de momentos.

La función característica está estrechamente relacionada con la transformada de Fourier : la función característica de una función de densidad de probabilidad p ( x ) es el conjugado complejo de la transformada de Fourier continua de p ( x ) (según la convención habitual; ver transformada de Fourier continua – otras convenciones ).

donde P ( t ) denota la transformada de Fourier continua de la función de densidad de probabilidad p ( x ) . Asimismo, p ( x ) puede recuperarse a partir de φ X ( t ) mediante la transformada de Fourier inversa:

De hecho, incluso cuando la variable aleatoria no tiene densidad, la función característica puede verse como la transformada de Fourier de la medida correspondiente a la variable aleatoria.

Otro concepto relacionado es la representación de distribuciones de probabilidad como elementos de un espacio de Hilbert de núcleo reproductor mediante la incrustación de distribuciones en el núcleo . Este marco puede considerarse como una generalización de la función característica bajo elecciones específicas de la función de núcleo .

Véase también

Notas

  1. ^ llamado así en honor al matemático francés Paul Lévy

Referencias

Citas

  1. ^ Lukács (1970), pág. 196.
  2. ^ Shaw, WT; McCabe, J. (2009). "Muestreo de Monte Carlo dada una función característica: mecánica cuantil en el espacio de momento". arXiv : 0903.1592 [q-fin.CP].
  3. ^ Procesamiento estadístico y adaptativo de señales (2005)
  4. ^ Billingsley (1995).
  5. ^ Pinsky (2002).
  6. ^ Bochner (1955).
  7. ^ Andersen y col. (1995), Definición 1.10.
  8. ^ Andersen y col. (1995), Definición 1.20.
  9. ^ Sobczyk (2001), pág. 20.
  10. ^ Kotz y Nadarajah (2004), pág. 37 utilizando 1 como el número de grados de libertad para recuperar la distribución de Cauchy
  11. ^ Lukacs (1970), Corolario 1 del Teorema 2.3.1.
  12. ^ "Función característica conjunta". www.statlect.com . Consultado el 7 de abril de 2018 .
  13. ^ Cuppens (1975), Teorema 2.6.9.
  14. ^ abc Shephard (1991a).
  15. ^ Cuppens (1975), Teorema 2.3.2.
  16. ^ Villanueva (1961).
  17. ^ Shephard (1991b).
  18. ^ Lukács (1970), pág. 84.
  19. ^ Paulson, Holcomb y Leitch (1975).
  20. ^ Heathcote (1977).
  21. ^ Yu (2004).
  22. ^ Ansari, Scarlett y Soh (2020).
  23. ^ Li y otros (2020).
  24. ^ Lukacs (1970), Capítulo 7.

Fuentes

Enlaces externos