stringtranslate.com

Función característica (teoría de la probabilidad)

La función característica de una variable aleatoria uniforme U (–1,1). Esta función tiene valor real porque corresponde a una variable aleatoria que es simétrica alrededor del origen; sin embargo, las funciones características generalmente pueden tener valores complejos.

En teoría de probabilidad y estadística , la función característica de cualquier variable aleatoria de valor real define completamente su distribución de probabilidad . Si una variable aleatoria admite una función de densidad de probabilidad , entonces la función característica es la transformada de Fourier (con inversión de signos) de la función de densidad de probabilidad. Por lo tanto, proporciona una ruta alternativa para obtener resultados analíticos en comparación con trabajar directamente con funciones de densidad de probabilidad o funciones de distribución acumulativa . Hay resultados particularmente simples para las funciones características de las distribuciones definidas por las sumas ponderadas de variables aleatorias.

Además de las distribuciones univariadas , se pueden definir funciones características para variables aleatorias con valores vectoriales o matriciales, y también se pueden extender a casos más genéricos.

La función característica siempre existe cuando se trata como una función de un argumento de valor real, a diferencia de la función generadora de momentos . Existen relaciones entre el comportamiento de la función característica de una distribución y propiedades de la distribución, como la existencia de momentos y la existencia de una función de densidad.

Introducción

La función característica es una forma de describir una variable aleatoria . La función característica ,

una función de t , determina completamente el comportamiento y propiedades de la distribución de probabilidad de la variable aleatoria X. La función característica es similar a la función de distribución acumulativa ,

(donde 1 { X ≤ x } es la función indicadora ; es igual a 1 cuando X ≤ x y cero en caso contrario), que también determina completamente el comportamiento y las propiedades de la distribución de probabilidad de la variable aleatoria X. Los dos enfoques son equivalentes en el sentido de que conociendo una de las funciones siempre es posible encontrar la otra, pero proporcionan diferentes ideas para comprender las características de la variable aleatoria. Además, en casos particulares, puede haber diferencias en cuanto a si estas funciones se pueden representar como expresiones que involucran funciones estándar simples.

Si una variable aleatoria admite una función de densidad , entonces la función característica es su dual de Fourier , en el sentido de que cada una de ellas es una transformada de Fourier de la otra. Si una variable aleatoria tiene una función generadora de momentos , entonces el dominio de la función característica se puede extender al plano complejo, y

[1]

Sin embargo, tenga en cuenta que la función característica de una distribución siempre existe, incluso cuando la función de densidad de probabilidad o la función generadora de momento no existen.

El enfoque de la función característica es particularmente útil en el análisis de combinaciones lineales de variables aleatorias independientes: una prueba clásica del teorema del límite central utiliza funciones características y el teorema de continuidad de Lévy . Otra aplicación importante es la teoría de la descomponibilidad de variables aleatorias.

Definición

Para una variable aleatoria escalar X, la función característica se define como el valor esperado de e itX , donde i es la unidad imaginaria y tR es el argumento de la función característica:

Aquí F X es la función de distribución acumulativa de X , f X es la función de densidad de probabilidad correspondiente , Q X ( p ) es la función de distribución acumulativa inversa correspondiente también llamada función cuantil , [2] y las integrales son de Riemann-Stieltjes amable. Si una variable aleatoria X tiene una función de densidad de probabilidad , entonces la función característica es su transformada de Fourier con inversión de signo en la exponencial compleja [3] [ página necesaria ] . [4] Esta convención para las constantes que aparecen en la definición de la función característica difiere de la convención habitual para la transformada de Fourier. [5] Por ejemplo, algunos autores [6] definen φ X ( t ) = E e −2 πitX , que es esencialmente un cambio de parámetro. Se pueden encontrar otras notaciones en la literatura: como función característica para una medida de probabilidad p , o como función característica correspondiente a una densidad f .

Generalizaciones

La noción de funciones características se generaliza a variables aleatorias multivariadas y elementos aleatorios más complicados . El argumento de la función característica siempre pertenecerá al dual continuo del espacio donde la variable aleatoria X toma sus valores. Para casos comunes, estas definiciones se enumeran a continuación:

Ejemplos

Oberhettinger (1973) proporciona tablas extensas de funciones características.

Propiedades

Continuidad

La biyección indicada anteriormente entre distribuciones de probabilidad y funciones características es secuencialmente continua . Es decir, siempre que una secuencia de funciones de distribución F j ( x ) converge (débilmente) a alguna distribución F ( x ), la secuencia correspondiente de funciones características φ j ( t ) también convergerá, y el límite φ ( t ) corresponderá a la función característica de la ley F . Más formalmente, esto se expresa como

Teorema de continuidad de Lévy : Una secuencia X j de n variables aleatorias variables converge en distribución a la variable aleatoria X si y sólo si la secuencia φ X j converge puntualmente a una función φ que es continua en el origen. Donde φ es la función característicade X. [13]

Este teorema se puede utilizar para demostrar la ley de los grandes números y el teorema del límite central .

Fórmula de inversión

Existe una correspondencia uno a uno entre las funciones de distribución acumulativa y las funciones características, por lo que es posible encontrar una de estas funciones si conocemos la otra. La fórmula en la definición de función característica nos permite calcular φ cuando conocemos la función de distribución F (o densidad f ). Si, por el contrario, conocemos la función característica φ y queremos encontrar la función de distribución correspondiente, entonces se puede utilizar uno de los siguientes teoremas de inversión .

Teorema . Si la función característica φ X de una variable aleatoria X es integrable , entonces F X es absolutamente continua y, por tanto, X tiene una función de densidad de probabilidad . En el caso univariado (es decir, cuando X tiene un valor escalar), la función de densidad viene dada por

En el caso multivariado es

¿ Dónde está el producto escalar ?

La función de densidad es la derivada de Radón-Nikodym de la distribución μ X con respecto a la medida de Lebesgue λ :

Teorema (Lévy) . [nota 1] Si φ X es una función característica de la función de distribución F X , dos puntos a  <  b son tales que { x | a < x < b } es un conjunto de continuidad de μ X (en el caso univariado esta condición es equivalente a la continuidad de F X en los puntos a y b ), entonces

Teorema . Si a es (posiblemente) un átomo de X (en el caso univariado esto significa un punto de discontinuidad de F X ), entonces

Teorema (Gil-Pelaez) . [16] Para una variable aleatoria univariada X , si x es un punto de continuidad de F X entonces

donde la parte imaginaria de un número complejo está dada por .

Y su función de densidad es:

La integral puede no ser integrable a Lebesgue ; por ejemplo, cuando X es la variable aleatoria discreta que siempre es 0, se convierte en la integral de Dirichlet .

Se encuentran disponibles fórmulas de inversión para distribuciones multivariadas. [14] [17]

Criterios para funciones características.

El conjunto de todas las funciones características se cierra bajo determinadas operaciones:

Es bien sabido que cualquier función càdlàg no decreciente F con límites F (−∞) = 0, F (+∞) = 1 corresponde a una función de distribución acumulativa de alguna variable aleatoria. También existe interés en encontrar criterios simples similares para determinar cuándo una función dada φ podría ser la función característica de alguna variable aleatoria. El resultado central aquí es el teorema de Bochner , aunque su utilidad es limitada porque la condición principal del teorema, la precisión no negativa , es muy difícil de verificar. También existen otros teoremas, como el de Khinchine, el de Mathias o el de Cramér, aunque su aplicación es igual de difícil. El teorema de Pólya , por otra parte, proporciona una condición de convexidad muy simple que es suficiente pero no necesaria. Las funciones características que satisfacen esta condición se denominan tipo Pólya. [18]

Teorema de Bochner . Una función arbitraria φ  : R n C es la función característica de alguna variable aleatoria si y solo si φ es definida positiva , continua en el origen y si φ (0) = 1.

El criterio de Khinchine . Una función φ , de valores complejos y absolutamente continua , con φ (0) = 1, es una función característica si y sólo si admite la representación

Teorema de Mathías . Una función φ , de valor real, par, continua y absolutamente integrable , con φ (0) = 1, es una función característica si y sólo si

para n = 0,1,2,..., y todos p > 0. Aquí H 2 n denota el polinomio de Hermite de grado 2 n .

El teorema de Pólya se puede utilizar para construir un ejemplo de dos variables aleatorias cuyas funciones características coinciden en un intervalo finito pero son diferentes en otros lugares.

Teorema de Pólya . If es una función continua, par y de valor real que satisface las condiciones

entonces φ ( t ) es la función característica de una distribución absolutamente continua simétrica alrededor de 0.

Usos

Debido al teorema de continuidad , las funciones características se utilizan en la prueba más frecuente del teorema del límite central . La técnica principal involucrada en realizar cálculos con una función característica es reconocer la función como función característica de una distribución particular.

Manipulaciones básicas de distribuciones.

Las funciones características son particularmente útiles para tratar con funciones lineales de variables aleatorias independientes . Por ejemplo, si X 1 , X 2 , ..., X n es una secuencia de variables aleatorias independientes (y no necesariamente distribuidas de manera idéntica), y

donde a i son constantes, entonces la función característica para S n está dada por

En particular, φ X+Y ( t ) = φ X ( t ) φ Y ( t ) . Para ver esto, escriba la definición de función característica:

Se requiere la independencia de X e Y para establecer la igualdad de la tercera y cuarta expresión.

Otro caso especial de interés para variables aleatorias distribuidas idénticamente es cuando a i = 1/ n y luego S n es la media muestral. En este caso, escribiendo X para la media,

Momentos

Las funciones características también se pueden utilizar para encontrar momentos de una variable aleatoria. Siempre que exista el enésimo momento, la función característica se puede diferenciar n veces:

Esto se puede escribir formalmente usando las derivadas de la función delta de Dirac :

problema del momentoX tiene una distribución de Cauchyφ X ( t ) = e −| t | diferenciabletexpectativasXn observaciones independientesφ X ( t ) = ( e −| t |/ n ) n = e −| t |

Como ejemplo adicional, supongamos que X sigue una distribución gaussiana , es decir . Entonces y

Un cálculo similar muestra y es más fácil de realizar que aplicar la definición de expectativa y utilizar la integración por partes para evaluar .

El logaritmo de una función característica es una función generadora de cumulantes , que resulta útil para encontrar cumulantes ; algunos, en cambio, definen la función generadora de acumuladores como el logaritmo de la función generadora de momentos y llaman al logaritmo de la función característica la segunda función generadora de acumuladores.

Análisis de los datos

Las funciones características se pueden utilizar como parte de procedimientos para ajustar distribuciones de probabilidad a muestras de datos. Los casos en los que esto proporciona una opción practicable en comparación con otras posibilidades incluyen el ajuste de la distribución estable , ya que no se encuentran disponibles expresiones en forma cerrada para la densidad, lo que dificulta la implementación de la estimación de máxima verosimilitud . Hay disponibles procedimientos de estimación que relacionan la función característica teórica con la función característica empírica , calculada a partir de los datos. Paulson et al. (1975) [19] y Heathcote (1977) [20] proporcionan algunos antecedentes teóricos para tal procedimiento de estimación. Además, Yu (2004) [21] describe aplicaciones de funciones características empíricas para ajustar modelos de series temporales donde los procedimientos de probabilidad no son prácticos. Ansari et al. también han utilizado funciones características empíricas. (2020) [22] y Li et al. (2020) [23] para entrenar redes generativas adversarias .

Ejemplo

La distribución gamma con parámetro de escala θ y un parámetro de forma k tiene la función característica

Ahora supongamos que tenemos

con X e Y independientes entre sí, y deseamos saber cuál es la distribución de X + Y. Las funciones características son

que por independencia y las propiedades básicas de la función característica conduce a

Esta es la función característica del parámetro de escala de distribución gamma θ y el parámetro de forma k 1 + k 2 y, por lo tanto, concluimos

El resultado se puede expandir a n variables aleatorias independientes distribuidas gamma con el mismo parámetro de escala y obtenemos

Funciones características completas

Como se definió anteriormente, el argumento de la función característica se trata como un número real: sin embargo, ciertos aspectos de la teoría de las funciones características se avanzan extendiendo la definición al plano complejo mediante continuación analítica , en los casos en que esto sea posible. [24]

Conceptos relacionados

Los conceptos relacionados incluyen la función generadora de momentos y la función generadora de probabilidad . La función característica existe para todas las distribuciones de probabilidad. Este no es el caso de la función generadora de momentos.

La función característica está estrechamente relacionada con la transformada de Fourier : la función característica de una función de densidad de probabilidad p ( x ) es el conjugado complejo de la transformada de Fourier continua de p ( x ) (según la convención habitual; ver transformada de Fourier continua – otros convenciones ).

donde P ( t ) denota la transformada continua de Fourier de la función de densidad de probabilidad p ( x ). Asimismo, p ( x ) se puede recuperar de φ X ( t ) mediante la transformada inversa de Fourier:

De hecho, incluso cuando la variable aleatoria no tiene densidad, la función característica puede verse como la transformada de Fourier de la medida correspondiente a la variable aleatoria.

Otro concepto relacionado es la representación de distribuciones de probabilidad como elementos de un espacio de Hilbert del núcleo en reproducción mediante la incorporación del núcleo de distribuciones . Este marco puede verse como una generalización de la función característica bajo elecciones específicas de la función del núcleo .

Ver también

Notas

  1. ^ lleva el nombre del matemático francés Paul Lévy

Referencias

Citas

  1. ^ Lukács (1970), pág. 196.
  2. ^ Shaw, peso; McCabe, J. (2009). "Muestreo de Monte Carlo dado una función característica: mecánica cuantil en el espacio de momento". arXiv : 0903.1592 [q-fin.CP].
  3. ^ Procesamiento de señales estadístico y adaptativo (2005)
  4. ^ Billingsley (1995).
  5. ^ Pinski (2002).
  6. ^ Bochner (1955).
  7. ^ Andersen y col. (1995), Definición 1.10.
  8. ^ Andersen y col. (1995), Definición 1.20.
  9. ^ Sobczyk (2001), pág. 20.
  10. ^ Kotz y Nadarajah (2004), pág. 37 usando 1 como número de grados de libertad para recuperar la distribución de Cauchy
  11. ^ Lukács (1970), Corolario 1 del teorema 2.3.1.
  12. ^ "Función característica conjunta". www.statlect.com . Consultado el 7 de abril de 2018 .
  13. ^ Cuppens (1975), Teorema 2.6.9.
  14. ^ abc Shephard (1991a).
  15. ^ Cuppens (1975), Teorema 2.3.2.
  16. ^ Wendell (1961).
  17. ^ Pastor (1991b).
  18. ^ Lukács (1970), pág. 84.
  19. ^ Paulson, Holcomb y Leitch (1975).
  20. ^ Heathcote (1977).
  21. ^ Yu (2004).
  22. ^ Ansari, Scarlett y Soh (2020).
  23. ^ Li y col. (2020).
  24. ^ Lukács (1970), Capítulo 7.

Fuentes

enlaces externos