Función característica (teoría de la probabilidad)
Transformada de Fourier de la función de densidad de probabilidad
La función característica de una variable aleatoria uniforme U (–1,1). Esta función tiene valor real porque corresponde a una variable aleatoria que es simétrica alrededor del origen; sin embargo, las funciones características generalmente pueden tener valores complejos.
Además de las distribuciones univariadas , se pueden definir funciones características para variables aleatorias con valores vectoriales o matriciales, y también se pueden extender a casos más genéricos.
La función característica siempre existe cuando se trata como una función de un argumento de valor real, a diferencia de la función generadora de momentos . Existen relaciones entre el comportamiento de la función característica de una distribución y propiedades de la distribución, como la existencia de momentos y la existencia de una función de densidad.
Introducción
La función característica es una forma de describir una variable aleatoria . La función característica ,
una función de t , determina completamente el comportamiento y propiedades de la distribución de probabilidad de la variable aleatoria X. La función característica es similar a la función de distribución acumulativa ,
(donde 1 { X ≤ x } es la función indicadora ; es igual a 1 cuando X ≤ x y cero en caso contrario), que también determina completamente el comportamiento y las propiedades de la distribución de probabilidad de la variable aleatoria X. Los dos enfoques son equivalentes en el sentido de que conociendo una de las funciones siempre es posible encontrar la otra, pero proporcionan diferentes ideas para comprender las características de la variable aleatoria. Además, en casos particulares, puede haber diferencias en cuanto a si estas funciones se pueden representar como expresiones que involucran funciones estándar simples.
Si una variable aleatoria admite una función de densidad , entonces la función característica es su dual de Fourier , en el sentido de que cada una de ellas es una transformada de Fourier de la otra. Si una variable aleatoria tiene una función generadora de momentos , entonces el dominio de la función característica se puede extender al plano complejo, y
El enfoque de la función característica es particularmente útil en el análisis de combinaciones lineales de variables aleatorias independientes: una prueba clásica del teorema del límite central utiliza funciones características y el teorema de continuidad de Lévy . Otra aplicación importante es la teoría de la descomponibilidad de variables aleatorias.
Definición
Para una variable aleatoria escalar X, la función característica se define como el valor esperado de e itX , donde i es la unidad imaginaria y t ∈ R es el argumento de la función característica:
Aquí F X es la función de distribución acumulativa de X , f X es la función de densidad de probabilidad correspondiente , Q X ( p ) es la función de distribución acumulativa inversa correspondiente también llamada función cuantil , [2] y las integrales son de Riemann-Stieltjes amable. Si una variable aleatoria X tiene una función de densidad de probabilidad , entonces la función característica es su transformada de Fourier con inversión de signo en la exponencial compleja [3] [ página necesaria ] . [4] Esta convención para las constantes que aparecen en la definición de la función característica difiere de la convención habitual para la transformada de Fourier. [5] Por ejemplo, algunos autores [6] definen φ X ( t ) = E e −2 πitX , que es esencialmente un cambio de parámetro. Se pueden encontrar otras notaciones en la literatura: como función característica para una medida de probabilidad p , o como función característica correspondiente a una densidad f .
Generalizaciones
La noción de funciones características se generaliza a variables aleatorias multivariadas y elementos aleatorios más complicados . El argumento de la función característica siempre pertenecerá al dual continuo del espacio donde la variable aleatoria X toma sus valores. Para casos comunes, estas definiciones se enumeran a continuación:
Si X es un vector aleatorio de k dimensiones , entonces para t ∈ R k
¿ Dónde está la transpuesta conjugada del vector ?
Si X ( s ) es un proceso estocástico , entonces para todas las funciones t ( s ) tales que la integral converge para casi todas las realizaciones de X [9]
Ejemplos
Oberhettinger (1973) proporciona tablas extensas de funciones características.
Propiedades
La función característica de una variable aleatoria de valor real siempre existe, ya que es una integral de una función continua acotada sobre un espacio cuya medida es finita.
No desaparece en una región alrededor de cero: φ(0) = 1.
Está acotado: |φ( t )| ≤ 1.
Es hermitiano : φ(− t ) = φ( t ) . En particular, la función característica de una variable aleatoria simétrica (alrededor del origen) tiene valor real y es par .
Existe una biyección entre distribuciones de probabilidad y funciones características. Es decir, para dos variables aleatorias cualesquiera X 1 , X 2 , ambas tienen la misma distribución de probabilidad si y sólo si . [ cita necesaria ]
Si una variable aleatoria X tiene momentos de hasta k -ésimo orden, entonces la función característica φ X es k veces continuamente diferenciable en toda la línea real. En este caso
Si una función característica φ X tiene una k -ésima derivada en cero, entonces la variable aleatoria X tiene todos los momentos hasta k si k es par, pero sólo hasta k – 1 si k es impar. [11]
Si X 1 , ..., X n son variables aleatorias independientes, y a 1 , ..., an son algunas constantes , entonces la función característica de la combinación lineal de las X i es
Un caso específico es la suma de dos variables aleatorias independientes X 1 y X 2 , en cuyo caso se tiene
Sean y dos variables aleatorias con funciones características y . y son independientes si y sólo si .
El comportamiento de la cola de la función característica determina la suavidad de la función de densidad correspondiente.
Sea la variable aleatoria la transformación lineal de una variable aleatoria . La función característica de es . Para vectores aleatorios y (donde A es una matriz constante y B un vector constante), tenemos . [12]
Continuidad
La biyección indicada anteriormente entre distribuciones de probabilidad y funciones características es secuencialmente continua . Es decir, siempre que una secuencia de funciones de distribución F j ( x ) converge (débilmente) a alguna distribución F ( x ), la secuencia correspondiente de funciones características φ j ( t ) también convergerá, y el límite φ ( t ) corresponderá a la función característica de la ley F . Más formalmente, esto se expresa como
Teorema de continuidad de Lévy : Una secuencia X j de n variables aleatorias variables converge en distribución a la variable aleatoria X si y sólo si la secuencia φ X j converge puntualmente a una función φ que es continua en el origen. Donde φ es la función característicade X. [13]
Existe una correspondencia uno a uno entre las funciones de distribución acumulativa y las funciones características, por lo que es posible encontrar una de estas funciones si conocemos la otra. La fórmula en la definición de función característica nos permite calcular φ cuando conocemos la función de distribución F (o densidad f ). Si, por el contrario, conocemos la función característica φ y queremos encontrar la función de distribución correspondiente, entonces se puede utilizar uno de los siguientes teoremas de inversión .
Teorema . Si la función característica φ X de una variable aleatoria X es integrable , entonces F X es absolutamente continua y, por tanto, X tiene una función de densidad de probabilidad . En el caso univariado (es decir, cuando X tiene un valor escalar), la función de densidad viene dada por
Teorema (Lévy) . [nota 1] Si φ X es una función característica de la función de distribución F X , dos puntos a < b son tales que { x | a < x < b } es un conjunto de continuidad de μ X (en el caso univariado esta condición es equivalente a la continuidad de F X en los puntos a y b ), entonces
Si X es escalar:
Esta fórmula se puede reformular en una forma más conveniente para el cálculo numérico como [14]
Para una variable aleatoria acotada desde abajo se puede obtener tomando tal que De lo contrario, si una variable aleatoria no está acotada desde abajo, el límite para da , pero es numéricamente impracticable. [14]
Si X es una variable aleatoria vectorial:
Teorema . Si a es (posiblemente) un átomo de X (en el caso univariado esto significa un punto de discontinuidad de F X ), entonces
Si X es escalar:
Si X es una variable aleatoria vectorial: [15]
Teorema (Gil-Pelaez) . [16] Para una variable aleatoria univariada X , si x es un punto de continuidad de F X entonces
donde la parte imaginaria de un número complejo está dada por .
Se encuentran disponibles fórmulas de inversión para distribuciones multivariadas. [14] [17]
Criterios para funciones características.
El conjunto de todas las funciones características se cierra bajo determinadas operaciones:
Una combinación lineal convexa (con ) de un número finito o contable de funciones características también es una función característica.
El producto de un número finito de funciones características también es una función característica. Lo mismo se aplica a un producto infinito siempre que converja a una función continua en el origen.
Si φ es una función característica y α es un número real, entonces , Re( φ ), | ϕ | 2 y φ ( αt ) también son funciones características.
Es bien sabido que cualquier función càdlàg no decreciente F con límites F (−∞) = 0, F (+∞) = 1 corresponde a una función de distribución acumulativa de alguna variable aleatoria. También existe interés en encontrar criterios simples similares para determinar cuándo una función dada φ podría ser la función característica de alguna variable aleatoria. El resultado central aquí es el teorema de Bochner , aunque su utilidad es limitada porque la condición principal del teorema, la precisión no negativa , es muy difícil de verificar. También existen otros teoremas, como el de Khinchine, el de Mathias o el de Cramér, aunque su aplicación es igual de difícil. El teorema de Pólya , por otra parte, proporciona una condición de convexidad muy simple que es suficiente pero no necesaria. Las funciones características que satisfacen esta condición se denominan tipo Pólya. [18]
Teorema de Bochner . Una función arbitraria φ : R n → C es la función característica de alguna variable aleatoria si y solo si φ es definida positiva , continua en el origen y si φ (0) = 1.
El criterio de Khinchine . Una función φ , de valores complejos y absolutamente continua , con φ (0) = 1, es una función característica si y sólo si admite la representación
Teorema de Mathías . Una función φ , de valor real, par, continua y absolutamente integrable , con φ (0) = 1, es una función característica si y sólo si
para n = 0,1,2,..., y todos p > 0. Aquí H 2 n denota el polinomio de Hermite de grado 2 n .
El teorema de Pólya se puede utilizar para construir un ejemplo de dos variables aleatorias cuyas funciones características coinciden en un intervalo finito pero son diferentes en otros lugares.
Teorema de Pólya . If es una función continua, par y de valor real que satisface las condiciones
entonces φ ( t ) es la función característica de una distribución absolutamente continua simétrica alrededor de 0.
Usos
Debido al teorema de continuidad , las funciones características se utilizan en la prueba más frecuente del teorema del límite central . La técnica principal involucrada en realizar cálculos con una función característica es reconocer la función como función característica de una distribución particular.
Manipulaciones básicas de distribuciones.
Las funciones características son particularmente útiles para tratar con funciones lineales de variables aleatorias independientes . Por ejemplo, si X 1 , X 2 , ..., X n es una secuencia de variables aleatorias independientes (y no necesariamente distribuidas de manera idéntica), y
donde a i son constantes, entonces la función característica para S n está dada por
En particular, φ X+Y ( t ) = φ X ( t ) φ Y ( t ) . Para ver esto, escriba la definición de función característica:
Se requiere la independencia de X e Y para establecer la igualdad de la tercera y cuarta expresión.
Otro caso especial de interés para variables aleatorias distribuidas idénticamente es cuando a i = 1/ n y luego S n es la media muestral. En este caso, escribiendo X para la media,
Momentos
Las funciones características también se pueden utilizar para encontrar momentos de una variable aleatoria. Siempre que exista el enésimo momento, la función característica se puede diferenciar n veces:
Como ejemplo adicional, supongamos que X sigue una distribución gaussiana , es decir . Entonces y
Un cálculo similar muestra y es más fácil de realizar que aplicar la definición de expectativa y utilizar la integración por partes para evaluar .
El logaritmo de una función característica es una función generadora de cumulantes , que resulta útil para encontrar cumulantes ; algunos, en cambio, definen la función generadora de acumuladores como el logaritmo de la función generadora de momentos y llaman al logaritmo de la función característica la segunda función generadora de acumuladores.
Análisis de los datos
Las funciones características se pueden utilizar como parte de procedimientos para ajustar distribuciones de probabilidad a muestras de datos. Los casos en los que esto proporciona una opción practicable en comparación con otras posibilidades incluyen el ajuste de la distribución estable , ya que no se encuentran disponibles expresiones en forma cerrada para la densidad, lo que dificulta la implementación de la estimación de máxima verosimilitud . Hay disponibles procedimientos de estimación que relacionan la función característica teórica con la función característica empírica , calculada a partir de los datos. Paulson et al. (1975) [19] y Heathcote (1977) [20] proporcionan algunos antecedentes teóricos para tal procedimiento de estimación. Además, Yu (2004) [21] describe aplicaciones de funciones características empíricas para ajustar modelos de series temporales donde los procedimientos de probabilidad no son prácticos. Ansari et al. también han utilizado funciones características empíricas. (2020) [22] y Li et al. (2020) [23] para entrenar redes generativas adversarias .
Ejemplo
La distribución gamma con parámetro de escala θ y un parámetro de forma k tiene la función característica
Ahora supongamos que tenemos
con X e Y independientes entre sí, y deseamos saber cuál es la distribución de X + Y. Las funciones características son
que por independencia y las propiedades básicas de la función característica conduce a
Esta es la función característica del parámetro de escala de distribución gamma θ y el parámetro de forma k 1 + k 2 y, por lo tanto, concluimos
El resultado se puede expandir a n variables aleatorias independientes distribuidas gamma con el mismo parámetro de escala y obtenemos
Funciones características completas
Como se definió anteriormente, el argumento de la función característica se trata como un número real: sin embargo, ciertos aspectos de la teoría de las funciones características se avanzan extendiendo la definición al plano complejo mediante continuación analítica , en los casos en que esto sea posible. [24]
donde P ( t ) denota la transformada continua de Fourier de la función de densidad de probabilidad p ( x ). Asimismo, p ( x ) se puede recuperar de φ X ( t ) mediante la transformada inversa de Fourier:
De hecho, incluso cuando la variable aleatoria no tiene densidad, la función característica puede verse como la transformada de Fourier de la medida correspondiente a la variable aleatoria.
Subindependencia , condición más débil que la independencia, que se define en términos de funciones características.
Cumulante , término de las funciones generadoras acumulativas , que son registros de las funciones características.
Notas
^ lleva el nombre del matemático francés Paul Lévy
Referencias
Citas
^ Lukács (1970), pág. 196.
^ Shaw, peso; McCabe, J. (2009). "Muestreo de Monte Carlo dado una función característica: mecánica cuantil en el espacio de momento". arXiv : 0903.1592 [q-fin.CP].
^ Procesamiento de señales estadístico y adaptativo (2005)
^ Billingsley (1995).
^ Pinski (2002).
^ Bochner (1955).
^ Andersen y col. (1995), Definición 1.10.
^ Andersen y col. (1995), Definición 1.20.
^ Sobczyk (2001), pág. 20.
^ Kotz y Nadarajah (2004), pág. 37 usando 1 como número de grados de libertad para recuperar la distribución de Cauchy
^ Lukács (1970), Corolario 1 del teorema 2.3.1.
^ "Función característica conjunta". www.statlect.com . Consultado el 7 de abril de 2018 .
^ Cuppens (1975), Teorema 2.6.9.
^ abc Shephard (1991a).
^ Cuppens (1975), Teorema 2.3.2.
^ Wendell (1961).
^ Pastor (1991b).
^ Lukács (1970), pág. 84.
^ Paulson, Holcomb y Leitch (1975).
^ Heathcote (1977).
^ Yu (2004).
^ Ansari, Scarlett y Soh (2020).
^ Li y col. (2020).
^ Lukács (1970), Capítulo 7.
Fuentes
Andersen, HH; Højbjerre, M.; Sorensen, D.; Eriksen, PS (1995). Modelos lineales y gráficos para la distribución normal compleja multivariada . Apuntes de conferencias sobre estadística 101. Nueva York: Springer-Verlag. ISBN 978-0-387-94521-7.
Billingsley, Patricio (1995). Probabilidad y medida (3ª ed.). John Wiley e hijos. ISBN 978-0-471-00710-4.
Bisgaard, TM; Sasvári, Z. (2000). Funciones características y secuencias de momentos . Ciencia nueva.
Bochner, Salomón (1955). Análisis armónico y teoría de la probabilidad . Prensa de la Universidad de California.
Cuppens, R. (1975). Descomposición de probabilidades multivariadas . Prensa académica. ISBN 9780121994501.
Heathcote, CR (1977). "La estimación integrada del error cuadrático de parámetros". Biometrika . 64 (2): 255–264. doi :10.1093/biomet/64.2.255.
Lukács, E. (1970). Funciones características . Londres: Griffin.
Kotz, Samuel; Nadarajah, Saralees (2004). Distribuciones T multivariadas y sus aplicaciones . Prensa de la Universidad de Cambridge.
Manolakis, Dimitris G.; Ingle, Vinay K.; Kogon, Stephen M. (2005). Procesamiento de señales estadístico y adaptativo: estimación espectral, modelado de señales, filtrado adaptativo y procesamiento de matrices. Casa Artech. ISBN 978-1-58053-610-3.
Oberhettinger, Fritz (1973). Transformadas de Fourier de distribuciones y sus inversas; una colección de mesas . Nueva York: Academic Press. ISBN 9780125236508.
Paulson, AS; Holcomb, EW; Leitch, RA (1975). "La estimación de los parámetros de las leyes estables". Biometrika . 62 (1): 163-170. doi :10.1093/biomet/62.1.163.
Pinsky, Mark (2002). Introducción al análisis de Fourier y wavelets . Brooks/Cole. ISBN 978-0-534-37660-4.
Wendel, JG (1961). "La convergencia no absoluta de la integral de inversión de Gil-Peláez". Los anales de la estadística matemática . 32 (1): 338–339. doi : 10.1214/aoms/1177705164 .
Yu, J. (2004). «Estimación empírica de funciones características y sus aplicaciones» (PDF) . Revisiones econométricas . 23 (2): 93-1223. doi :10.1081/ETC-120039605. S2CID 9076760.
Shephard, NG (1991a). "De la función característica a la función de distribución: un marco simple para la teoría". Teoría econométrica . 7 (4): 519–529. doi :10.1017/s0266466600004746. S2CID 14668369.
Shephard, NG (1991b). "Reglas de integración numérica para inversiones multivariadas". Revista de simulación y computación estadística . 39 (1–2): 37–46. doi : 10.1080/00949659108811337.
Ansari, Abdul Fatir; Scarlett, Jonathan; Entonces, Harold (2020). "Un enfoque de función característica para el modelado generativo implícito profundo". Actas de la Conferencia IEEE/CVF sobre visión por computadora y reconocimiento de patrones (CVPR), 2020 . págs. 7478–7487.
Li, Shengxi; Yu, Zeyang; Xiang, Min; Mandic, Danilo (2020). "Aprendizaje contradictorio recíproco a través de funciones características". Avances en sistemas de procesamiento de información neuronal 33 (NeurIPS 2020) .