Kernel (estadísticas)

El término kernel se utiliza en el análisis estadístico para referirse a una función de ventana . El término "kernel" tiene varios significados distintos en diferentes ramas de la estadística.

Estadísticas bayesianas

En estadística, especialmente en estadística bayesiana , el núcleo de una función de densidad de probabilidad (pdf) o función de masa de probabilidad (pmf) es la forma de la pdf o pmf en la que se omiten todos los factores que no son funciones de ninguna de las variables del dominio. ^[1] Nótese que dichos factores pueden ser funciones de los parámetros de la pdf o pmf. Estos factores forman parte del factor de normalización de la distribución de probabilidad y son innecesarios en muchas situaciones. Por ejemplo, en el muestreo de números pseudoaleatorios , la mayoría de los algoritmos de muestreo ignoran el factor de normalización. Además, en el análisis bayesiano de distribuciones previas conjugadas , los factores de normalización generalmente se ignoran durante los cálculos y solo se considera el núcleo. Al final, se examina la forma del núcleo y, si coincide con una distribución conocida, se puede restablecer el factor de normalización. De lo contrario, puede ser innecesario (por ejemplo, si solo es necesario muestrear la distribución).

Para muchas distribuciones, el núcleo se puede escribir en forma cerrada, pero no la constante de normalización.

Un ejemplo es la distribución normal . Su función de densidad de probabilidad es

p(x|\mu ,\sigma ^{2})={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}

y el núcleo asociado es

p(x|\mu ,\sigma ^{2})\propto e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}

Tenga en cuenta que se ha omitido el factor delante de la exponencial, aunque contiene el parámetro , porque no es una función de la variable de dominio . $\sigma ^{2}$ ${\estilo de visualización x}$

Análisis de patrones

El núcleo de un espacio de Hilbert de núcleo reproductor se utiliza en el conjunto de técnicas conocidas como métodos de núcleo para realizar tareas como clasificación estadística , análisis de regresión y análisis de conglomerados en datos en un espacio implícito. Este uso es particularmente común en el aprendizaje automático .

Estadísticas no paramétricas

En estadística no paramétrica , un kernel es una función de ponderación utilizada en técnicas de estimación no paramétrica . Los kernels se utilizan en la estimación de densidad de kernel para estimar las funciones de densidad de variables aleatorias , o en la regresión de kernel para estimar la esperanza condicional de una variable aleatoria. Los kernels también se utilizan en series temporales , en el uso del periodograma para estimar la densidad espectral donde se conocen como funciones de ventana . Un uso adicional es en la estimación de una intensidad variable en el tiempo para un proceso puntual donde las funciones de ventana (kernels) se convolucionan con datos de series temporales.

Comúnmente, los anchos de kernel también deben especificarse cuando se ejecuta una estimación no paramétrica.

Definición

Un núcleo es una función integrable de valor real no negativo K. Para la mayoría de las aplicaciones, es deseable definir la función para satisfacer dos requisitos adicionales:

Normalización :

\int _{-\infty }^{+\infty }K(u)\,du=1\,;

Simetría:

K(-u)=K(u){\mbox{ para todos los valores de }}u\,.

El primer requisito garantiza que el método de estimación de densidad kernel dé como resultado una función de densidad de probabilidad . El segundo requisito garantiza que el promedio de la distribución correspondiente sea igual al de la muestra utilizada.

Si K es un núcleo, entonces también lo es la función K * definida por K *( u ) = λ K (λ u ), donde λ > 0. Esto se puede utilizar para seleccionar una escala que sea apropiada para los datos.

Funciones del núcleo de uso común

Todos los núcleos a continuación en un sistema de coordenadas común.

Se utilizan comúnmente varios tipos de funciones kernel: uniforme, triangular, de Epanechnikov, ^[2] cuártica (biweight), tricube, ^[3] triweight, gaussiana, cuadrática ^[4] y coseno.

En la siguiente tabla, si se da con un soporte acotado , entonces para valores de u que se encuentran fuera del soporte. ${\estilo de visualización K}$ $K(u)=0$

Véase también

Referencias

^ Schuster, Eugene (agosto de 1969). "Estimación de una función de densidad de probabilidad y sus derivadas". Anales de estadística matemática . 40 (4): 1187-1195. doi : 10.1214/aoms/1177697495 .
^ Nombrado en honor a Epanechnikov, VA (1969). "Estimación no paramétrica de una densidad de probabilidad multivariante". Theory Probab. Appl . 14 (1): 153–158. doi :10.1137/1114019.
^ Altman, NS (1992). "Introducción a la regresión no paramétrica de núcleo y vecino más próximo". The American Statistician . 46 (3): 175–185. doi :10.1080/00031305.1992.10475879. hdl : 1813/31637 .
^ Cleveland, WS ; Devlin, SJ (1988). "Regresión ponderada localmente: un enfoque para el análisis de regresión mediante ajuste local". Revista de la Asociación Estadounidense de Estadística . 83 (403): 596–610. doi :10.1080/01621459.1988.10478639.
^ La eficiencia se define como . ${\sqrt {\int u^{2}K(u)\,du}}\int K(u)^{2}\,du$
^ Silverman, BW (1986). Estimación de densidad para estadísticas y análisis de datos . Chapman y Hall, Londres.

Li, Qi; Racine, Jeffrey S. (2007). Econometría no paramétrica: teoría y práctica . Princeton University Press. ISBN 978-0-691-12161-1.

Zucchini, Walter. "TÉCNICAS DE ALISADO APLICADAS Parte 1: Estimación de la densidad del grano" (PDF) . Consultado el 6 de septiembre de 2018 .

Comaniciu, D; Meer, P (2002). "Desplazamiento medio: un enfoque robusto hacia el análisis del espacio de características". IEEE Transactions on Pattern Analysis and Machine Intelligence . 24 (5): 603–619. CiteSeerX 10.1.1.76.8968 . doi :10.1109/34.1000236.