stringtranslate.com

Núcleo (estadísticas)

El término kernel se utiliza en análisis estadístico para referirse a una función de ventana . El término "núcleo" tiene varios significados distintos en diferentes ramas de la estadística.

Estadísticas bayesianas

En estadística, especialmente en estadística bayesiana , el núcleo de una función de densidad de probabilidad (pdf) o función de masa de probabilidad (pmf) es la forma de pdf o pmf en la que cualquier factor que no sea función de ninguna de las variables en el dominio es omitido. [1] Tenga en cuenta que dichos factores bien pueden ser funciones de los parámetros del pdf o pmf. Estos factores forman parte del factor de normalización de la distribución de probabilidad y son innecesarios en muchas situaciones. Por ejemplo, en el muestreo de números pseudoaleatorios , la mayoría de los algoritmos de muestreo ignoran el factor de normalización. Además, en el análisis bayesiano de distribuciones previas conjugadas , los factores de normalización generalmente se ignoran durante los cálculos y solo se considera el núcleo. Al final, se examina la forma del núcleo y, si coincide con una distribución conocida, se puede restablecer el factor de normalización. De lo contrario, puede ser innecesario (por ejemplo, si solo es necesario tomar muestras de la distribución).

Para muchas distribuciones, el núcleo se puede escribir en forma cerrada, pero no la constante de normalización.

Un ejemplo es la distribución normal . Su función de densidad de probabilidad es

y el kernel asociado es

Tenga en cuenta que el factor delante de la exponencial se ha omitido, aunque contiene el parámetro , porque no es una función de la variable de dominio .

Análisis de patrones

El núcleo de un espacio de Hilbert del núcleo en reproducción se utiliza en el conjunto de técnicas conocidas como métodos del núcleo para realizar tareas como clasificación estadística , análisis de regresión y análisis de conglomerados de datos en un espacio implícito. Este uso es particularmente común en el aprendizaje automático .

Estadísticas no paramétricas

En estadística no paramétrica , un núcleo es una función de ponderación utilizada en técnicas de estimación no paramétricas . Los kernels se utilizan en la estimación de la densidad del kernel para estimar las funciones de densidad de variables aleatorias , o en la regresión del kernel para estimar la expectativa condicional de una variable aleatoria. Los kernels también se utilizan en series de tiempo , en el uso del periodograma para estimar la densidad espectral , donde se les conoce como funciones de ventana . Un uso adicional es la estimación de una intensidad variable en el tiempo para un proceso puntual donde las funciones de ventana (núcleos) están convolucionadas con datos de series de tiempo.

Por lo general, también se deben especificar los anchos del kernel cuando se ejecuta una estimación no paramétrica.

Definición

Un núcleo es una función K integrable de valor real no negativo . Para la mayoría de las aplicaciones, es deseable definir la función para satisfacer dos requisitos adicionales:

El primer requisito garantiza que el método de estimación de la densidad del núcleo dé como resultado una función de densidad de probabilidad . El segundo requisito asegura que el promedio de la distribución correspondiente sea igual al de la muestra utilizada.

Si K es un núcleo, entonces también lo es la función K * definida por K *( u ) = λ Ku ), donde λ > 0. Esto se puede utilizar para seleccionar una escala que sea apropiada para los datos.

Funciones del kernel de uso común

Todos los núcleos siguientes en un sistema de coordenadas común.

Se utilizan habitualmente varios tipos de funciones kernel: uniforme, triangular, de Epanechnikov, [2] cuártica (biweight), tricube, [3] triweight, gaussiana, cuadrática [4] y coseno.

En la siguiente tabla, si se da con un soporte acotado , entonces para valores de u que se encuentran fuera del soporte.

Ver también

Referencias

  1. ^ Schuster, Eugene (agosto de 1969). "Estimación de una función de densidad de probabilidad y sus derivadas". Los anales de la estadística matemática . 40 (4): 1187-1195. doi : 10.1214/aoms/1177697495 .
  2. ^ Nombrado en honor a Epanechnikov, VA (1969). "Estimación no paramétrica de una densidad de probabilidad multivariada". Teoría probable. Aplica . 14 (1): 153-158. doi :10.1137/1114019.
  3. ^ Altman, NS (1992). "Una introducción a la regresión no paramétrica del kernel y del vecino más cercano". El estadístico estadounidense . 46 (3): 175–185. doi :10.1080/00031305.1992.10475879. hdl : 1813/31637 .
  4. ^ Cleveland, WS ; Devlin, SJ (1988). "Regresión ponderada localmente: una aproximación al análisis de regresión mediante ajuste local". Revista de la Asociación Estadounidense de Estadística . 83 (403): 596–610. doi :10.1080/01621459.1988.10478639.
  5. ^ La eficiencia se define como .
  6. ^ Silverman, BW (1986). Estimación de densidad para estadística y análisis de datos . Chapman y Hall, Londres.