stringtranslate.com

Promedio móvil

Suavizado de una onda senoidal ruidosa (curva azul) con una media móvil (curva roja).


En estadística , un promedio móvil ( promedio móvil o promedio móvil [1] o promedio móvil ) es un cálculo para analizar puntos de datos mediante la creación de una serie de promedios de diferentes selecciones del conjunto de datos completo. Las variaciones incluyen: formas simples, acumulativas o ponderadas.

Matemáticamente, un promedio móvil es un tipo de convolución . Por lo tanto, en el procesamiento de señales se lo considera un filtro de respuesta de impulso finito de paso bajo . Debido a que la función boxcar describe sus coeficientes de filtro, se lo denomina filtro boxcar . A veces, se realiza un muestreo descendente .

Dada una serie de números y un subconjunto de tamaño fijo, el primer elemento de la media móvil se obtiene tomando la media del subconjunto fijo inicial de la serie de números. Luego, el subconjunto se modifica "desplazándolo hacia adelante", es decir, excluyendo el primer número de la serie e incluyendo el siguiente valor en el subconjunto.

Un promedio móvil se utiliza comúnmente con datos de series temporales para suavizar fluctuaciones de corto plazo y resaltar tendencias o ciclos de más largo plazo. El umbral entre corto y largo plazo depende de la aplicación, y los parámetros del promedio móvil se establecerán en consecuencia. También se utiliza en economía para examinar el producto interno bruto, el empleo u otras series temporales macroeconómicas. Cuando se utiliza con datos que no son de series temporales, un promedio móvil filtra componentes de mayor frecuencia sin ninguna conexión específica con el tiempo, aunque normalmente se implica algún tipo de ordenamiento. Visto de manera simplista, se puede considerar que suaviza los datos.

Promedio móvil simple

En aplicaciones financieras, una media móvil simple ( SMA ) es la media no ponderada de los puntos de datos anteriores. Sin embargo, en ciencia e ingeniería, la media normalmente se toma de un número igual de datos a cada lado de un valor central. Esto garantiza que las variaciones en la media estén alineadas con las variaciones en los datos en lugar de desplazarse en el tiempo.Un ejemplo de una media móvil ponderada de manera uniforme es la media de las últimas entradas de un conjunto de datos que contiene entradas. Supongamos que esos puntos de datos son . Estos podrían ser los precios de cierre de una acción. La media de los últimos puntos de datos (días en este ejemplo) se denota como y se calcula como:

Al calcular la siguiente media con el mismo ancho de muestreo, se considera el rango de a . Se suma un nuevo valor y se descarta el valor más antiguo. Esto simplifica los cálculos al reutilizar la media anterior . Esto significa que el filtro de media móvil se puede calcular de manera bastante económica con datos en tiempo real con un búfer circular /FIFO y solo 3 pasos aritméticos.

Durante el llenado inicial del buffer FIFO/circular, la ventana de muestreo es igual al tamaño del conjunto de datos y, por lo tanto, el cálculo promedio se realiza como un promedio móvil acumulativo.

El período seleccionado ( ) depende del tipo de movimiento de interés, como corto, intermedio o largo plazo.

Si los datos utilizados no están centrados en la media, una media móvil simple se queda atrás de los datos más recientes en la mitad del ancho de la muestra. Una media móvil simple también puede verse desproporcionadamente influenciada por la eliminación de datos antiguos o la entrada de datos nuevos. Una característica de la media móvil simple es que si los datos tienen una fluctuación periódica, la aplicación de una media móvil simple de ese período eliminará esa variación (la media siempre contiene un ciclo completo). Pero rara vez se encuentra un ciclo perfectamente regular. [2]

Para una serie de aplicaciones, resulta ventajoso evitar el desplazamiento inducido por el uso exclusivo de datos "pasados". Por lo tanto, se puede calcular un promedio móvil central , utilizando datos espaciados de manera uniforme a ambos lados del punto de la serie donde se calcula la media. [3] Esto requiere utilizar un número impar de puntos en la ventana de muestra.

Una desventaja importante del SMA es que deja pasar una cantidad significativa de la señal más corta que la longitud de la ventana. Peor aún, en realidad la invierte. [ cita requerida ] Esto puede generar artefactos inesperados, como picos en el resultado suavizado que aparecen donde había valles en los datos. También hace que el resultado sea menos suave de lo esperado, ya que algunas de las frecuencias más altas no se eliminan correctamente.

Su respuesta de frecuencia es un tipo de filtro paso bajo llamado sinc-in-frequency .

Promedio móvil continuo

La media móvil continua se define con la siguiente integral. El entorno que la rodea define la intensidad del suavizado del gráfico de la función.

La media móvil continua de la función se define como:

Un valor más grande suaviza más el gráfico de origen de la función (azul) . Las animaciones a continuación muestran la media móvil como animación en función de diferentes valores para . Se utiliza la fracción porque es el ancho del intervalo para la integral.

Promedio acumulado

En un promedio acumulativo ( CA ), los datos llegan en un flujo de datos ordenado y el usuario desea obtener el promedio de todos los datos hasta el dato actual. Por ejemplo, un inversor puede querer el precio promedio de todas las transacciones bursátiles de una acción en particular hasta el momento actual. A medida que se produce cada nueva transacción, se puede calcular el precio promedio en el momento de la transacción para todas las transacciones hasta ese momento utilizando el promedio acumulativo, generalmente un promedio igualmente ponderado de la secuencia de n valores hasta el momento actual:

El método de fuerza bruta para calcular esto sería almacenar todos los datos y calcular la suma y dividirla por la cantidad de puntos cada vez que llega un nuevo dato. Sin embargo, es posible simplemente actualizar el promedio acumulado a medida que se dispone de un nuevo valor, utilizando la fórmula

Por lo tanto, el promedio acumulado actual para un nuevo dato es igual al promedio acumulado anterior, multiplicado por n , más el último dato, todo dividido por el número de puntos recibidos hasta el momento, n + 1. Cuando llegan todos los datos ( n = N ), el promedio acumulado será igual al promedio final. También es posible almacenar un total acumulado de los datos, así como el número de puntos, y dividir el total por el número de puntos para obtener el CA cada vez que llega un nuevo dato.

La derivación de la fórmula del promedio acumulado es sencilla. Utilizando y de manera similar para n + 1 , se ve que

Resolviendo esta ecuación se obtienen los siguientes resultados:

Promedio móvil ponderado

Un promedio ponderado es un promedio que tiene factores multiplicadores para dar diferentes pesos a los datos en diferentes posiciones en la ventana de muestra. Matemáticamente, el promedio móvil ponderado es la convolución de los datos con una función de ponderación fija. Una aplicación es la eliminación de la pixelización de una imagen gráfica digital. [ cita requerida ]

En el campo financiero, y más específicamente en los análisis de datos financieros, una media móvil ponderada (WMA) tiene el significado específico de pesos que disminuyen en progresión aritmética. [4] En una WMA de n días, el último día tiene peso n , el segundo último , etc., hasta uno.

Pesos de WMA n = 15

El denominador es un número triangular igual a En el caso más general, el denominador siempre será la suma de los pesos individuales.

Al calcular la WMA en valores sucesivos, la diferencia entre los numeradores de y es . Si denotamos la suma por , entonces

El gráfico de la derecha muestra cómo disminuyen los pesos, desde el peso más alto correspondiente a los datos más recientes hasta llegar a cero. Se puede comparar con los pesos en la media móvil exponencial que se muestra a continuación.

Promedio móvil exponencial

Una media móvil exponencial (EMA) , también conocida como media móvil ponderada exponencialmente (EWMA) , [5] es un filtro de respuesta al impulso infinito de primer orden que aplica factores de ponderación que disminuyen exponencialmente . La ponderación de cada dato más antiguo disminuye exponencialmente y nunca llega a cero. Esta formulación es según Hunter (1986). [6]

Otras ponderaciones

Ocasionalmente se utilizan otros sistemas de ponderación; por ejemplo, en la negociación de acciones, una ponderación por volumen ponderará cada período de tiempo en proporción a su volumen de negociación.

Otra ponderación, utilizada por los actuarios, es la media móvil de 15 puntos de Spencer [7] (una media móvil central). Sus coeficientes de ponderación simétricos son [−3, −6, −5, 3, 21, 46, 67, 74, 67, 46, 21, 3, −5, −6, −3], que se factoriza como [1, 1, 1, 1]×[1, 1, 1, 1]×[1, 1, 1, 1, 1]×[−3, 3, 4, 3, −3]/320 y deja muestras de cualquier polinomio cuadrático o cúbico sin cambios. [8] [9]

Fuera del mundo de las finanzas, las medias móviles ponderadas tienen muchas formas y aplicaciones. Cada función de ponderación o "núcleo" tiene sus propias características. En ingeniería y ciencia, la respuesta de frecuencia y fase del filtro suele ser de importancia primordial para comprender las distorsiones deseadas y no deseadas que un filtro en particular aplicará a los datos.

Una media no sólo "suaviza" los datos. Una media es una forma de filtro de paso bajo. Se deben entender los efectos del filtro particular utilizado para poder hacer una elección adecuada. En este punto, la versión francesa de este artículo analiza los efectos espectrales de tres tipos de medias (acumulativa, exponencial y gaussiana).

Mediana móvil

Desde un punto de vista estadístico, la media móvil, cuando se utiliza para estimar la tendencia subyacente en una serie temporal, es susceptible a eventos raros como shocks rápidos u otras anomalías. Una estimación más robusta de la tendencia es la simple mediana móvil sobre n puntos temporales: donde la mediana se encuentra, por ejemplo, ordenando los valores dentro de los corchetes y encontrando el valor en el medio. Para valores mayores de n , la mediana se puede calcular de manera eficiente actualizando una lista de saltos indexable . [10]

Estadísticamente, la media móvil es óptima para recuperar la tendencia subyacente de la serie temporal cuando las fluctuaciones en torno a la tendencia se distribuyen normalmente . Sin embargo, la distribución normal no otorga una alta probabilidad a desviaciones muy grandes de la tendencia, lo que explica por qué dichas desviaciones tendrán un efecto desproporcionadamente grande en la estimación de la tendencia. Se puede demostrar que si, en cambio, se supone que las fluctuaciones se distribuyen según Laplace , entonces la mediana móvil es estadísticamente óptima. [11] Para una varianza dada, la distribución de Laplace otorga una mayor probabilidad a los eventos raros que la normal, lo que explica por qué la mediana móvil tolera los shocks mejor que la media móvil.

Cuando la mediana móvil simple anterior es central, el suavizado es idéntico al filtro de mediana que tiene aplicaciones, por ejemplo, en el procesamiento de señales de imagen. La mediana móvil es una alternativa más robusta a la media móvil cuando se trata de estimar la tendencia subyacente en una serie temporal. Si bien la media móvil es óptima para recuperar la tendencia si las fluctuaciones en torno a la tendencia se distribuyen normalmente, es susceptible al impacto de eventos raros como choques rápidos o anomalías. Por el contrario, la mediana móvil, que se encuentra ordenando los valores dentro de la ventana temporal y encontrando el valor en el medio, es más resistente al impacto de tales eventos raros. Esto se debe a que, para una varianza dada, la distribución de Laplace, que supone la mediana móvil, otorga mayor probabilidad a los eventos raros que la distribución normal que supone la media móvil. Como resultado, la mediana móvil proporciona una estimación más confiable y estable de la tendencia subyacente incluso cuando la serie temporal se ve afectada por grandes desviaciones de la tendencia. Además, el suavizado de la mediana móvil es idéntico al filtro de mediana, que tiene varias aplicaciones en el procesamiento de señales de imagen.

Modelo de regresión de media móvil

En un modelo de regresión de promedio móvil , se supone que una variable de interés es un promedio móvil ponderado de términos de error independientes no observados; los pesos en el promedio móvil son parámetros a estimar.

Estos dos conceptos a menudo se confunden debido a su nombre, pero si bien comparten muchas similitudes, representan métodos distintos y se utilizan en contextos muy diferentes.

Véase también

Referencias

  1. ^ Variabilidad hidrológica de la llanura aluvial del río Cosumnes (Booth et al., San Francisco Estuary and Watershed Science, volumen 4, número 2, 2006)
  2. ^ Análisis estadístico , Ya-lun Chou, Holt International, 1975, ISBN  0-03-089422-0 , sección 17.9.
  3. ^ La derivación y las propiedades del promedio móvil central simple se dan en su totalidad en el filtro Savitzky-Golay .
  4. ^ "Promedios móviles ponderados: conceptos básicos". Investopedia.
  5. ^ "TRATAMIENTO DEL RUIDO EN LAS MEDICIONES - Filtro promediador". Archivado desde el original el 29 de marzo de 2010. Consultado el 26 de octubre de 2010 .
  6. ^ Manual electrónico de métodos estadísticos del NIST/SEMATECH: suavizado exponencial simple en el Instituto Nacional de Estándares y Tecnología
  7. ^ Promedio móvil de 15 puntos de Spencer — de Wolfram MathWorld
  8. ^ Rob J Hyndman. "Medias móviles". 8 de noviembre de 2009. Consultado el 20 de agosto de 2020.
  9. ^ Aditya Guntuboyina. "Estadísticas 153 (series temporales): lección tres". 24 de enero de 2012. Consultado el 7 de enero de 2024.
  10. ^ "Mediana móvil eficiente usando una lista de omisión indexable « Recetas de Python « Código ActiveState".
  11. ^ GR Arce, "Procesamiento de señales no lineales: un enfoque estadístico", Wiley: Nueva Jersey, EE. UU., 2005.