La predicción lineal es una operación matemática en la que los valores futuros de una señal de tiempo discreto se estiman como una función lineal de muestras anteriores.
En el procesamiento de señales digitales , la predicción lineal suele denominarse codificación predictiva lineal (LPC) y, por lo tanto, puede considerarse como un subconjunto de la teoría de filtros . En el análisis de sistemas , un subcampo de las matemáticas , la predicción lineal puede considerarse como parte del modelado matemático o la optimización .
La representación más común es
donde es el valor de la señal predicha, los valores observados previamente, con , y los coeficientes predictores. El error generado por esta estimación es
¿Dónde está el verdadero valor de la señal?
Estas ecuaciones son válidas para todo tipo de predicción lineal (unidimensional). Las diferencias se encuentran en la forma en que se eligen los coeficientes predictores.
Para señales multidimensionales, la métrica de error a menudo se define como
donde es una norma vectorial elegida adecuada . Las predicciones como se utilizan rutinariamente dentro de los filtros y suavizadores de Kalman para estimar los valores de señal actuales y pasados, respectivamente, a partir de mediciones ruidosas. [1]
La opción más común en la optimización de parámetros es el criterio de la raíz cuadrada media , también llamado criterio de autocorrelación . En este método minimizamos el valor esperado del error al cuadrado , lo que da como resultado la ecuación
para 1 ≤ j ≤ p , donde R es la autocorrelación de la señal x n , definida como
y E es el valor esperado . En el caso multidimensional esto corresponde a minimizar la norma L 2 .
Las ecuaciones anteriores se denominan ecuaciones normales o ecuaciones de Yule-Walker . En forma matricial, las ecuaciones se pueden escribir de forma equivalente como
donde la matriz de autocorrelación es una matriz de Toeplitz simétrica con elementos , el vector es el vector de autocorrelación , y , el vector de parámetros.
Otro enfoque más general es minimizar la suma de los cuadrados de los errores definidos en la forma
donde el problema de optimización que busca sobre todo ahora debe restringirse con .
Por otra parte, si el error cuadrático medio de predicción se limita a la unidad y la ecuación del error de predicción se incluye encima de las ecuaciones normales, el conjunto aumentado de ecuaciones se obtiene como
donde el índice varía de 0 a , y es una matriz.
La especificación de los parámetros del predictor lineal es un tema amplio y se han propuesto un gran número de otros enfoques. De hecho, el método de autocorrelación es el más común [2] y se utiliza, por ejemplo, para la codificación de voz en el estándar GSM .
La solución de la ecuación matricial es un proceso relativamente costoso desde el punto de vista computacional. La eliminación gaussiana para la inversión de matrices es probablemente la solución más antigua, pero este enfoque no utiliza de manera eficiente la simetría de . Un algoritmo más rápido es la recursión de Levinson propuesta por Norman Levinson en 1947, que calcula la solución de manera recursiva. [ cita requerida ] En particular, las ecuaciones de autocorrelación anteriores pueden resolverse de manera más eficiente mediante el algoritmo de Durbin. [3]
En 1986, Philippe Delsarte e YV Genin propusieron una mejora de este algoritmo llamada recursión dividida de Levinson, que requiere aproximadamente la mitad del número de multiplicaciones y divisiones. [4] Utiliza una propiedad simétrica especial de los vectores de parámetros en los niveles de recursión posteriores. Es decir, los cálculos para el predictor óptimo que contiene términos utilizan cálculos similares para el predictor óptimo que contiene términos.
Otra forma de identificar los parámetros del modelo es calcular iterativamente estimaciones de estado utilizando filtros de Kalman y obteniendo estimaciones de máxima verosimilitud dentro de algoritmos de expectativa-maximización .
Para valores igualmente espaciados, una interpolación polinómica es una combinación lineal de los valores conocidos. Si se estima que la señal de tiempo discreto obedece a un polinomio de grado , entonces los coeficientes predictores se dan por la fila correspondiente del triángulo de coeficientes de transformación binomial. Esta estimación podría ser adecuada para una señal que varía lentamente con poco ruido. Las predicciones para los primeros valores de son