Análisis de datos funcionales

El análisis de datos funcionales (FDA) es una rama de la estadística que analiza datos que brindan información sobre curvas, superficies o cualquier otra cosa que varíe en un continuo. En su forma más general, en el marco del FDA, cada elemento de muestra de datos funcionales se considera una función aleatoria. El continuo físico sobre el que se definen estas funciones suele ser el tiempo, pero también puede ser la ubicación espacial, la longitud de onda, la probabilidad, etc. Intrínsecamente, los datos funcionales tienen una dimensión infinita. La alta dimensionalidad intrínseca de estos datos plantea desafíos tanto para la teoría como para la computación, donde estos desafíos varían según cómo se muestrearon los datos funcionales. Sin embargo, la estructura de dimensión alta o infinita de los datos es una rica fuente de información y existen muchos desafíos interesantes para la investigación y el análisis de datos.

Historia

El análisis de datos funcionales tiene sus raíces en el trabajo de Grenander y Karhunen en los años 1940 y 1950. ^[1]^[2]^[3]^[4] Consideraron la descomposición del proceso estocástico de tiempo continuo integrable al cuadrado en componentes propios, ahora conocido como la descomposición de Karhunen-Loève . Un análisis riguroso del análisis de componentes principales funcionales fue realizado en la década de 1970 por Kleffe, Dauxois y Pousse incluyendo resultados sobre la distribución asintótica de los valores propios. ^[5]^[6] Más recientemente, en las décadas de 1990 y 2000, el campo se ha centrado más en las aplicaciones y la comprensión de los efectos de los esquemas de observaciones densas y dispersas. El término "Análisis de datos funcionales" fue acuñado por James O. Ramsay . ^[7]

Formalismo matemático

Las funciones aleatorias pueden considerarse como elementos aleatorios que toman valores en un espacio de Hilbert o como un proceso estocástico . El primero es matemáticamente conveniente, mientras que el segundo es algo más adecuado desde una perspectiva aplicada. Estos dos enfoques coinciden si las funciones aleatorias son continuas y se cumple una condición llamada continuidad cuadrática media . ^[8]

Variables aleatorias hilbertianas

Desde el punto de vista del espacio de Hilbert, se considera un elemento aleatorio de valor , donde es un espacio de Hilbert separable, como el espacio de funciones integrables al cuadrado . Bajo la condición de integrabilidad de que , se puede definir la media de como el único elemento que satisface ${\estilo de visualización H}$ ${\estilo de visualización X}$ ${\estilo de visualización H}$ $Estilo de visualización L^{2}[0,1]}$ $\mathbb {E} \|X\|_{L^{2}}^{2}=\mathbb {E} (\int _{0}^{1}|X(t)|^{2}dt)<\infty$ ${\estilo de visualización X}$ $\mu \en H$

\mathbb {E} \langle X,h\rangle =\langle \mu ,h\rangle ,\qquad h\in H.

Esta formulación es la integral de Pettis , pero la media también se puede definir como la integral de Bochner . Bajo la condición de integrabilidad que es finita, el operador de covarianza de es un operador lineal que se define de manera única por la relación $\mu =\mathbb {E} X$ $\mathbb {E} \|X\|_{L^{2}}^{2}$ ${\estilo de visualización X}$ ${\mathcal {C}}:H\to H$

{\mathcal {C}}h=\mathbb {E} [\langle h,X-\mu \rangle (X-\mu )],\qquad h\in H,

o, en forma tensorial , . El teorema espectral permite descomponer como la descomposición de Karhunen-Loève ${\mathcal {C}}=\mathbb {E} [(X-\mu )\otimes (X-\mu )]$ ${\estilo de visualización X}$

X=\mu +\sum _{i=1}^{\infty }\langle X,\varphi _{i}\rangle \varphi _{i},

donde son vectores propios de , correspondientes a los valores propios no negativos de , en un orden no creciente. El truncamiento de esta serie infinita a un orden finito sustenta el análisis de componentes principales funcional . $\varphi _{i}$ ${\mathcal {C}}$ ${\mathcal {C}}$

Procesos estocásticos

El punto de vista hilbertiano es matemáticamente conveniente, pero abstracto; las consideraciones anteriores no necesariamente se consideran como una función, ya que las opciones comunes de espacios similares y de Sobolev consisten en clases de equivalencia, no funciones. La perspectiva del proceso estocástico se considera como una colección de variables aleatorias . ${\estilo de visualización X}$ ${\estilo de visualización H}$ $Estilo de visualización L^{2}[0,1]}$ ${\estilo de visualización X}$

\{X(t)\}_{t\in [0,1]}

indexada por el intervalo unitario (o más generalmente intervalo ). Las funciones de media y covarianza se definen de manera puntual como ${\mathcal {T}}$

\mu(t)=\mathbb {E} X(t),\qquad \Sigma(s,t)={\textrm {Cov}}(X(s),X(t)),\qquad s,t\in [0,1]

(si para todos ). $\mathbb {E} [X(t)^{2}]<\infty$ $t\in [0,1]$

Bajo la continuidad del cuadrado medio, y son funciones continuas y luego la función de covarianza define un operador de covarianza dado por $\mu$ $\Sigma$ $\Sigma$ ${\mathcal {C}}:H\to H$

El teorema espectral se aplica a , produciendo pares propios , de modo que en la notación del producto tensorial se escribe ${\mathcal {C}}$ $(\lambda _{j},\varphi _{j})$ ${\mathcal {C}}$

{\mathcal {C}}=\sum _{j=1}^{\infty }\lambda _{j}\varphi _{j}\otimes \varphi _{j}.

Además, dado que es continua para todos , todos los son continuos. El teorema de Mercer establece entonces que ${\mathcal {C}}f$ $f\in H$ $\varphi _{j}$

\sup _{s,t\in [0,1]}\left|\Sigma (s,t)-\sum _{j=1}^{K}\lambda _{j}\varphi _{j}(s)\varphi _{j}(t)\right|\to 0,\qquad K\to \infty .

Finalmente, bajo el supuesto adicional de que hay trayectorias de muestra continuas, es decir, que con probabilidad uno, la función aleatoria es continua, la expansión de Karhunen-Loève anterior se cumple para y la maquinaria espacial de Hilbert se puede aplicar posteriormente. La continuidad de las trayectorias de muestra se puede demostrar utilizando el teorema de continuidad de Kolmogorov . $X$ $X:[0,1]\to \mathbb {R}$ $X$

Diseños de datos funcionales

Los datos funcionales se consideran realizaciones de un proceso estocástico que es un proceso en un intervalo acotado y cerrado con función media y función de covarianza . Las realizaciones del proceso para el i-ésimo sujeto son , y se supone que la muestra consta de sujetos independientes. El programa de muestreo puede variar entre sujetos, denotado como para el i-ésimo sujeto. La i-ésima observación correspondiente se denota como , donde . Además, se supone que la medición de tiene ruido aleatorio con y , que son independientes entre y . $X(t),\ t\in [0,1]$ $L^{2}$ $[0,1]$ $\mu (t)=\mathbb {E} (X(t))$ $\Sigma (s,t)={\textrm {Cov}}(X(s),X(t))$ $X_{i}(\cdot )$ $n$ $T_{i1},...,T_{iN_{i}}$ ${\textbf {X}}_{i}=(X_{i1},...,X_{iN_{i}})$ $X_{ij}=X_{i}(T_{ij})$ $X_{ij}$ $\epsilon _{ij}$ $\mathbb {E} (\epsilon _{ij})=0$ ${\textrm {Var}}(\epsilon _{ij})=\sigma _{ij}^{2}$ $i$ $j$

1. Funciones completamente observadas sin ruido en una cuadrícula arbitrariamente densa

Medidas disponibles para todos $Y_{it}=X_{i}(t)$ $t\in {\mathcal {I}},\,i=1,\ldots ,n$

A menudo poco realista, pero matemáticamente conveniente.

Ejemplo de la vida real: datos espectrales de Tecator. ^[7]

2. Funciones densamente muestreadas con mediciones ruidosas (diseño denso)

Medidas , donde se registran en una cuadrícula regular, $Y_{ij}=X_{i}(T_{ij})+\varepsilon _{ij}$ $T_{ij}$

$T_{i1},\ldots ,T_{iN_{i}}$ , y se aplica a datos funcionales típicos. $N_{i}\rightarrow \infty$

Ejemplo de la vida real: datos bursátiles y datos del estudio de crecimiento de Berkeley

3. Funciones escasamente muestreadas con mediciones ruidosas (datos longitudinales)

Medidas , donde son tiempos aleatorios y su número por sujeto es aleatorio y finito. $Y_{ij}=X_{i}(T_{ij})+\varepsilon _{ij}$ $T_{ij}$ $N_{i}$

Ejemplo de la vida real: datos del recuento de CD4 de pacientes con SIDA. ^[9]

Análisis de componentes principales funcionales

El análisis de componentes principales funcionales (FPCA) es la herramienta más frecuente en FDA, en parte porque FPCA facilita la reducción de dimensión de los datos funcionales inherentemente de dimensión infinita a un vector aleatorio de puntuaciones de dimensión finita. Más específicamente, la reducción de dimensión se logra expandiendo las trayectorias aleatorias observadas subyacentes en una base funcional que consiste en las funciones propias del operador de covarianza en . Considere el operador de covarianza como en ( 1 ), que es un operador compacto en el espacio de Hilbert . $X_{i}(t)$ $X$ ${\mathcal {C}}:L^{2}[0,1]\rightarrow L^{2}[0,1]$

Por el teorema de Mercer , la función kernel de , es decir, la función de covarianza , tiene descomposición espectral , donde la convergencia en serie es absoluta y uniforme, y son valores propios no negativos de valor real en orden descendente con las funciones propias ortonormales correspondientes . Por el teorema de Karhunen-Loève , la expansión FPCA de una trayectoria aleatoria subyacente es , donde son los componentes principales funcionales (FPC), a veces denominados puntuaciones. La expansión de Karhunen-Loève facilita la reducción de dimensión en el sentido de que la suma parcial converge uniformemente, es decir, como y, por tanto, la suma parcial con un lo suficientemente grande produce una buena aproximación a la suma infinita. Por tanto, la información en se reduce de dimensión infinita a un vector de dimensión - con el proceso aproximado: ${\mathcal {C}}$ $\Sigma (\cdot ,\cdot )$ $\Sigma (s,t)=\sum _{k=1}^{\infty }\lambda _{k}\varphi _{k}(s)\varphi _{k}(t)$ $\lambda _{k}$ $\varphi _{k}(t)$ $X_{i}(t)=\mu (t)+\sum _{k=1}^{\infty }A_{ik}\varphi _{k}(t)$ $A_{ik}=\int _{0}^{1}(X_{i}(t)-\mu (t))\varphi _{k}(t)dt$ $\sup _{t\in [0,1]}\mathbb {E} [X_{i}(t)-\mu (t)-\sum _{k=1}^{K}A_{ik}\varphi _{k}(t)]^{2}\rightarrow 0$ $K\rightarrow \infty$ $K$ $X_{i}$ $K$ $A_{i}=(A_{i1},...,A_{iK})$

Otras bases populares incluyen splines , series de Fourier y bases wavelet. Las aplicaciones importantes de FPCA incluyen los modos de variación y la regresión de componentes principales funcionales.

Modelos de regresión lineal funcional

Los modelos lineales funcionales pueden considerarse una extensión de los modelos lineales multivariados tradicionales que asocian respuestas vectoriales con covariables vectoriales. El modelo lineal tradicional con respuesta escalar y covariable vectorial puede expresarse como $Y\in \mathbb {R}$ $X\in \mathbb {R} ^{p}$

donde denota el producto interno en el espacio euclidiano , y denota los coeficientes de regresión, y es un error aleatorio (ruido) de varianza finita de media cero . Los modelos lineales funcionales se pueden dividir en dos tipos según las respuestas. $\langle \cdot ,\cdot \rangle$ $\beta _{0}\in \mathbb {R}$ $\beta \in \mathbb {R} ^{p}$ $\varepsilon$

Modelos de regresión funcional con respuesta escalar

Reemplazando la covariable vectorial y el vector de coeficientes en el modelo ( 3 ) por una función de covariable y coeficiente funcional centrada para y reemplazando el producto interno en el espacio euclidiano por el del espacio de Hilbert , se llega al modelo lineal funcional $X$ $\beta$ $X^{c}(t)=X(t)-\mu (t)$ $\beta =\beta (t)$ $t\in [0,1]$ $L^{2}$

El modelo lineal funcional simple ( 4 ) se puede extender a múltiples covariables funcionales, , incluyendo también covariables vectoriales adicionales , donde , por $\{X_{j}\}_{j=1}^{p}$ $Z=(Z_{1},\cdots ,Z_{q})$ $Z_{1}=1$

donde es el coeficiente de regresión para , el dominio de es , es la covariable funcional centrada dada por , y es la función del coeficiente de regresión para , para . Los modelos ( 4 ) y ( 5 ) han sido estudiados extensamente. ^[10]^[11]^[12] $\theta \in \mathbb {R^{q}}$ $Z$ $X_{j}$ $[0,1]$ $X_{j}^{c}$ $X_{j}^{c}(t)=X_{j}(t)-\mu _{j}(t)$ $\beta _{j}$ $X_{j}^{c}$ $j=1,\ldots ,p$

Modelos de regresión funcional con respuesta funcional

Consideremos una respuesta funcional en y múltiples covariables funcionales , , . En esta configuración se han considerado dos modelos principales. ^[13]^[7] Uno de estos dos modelos, generalmente denominado modelo lineal funcional (FLM), se puede escribir como: $Y(s)$ $[0,1]$ $X_{j}(t)$ $t\in [0,1]$ $j=1,\ldots ,p$

donde es la intersección funcional, para , es una covariable funcional centrada en , son las pendientes funcionales correspondientes con el mismo dominio, respectivamente, y suele ser un proceso aleatorio con media cero y varianza finita. ^[13] En este caso, en cualquier momento dado , el valor de , es decir, , depende de las trayectorias completas de . El modelo ( 6 ) ha sido estudiado extensamente. ^[14]^[15]^[16]^[17]^[18] $\alpha _{0}(s)$ $j=1,\ldots ,p$ $X_{j}^{c}(t)=X_{j}(t)-\mu _{j}(t)$ $[0,1]$ $\alpha _{j}(s,t)$ $\varepsilon (s)$ $s\in [0,1]$ $Y$ $Y(s)$ $\{X_{j}(t)\}_{j=1}^{p}$

Regresión de función sobre escalar

En particular, al tomar como función constante se obtiene un caso especial del modelo ( 6 ) , que es un modelo lineal funcional con respuestas funcionales y covariables escalares. $X_{j}(\cdot )$ $Y(s)=\alpha _{0}(s)+\sum _{j=1}^{p}X_{j}\alpha _{j}(s)+\varepsilon (s),\ {\text{for}}\ s\in [0,1],$

Modelos de regresión concurrente

Este modelo viene dado por,

donde son covariables funcionales en , son las funciones de coeficiente definidas en el mismo intervalo y generalmente se supone que es un proceso aleatorio con media cero y varianza finita. ^[13] Este modelo supone que el valor de depende solo del valor actual de y no del valor histórico o futuro. Por lo tanto, es un "modelo de regresión concurrente", que también se conoce como modelo de "coeficiente variable". Además, se han propuesto varios métodos de estimación. ^[19]^[20]^[21]^[22]^[23]^[24] $X_{1},\ldots ,X_{p}$ $[0,1]$ $\beta _{0},\beta _{1},\ldots ,\beta _{p}$ $\varepsilon (s)$ $Y(s)$ $\{X_{j}(s)\}_{j=1}^{p}$ $\{X_{j}(t):t\leq s\}_{j=1}^{p}$

Modelos de regresión no lineal funcional

Las extensiones no lineales directas de los modelos de regresión lineal funcional clásicos (FLM) aún implican un predictor lineal, pero lo combinan con una función de enlace no lineal, análoga a la idea del modelo lineal generalizado del modelo lineal convencional. Los desarrollos hacia modelos de regresión totalmente no paramétricos para datos funcionales enfrentan problemas como la maldición de la dimensionalidad . Para evitar la "maldición" y el problema de selección de métricas, estamos motivados a considerar modelos de regresión funcional no lineal, que están sujetos a algunas restricciones estructurales pero no infringen demasiado la flexibilidad. Uno desea modelos que retengan tasas polinómicas de convergencia, al mismo tiempo que sean más flexibles que, digamos, los modelos lineales funcionales. Tales modelos son particularmente útiles cuando los diagnósticos para el modelo lineal funcional indican falta de ajuste, lo que a menudo se encuentra en situaciones de la vida real. En particular, los modelos polinómicos funcionales, los modelos funcionales de índice único y múltiple y los modelos aditivos funcionales son tres casos especiales de modelos de regresión no lineal funcional.

Modelos de regresión polinómica funcional

Los modelos de regresión polinomial funcional pueden verse como una extensión natural de los modelos lineales funcionales (FLM) con respuestas escalares, de manera análoga a la extensión del modelo de regresión lineal al modelo de regresión polinomial . Para una respuesta escalar y una covariable funcional con dominio y los procesos predictores centrados correspondientes , el miembro más simple y más destacado en la familia de modelos de regresión polinomial funcional es la regresión funcional cuadrática ^[25] dada de la siguiente manera, donde es la covariable funcional centrada, es un coeficiente escalar y son funciones de coeficiente con dominios y , respectivamente. Además de la función de parámetro β que el modelo de regresión cuadrática funcional anterior comparte con el FLM, también presenta una superficie de parámetro γ. Por analogía con los FLM con respuestas escalares, la estimación de los modelos polinomiales funcionales se puede obtener mediante la expansión tanto de la covariable centrada como de las funciones de coeficiente y en una base ortonormal. ^[25]^[26] $Y$ $X(\cdot )$ $[0,1]$ $X^{c}$ $\mathbb {E} (Y|X)=\alpha +\int _{0}^{1}\beta (t)X^{c}(t)\,dt+\int _{0}^{1}\int _{0}^{1}\gamma (s,t)X^{c}(s)X^{c}(t)\,ds\,dt$ $X^{c}(\cdot )=X(\cdot )-\mathbb {E} (X(\cdot ))$ $\alpha$ $\beta (\cdot )$ $\gamma (\cdot ,\cdot )$ $[0,1]$ $[0,1]\times [0,1]$ $X^{c}$ $\beta$ $\gamma$

Modelos funcionales de índice único y múltiple

A continuación se presenta un modelo funcional de índice múltiple, en el que los símbolos tienen sus significados habituales, como se describió anteriormente. Aquí g representa una función suave general (desconocida) definida en un dominio p-dimensional. El caso produce un modelo funcional de índice único, mientras que los modelos de índice múltiple corresponden al caso . Sin embargo, para , este modelo es problemático debido a la maldición de la dimensionalidad . Con y tamaños de muestra relativamente pequeños, el estimador dado por este modelo a menudo tiene una gran varianza. ^[27]^[28] $\mathbb {E} (Y|X)=g\left(\int _{0}^{1}X^{c}(t)\beta _{1}(t)\,dt,\ldots ,\int _{0}^{1}X^{c}(t)\beta _{p}(t)\,dt\right)$ $p=1$ $p>1$ $p>1$ $p>1$

Modelos aditivos funcionales (FAM)

Para una base ortonormal dada en , podemos expandir el dominio . $\{\phi _{k}\}_{k=1}^{\infty }$ $L^{2}[0,1]$ $X^{c}(t)=\sum _{k=1}^{\infty }x_{k}\phi _{k}(t)$ $[0,1]$

Un modelo lineal funcional con respuestas escalares (ver ( 3 )) puede escribirse así, Una forma de FAMs se obtiene reemplazando la función lineal de en la expresión anterior (es decir, ) por una función general suave , análoga a la extensión de modelos de regresión lineal múltiple a modelos aditivos y se expresa como, donde satisface para . ^[13]^[7] Esta restricción en las funciones generales suaves asegura la identificabilidad en el sentido de que las estimaciones de estas funciones de componentes aditivos no interfieren con las del término de intersección . Otra forma de FAM es el modelo continuamente aditivo, ^[29] expresado como, para una superficie aditiva suave bivariada que se requiere para satisfacer para todos , con el fin de asegurar la identificabilidad. $\mathbb {E} (Y|X)=\mathbb {E} (Y)+\sum _{k=1}^{\infty }\beta _{k}x_{k}.$ $x_{k}$ $\beta _{k}x_{k}$ $f_{k}$ $\mathbb {E} (Y|X)=\mathbb {E} (Y)+\sum _{k=1}^{\infty }f_{k}(x_{k}),$ $f_{k}$ $\mathbb {E} (f_{k}(x_{k}))=0$ $k\in \mathbb {N}$ $f_{k}$ $\mathbb {E} (Y)$ $\mathbb {E} (Y|X)=\mathbb {E} (Y)+\int _{0}^{1}g(t,X(t))dt$ $g:[0,1]\times \mathbb {R} \longrightarrow \mathbb {R}$ $\mathbb {E} [g(t,X(t))]=0$ $t\in [0,1]$

Modelo lineal funcional generalizado

Una extensión obvia y directa de los FLM con respuestas escalares (ver ( 3 )) es agregar una función de enlace que conduzca a un modelo lineal funcional generalizado (GFLM) ^[30] en analogía con el modelo lineal generalizado (GLM). Los tres componentes del GFLM son:

Predictor lineal ; [componente sistemático] $\eta =\beta _{0}+\int _{0}^{1}X^{c}(t)\beta (t)\,dt$
Función de varianza , donde es la media condicional ; [componente aleatorio] ${\text{Var}}(Y|X)=V(\mu )$ $\mu =\mathbb {E} (Y|X)$
Función de enlace que conecta la media condicional y el predictor lineal a través de . [componente sistemático] $g$ $\mu$ $\eta$ $\mu =g(\eta )$

Agrupamiento y clasificación de datos funcionales

Para los datos multivariados de valor vectorial, los métodos de partición de k-medias y el agrupamiento jerárquico son dos enfoques principales. Estos conceptos de agrupamiento clásicos para datos multivariados de valor vectorial se han extendido a los datos funcionales. Para el agrupamiento de datos funcionales, los métodos de agrupamiento de k-medias son más populares que los métodos de agrupamiento jerárquico. Para el agrupamiento de k-medias en datos funcionales, las funciones de media se consideran generalmente como los centros del agrupamiento. También se han tenido en cuenta las estructuras de covarianza. ^[31] Además del agrupamiento de tipo k-medias, el agrupamiento funcional ^[32] basado en modelos de mezcla también se utiliza ampliamente en el agrupamiento de datos multivariados de valor vectorial y se ha extendido al agrupamiento de datos funcionales. ^[33]^[34]^[35]^[36]^[37] Además, el agrupamiento jerárquico bayesiano también desempeña un papel importante en el desarrollo del agrupamiento funcional basado en modelos. ^[38]^[39]^[40]^[41]

La clasificación funcional asigna una pertenencia a un grupo a un nuevo objeto de datos, ya sea en base a una regresión funcional o a un análisis discriminante funcional. Los métodos de clasificación de datos funcionales basados en modelos de regresión funcional utilizan niveles de clase como respuestas y los datos funcionales observados y otras covariables como predictores. Para los modelos de clasificación funcional basados en regresión, los modelos lineales generalizados funcionales o, más específicamente, la regresión binaria funcional, como la regresión logística funcional para respuestas binarias, son enfoques de clasificación comúnmente utilizados. De manera más general, se utiliza el modelo de regresión lineal funcional generalizado basado en el enfoque FPCA . ^[42] El análisis discriminante lineal funcional (FLDA) también se ha considerado como un método de clasificación para datos funcionales. ^[43]^[44]^[45]^[46]^[47] También se ha propuesto la clasificación de datos funcionales que involucra proporciones de densidad. ^[48] Un estudio del comportamiento asintótico de los clasificadores propuestos en el límite de muestra grande muestra que, en ciertas condiciones, la tasa de clasificación errónea converge a cero, un fenómeno que se ha denominado "clasificación perfecta". ^[49]

Deformación del tiempo

Motivaciones

Ilustración de la motivación de la deformación temporal en el sentido de capturar la media transversal. — Las estructuras en la media de la sección transversal se destruyen si se ignora la variación temporal. Por el contrario, las estructuras en la media de la sección transversal se capturan bien después de restaurar la variación temporal.

Además de la variación de amplitud, ^[50] también se puede suponer que existe variación temporal en los datos funcionales. La variación temporal se produce cuando el momento específico de ciertos eventos de interés varía entre sujetos. Un ejemplo clásico son los datos del Estudio de Crecimiento de Berkeley, ^[51] donde la variación de amplitud es la tasa de crecimiento y la variación temporal explica la diferencia en la edad biológica de los niños en la que se produjo el estirón puberal y el prepuberal. En presencia de variación temporal, la función de media transversal puede no ser una estimación eficiente ya que los picos y valles se ubican aleatoriamente y, por lo tanto, las señales significativas pueden distorsionarse u ocultarse.

La deformación temporal, también conocida como registro de curvas, ^[52] alineación de curvas o sincronización temporal, tiene como objetivo identificar y separar la variación de amplitud y la variación temporal. Si están presentes tanto la variación temporal como la de amplitud, entonces los datos funcionales observados se pueden modelar como , donde es una función de amplitud latente y es una función de deformación temporal latente que corresponde a una función de distribución acumulativa. Se supone que las funciones de deformación temporal son invertibles y satisfacen . $Y_{i}$ $Y_{i}(t)=X_{i}[h_{i}^{-1}(t)],t\in [0,1]$ $X_{i}{\overset {iid}{\sim }}X$ $h_{i}{\overset {iid}{\sim }}h$ $h$ $\mathbb {E} (h^{-1}(t))=t$

El caso más simple de una familia de funciones de deformación para especificar la variación de fase es la transformación lineal, es decir , que deforma el tiempo de una función de plantilla subyacente mediante un desplazamiento y una escala específicos del sujeto. Una clase más general de funciones de deformación incluye difeomorfismos del dominio a sí mismo, es decir, en términos generales, una clase de funciones invertibles que asignan el dominio compacto a sí mismo de modo que tanto la función como su inversa sean suaves. El conjunto de transformación lineal está contenido en el conjunto de difeomorfismos . ^[53] Un desafío en la deformación del tiempo es la identificabilidad de la variación de amplitud y fase. Se requieren suposiciones específicas para romper esta no identificabilidad. $h(t)=\delta +\gamma t$

Métodos

Los enfoques anteriores incluyen la deformación temporal dinámica (DTW) utilizada para aplicaciones como el reconocimiento de voz . ^[54] Otro método tradicional para la deformación temporal es el registro de puntos de referencia, ^[55]^[56] que alinea características especiales como las ubicaciones de los picos con una ubicación promedio. Otros métodos de deformación relevantes incluyen la deformación por pares, ^[57] el registro utilizando la distancia ^[53] y la deformación elástica. ^[58] ${\mathcal {L}}^{2}$

Deformación temporal dinámica

La función de plantilla se determina mediante un proceso de iteración, que comienza con la media de la sección transversal, realiza el registro y recalcula la media de la sección transversal para las curvas deformadas, esperando la convergencia después de algunas iteraciones. DTW minimiza una función de costo mediante programación dinámica. Los problemas de deformaciones diferenciables no uniformes o de computación voraz en DTW se pueden resolver agregando un término de regularización a la función de costo.

Registro de hitos

El registro de puntos de referencia (o alineación de características) supone que las características bien expresadas están presentes en todas las curvas de muestra y utiliza la ubicación de dichas características como un estándar de oro. Las características especiales, como las ubicaciones de picos o valles en funciones o derivadas, se alinean con sus ubicaciones promedio en la función de plantilla. ^[53] Luego, la función de deformación se introduce a través de una transformación suave desde la ubicación promedio a las ubicaciones específicas del sujeto. Un problema del registro de puntos de referencia es que las características pueden faltar o ser difíciles de identificar debido al ruido en los datos.

Extensiones

Hasta ahora hemos considerado un proceso estocástico con valores escalares, definido en un dominio de tiempo unidimensional. $\{X(t)\}_{t\in {\mathcal {T}}}$

Dominio multidimensional de X ( ⋅ ) {\displaystyle X(\cdot )}

El dominio de puede estar en , por ejemplo, los datos podrían ser una muestra de superficies aleatorias. ^[59]^[60] $X(\cdot )$ $R^{p}$

Proceso estocástico multivariante

El conjunto de rangos del proceso estocástico puede extenderse desde [ ^61]^[62]^[63] y además a variedades no lineales, ^[64] espacios de Hilbert ^[65] y eventualmente a espacios métricos. ^[59] $R$ $R^{p}$

Pitónpaquetes

Existen paquetes de Python para trabajar con datos funcionales, y su representación, realizar análisis exploratorios o preprocesamiento, y entre otras tareas como inferencia, clasificación, regresión o clusterización de datos funcionales.

ciencia-fda

Rpaquetes

Algunos paquetes pueden manejar datos funcionales bajo diseños tanto densos como longitudinales.

FDA ^[7]
reembolso
espacio de almacenamiento ^[17]
Impulso FD
Función de clase
FDA.USC
por cierto
fdasrvf ^[58]

Véase también

Lectura adicional

Ramsay, JO y Silverman, BW (2005) Análisis de datos funcionales , 2.ª ed., Nueva York: Springer, ISBN 0-387-40080-X
Horvath, L. y Kokoszka, P. (2012) Inferencia para datos funcionales con aplicaciones , Nueva York: Springer, ISBN 978-1-4614-3654-6
Hsing, T. y Eubank, R. (2015) Fundamentos teóricos del análisis funcional de datos, con una introducción a los operadores lineales , Serie de Wiley en probabilidad y estadística, John Wiley & Sons, Ltd, ISBN 978-0-470-01691-6
Morris, J. (2015) Regresión funcional, Revista anual de estadística y su aplicación, vol. 2, 321 - 359, https://doi.org/10.1146/annurev-statistics-010814-020413
Wang et al. (2016) Análisis de datos funcionales, Revista anual de estadística y su aplicación, vol. 3, 257-295, https://doi.org/10.1146/annurev-statistics-041715-033624

Categoría:Análisis de regresión

Referencias

^ Granandro, U. (1950). "Procesos estocásticos e inferencia estadística". Arkiv för Matematik . 1 (3): 195–277. Código Bib : 1950ArM.....1..195G. doi : 10.1007/BF02590638 . S2CID 120451372.
^ Rice, JA; Silverman, BW. (1991). "Estimación de la estructura de media y covarianza de forma no paramétrica cuando los datos son curvas". Journal of the Royal Statistical Society . 53 (1): 233–243. doi :10.1111/j.2517-6161.1991.tb01821.x.
^ Müller, HG. (2016). "Peter Hall, análisis de datos funcionales y objetos aleatorios". Anales de Estadística . 44 (5): 1867–1887. doi : 10.1214/16-AOS1492 .
^ Karhunen, K (1946). Zur Spektraltheorie stochastischer Prozesse . Annales Academiae scientiarum Fennicae.
^ Kleffe, J. (1973). "Componentes principales de variables aleatorias con valores en un espacio de Hilbert separable". Mathematische Operationsforschung und Statistik . 4 (5): 391–406. doi :10.1080/02331887308801137.
^ Dauxois, J; Pousse, A; Romain, Y. (1982). "Teoría asintótica para el análisis de componentes principales de una función aleatoria vectorial: algunas aplicaciones a la inferencia estadística". Journal of Multivariate Analysis . 12 (1): 136–154. doi : 10.1016/0047-259X(82)90088-4 .
^ abcde Ramsay, J; Silverman, BW. (2005). Análisis de datos funcionales, 2.ª ed . Springer.
^ Hsing, T; Eubank, R (2015). Fundamentos teóricos del análisis funcional de datos, con una introducción a los operadores lineales . Series de Wiley en probabilidad y estadística.
^ Shi, M; Weiss, RE; Taylor, JMG. (1996). "Análisis de los recuentos pediátricos de CD4 para el síndrome de inmunodeficiencia adquirida utilizando curvas aleatorias flexibles". Revista de la Royal Statistical Society. Serie C (Estadística aplicada) . 45 (2): 151–163.
^ Hilgert, N; Mas, A; Verzelen, N. (2013). "Pruebas adaptativas Minimax para el modelo lineal funcional". Anales de Estadística . 41 (2): 838–869. arXiv : 1206.1194 . doi :10.1214/13-AOS1093. S2CID 13119710.
^ Kong, D; Xue, K; Yao, F; Zhang, HH. (2016). "Regresión lineal parcialmente funcional en altas dimensiones". Biometrika . 103 (1): 147–159. doi :10.1093/biomet/asv062.
^ Horváth, L; Kokoszka, P. (2012). Inferencia para datos funcionales con aplicaciones . Springer Series in Statistics. Springer-Verlag.
^ abcd Wang, JL; Chiou, JM; Müller, HG. (2016). "Análisis de datos funcionales". Revisión anual de estadística y su aplicación . 3 (1): 257–295. Bibcode :2016AnRSA...3..257W. doi : 10.1146/annurev-statistics-041715-033624 . S2CID 13709250.
^ Ramsay, JO; Dalzell, CJ. (1991). "Algunas herramientas para el análisis funcional de datos". Revista de la Royal Statistical Society, Serie B (Metodológica) . 53 (3): 539–561. doi :10.1111/j.2517-6161.1991.tb01844.x. S2CID 118960346.
^ Malfait, N; Ramsay, JO. (2003). "El modelo lineal funcional histórico". Revista Canadiense de Estadística . 31 (2): 115–128. doi :10.2307/3316063. JSTOR 3316063. S2CID 55092204.
^ He, G; Müller, HG; Wang, JL. (2003). "Análisis canónico funcional para procesos estocásticos integrables al cuadrado". Journal of Multivariate Analysis . 85 (1): 54–77. doi :10.1016/S0047-259X(02)00056-8.
^ ab Yao, F; Müller, HG; Wang, JL. (2005). "Análisis de datos funcionales para datos longitudinales dispersos". Revista de la Asociación Estadounidense de Estadística . 100 (470): 577–590. doi :10.1198/016214504000001745. S2CID 1243975.
^ He, G; Müller, HG; Wang, JL; Yang, WJ. (2010). "Regresión lineal funcional mediante análisis canónico". Revista de análisis multivariante . 16 (3): 705–729. arXiv : 1102.5212 . doi :10.3150/09-BEJ228. S2CID 17843044.
^ Fan, J; Zhang, W. (1999). "Estimación estadística en modelos de coeficientes variables". Anales de Estadística . 27 (5): 1491–1518. doi : 10.1214/aos/1017939139 . S2CID 16758288.
^ Wu, CO; Yu, KF. (2002). "Modelos no paramétricos de coeficientes variables para el análisis de datos longitudinales". Revista estadística internacional . 70 (3): 373–393. doi :10.1111/j.1751-5823.2002.tb00176.x. S2CID 122007787.
^ Huang, JZ; Wu, CO; Zhou, L. (2002). "Modelos de coeficientes variables y aproximaciones de función base para el análisis de mediciones repetidas". Biometrika . 89 (1): 111–128. doi :10.1093/biomet/89.1.111.
^ Huang, JZ; Wu, CO; Zhou, L. (2004). "Estimación e inferencia de splines polinomiales para modelos de coeficientes variables con datos longitudinales". Statistica Sinica . 14 (3): 763–788.
^ Şentürk, D; Müller, HG. (2010). "Modelos funcionales de coeficientes variables para datos longitudinales". Revista de la Asociación Estadounidense de Estadística . 105 (491): 1256–1264. doi :10.1198/jasa.2010.tm09228. S2CID 14296231.
^ Eggermont, PPB; Eubank, RL; LaRiccia, VN. (2010). "Tasas de convergencia para estimadores de spline suavizados en modelos de coeficientes variables". Journal of Statistical Planning and Inference . 140 (2): 369–381. doi :10.1016/j.jspi.2009.06.017.
^ ab Yao, F; Müller, HG. (2010). "Regresión cuadrática funcional". Biometrika . 97 (1):49–64.
^ Horváth, L; Reeder, R. (2013). "Una prueba de significancia en la regresión cuadrática funcional". Bernoulli . 19 (5A): 2120–2151. arXiv : 1105.0014 . doi : 10.3150/12-BEJ446 . S2CID 88512527.
^ Chen, D; Hall, P; Müller HG. (2011). "Modelos de regresión funcional de índice único y múltiple con vínculo no paramétrico". Anales de Estadística . 39 (3):1720–1747.
^ Jiang, CR; Wang JL. (2011). "Modelos funcionales de índice único para datos longitudinales". Annals of Statistics . 39 (1):362–388.
^ Müller HG; Wu Y; Yao, F. (2013). "Modelos continuamente aditivos para regresión funcional no lineal". Biometrika . 100 (3): 607–622. doi :10.1093/biomet/ast004.{{cite journal}}: CS1 maint: multiple names: authors list (link)
^ Müller HG; Stadmüller, U. (2005). "Modelos lineales funcionales generalizados". Anales de estadística . 33 (2): 774–805. arXiv : math/0505638 . doi :10.1214/009053604000001156.{{cite journal}}: CS1 maint: multiple names: authors list (link)
^ Chiou, JM; Li, PL. (2007). "Agrupamiento funcional e identificación de subestructuras de datos longitudinales". Revista de la Royal Statistical Society, Serie B (Metodología estadística) . 69 (4): 679–699. doi : 10.1111/j.1467-9868.2007.00605.x . S2CID : 120883171.
^ Banfield, JD; Raftery, AE. (1993). "Agrupamiento gaussiano y no gaussiano basado en modelos". Biometrics . 49 (3): 803–821. doi :10.2307/2532201. JSTOR 2532201.
^ James, GM; Sugar, CA. (2003). "Agrupamiento para datos funcionales de muestreo disperso". Revista de la Asociación Estadounidense de Estadística . 98 (462): 397–408. doi :10.1198/016214503000189. S2CID 9487422.
^ Jacques, J; Preda, C. (2013). "Funclust: Un método de agrupamiento de curvas utilizando la aproximación de densidad de variables aleatorias funcionales" (PDF) . Neurocomputing . 112 : 164–171. doi :10.1016/j.neucom.2012.11.042. S2CID 33591208.
^ Jacques, J; Preda, C. (2014). "Agrupamiento basado en modelos para datos funcionales multivariados". Computational Statistics & Data Analysis . 71 (C): 92–106. doi :10.1016/j.csda.2012.12.004.
^ Coffey, N; Hinde, J; Holian, E. (2014). "Agrupamiento de perfiles longitudinales mediante P-splines y modelos de efectos mixtos aplicados a datos de expresión génica en el transcurso del tiempo". Computational Statistics & Data Analysis . 71 (C): 14–29. doi :10.1016/j.csda.2013.04.001.
^ Heinzl, F; Tutz, G. (2014). "Agrupamiento en modelos lineales mixtos con una penalización de lazo fusionado de grupo". Revista biométrica . 56 (1): 44–68. doi :10.1002/bimj.201200111. PMID 24249100. S2CID 10969266.
^ Angelini, C; Canditiis, DD; Pensky, M. (2012). "Agrupamiento de datos de microarrays de evolución temporal utilizando un modelo de mezcla infinita bayesiano funcional". Journal of Applied Statistics . 39 (1): 129–149. Bibcode :2012JApSt..39..129A. doi :10.1080/02664763.2011.578620. S2CID 8902492.
^ Rodríguez, A; Dunson, DB; Gelfand, AE. (2009). "Análisis de datos funcionales no paramétricos bayesianos mediante estimación de densidad". Biometrika . 96 (1): 149–162. doi :10.1093/biomet/asn054. PMC 2650433 . PMID 19262739.
^ Petrone, S; Guindani, M; Gelfand, AE. (2009). "Modelos híbridos de mezcla de Dirichlet para datos funcionales". Revista de la Royal Statistical Society . 71 (4): 755–782. doi :10.1111/j.1467-9868.2009.00708.x. S2CID 18638091.
^ Heinzl, F; Tutz, G. (2013). "Agrupamiento en modelos lineales mixtos con mezclas aproximadas de procesos Dirichlet utilizando el algoritmo EM" (PDF) . Modelado estadístico . 13 (1): 41–67. doi :10.1177/1471082X12471372. S2CID 11448616.
^ Leng, X; Müller, HG. (2006). "Clasificación mediante análisis de datos funcionales para datos de expresión génica temporal" (PDF) . Bioinformática . 22 (1): 68–76. doi : 10.1093/bioinformatics/bti742 . PMID 16257986.
^ James, GM; Hastie, TJ. (2001). "Análisis discriminante lineal funcional para curvas muestreadas irregularmente". Revista de la Royal Statistical Society . 63 (3): 533–550. doi : 10.1111/1467-9868.00297 . S2CID 16050693.
^ Hall, P; Poskitt, DS; Presnell, B. (2001). "Un enfoque analítico de datos funcionales para la discriminación de señales". Technometrics . 43 (1): 1–9. doi :10.1198/00401700152404273. S2CID 21662019.
^ Ferraty, F; Vieu, P. (2003). "Discriminación de curvas: un enfoque funcional no paramétrico". Computational Statistics & Data Analysis . 44 (1–2): 161–173. doi :10.1016/S0167-9473(03)00032-X.
^ Chang, C; Chen, Y; Ogden, RT. (2014). "Clasificación de datos funcionales: un enfoque wavelet". Computational Statistics . 29 (6): 1497–1513. doi :10.1007/s00180-014-0503-4. PMC 11192549 . S2CID 120454400.
^ Zhu, H; Brown, PJ; Morris, JS. (2012). "Clasificación robusta de datos de imágenes funcionales y cuantitativos utilizando modelos funcionales mixtos". Biometrics . 68 (4): 1260–1268. doi :10.1111/j.1541-0420.2012.01765.x. PMC 3443537 . PMID 22670567.
^ Dai, X; Müller, HG; Yao, F. (2017). "Clasificadores bayesianos óptimos para datos funcionales y proporciones de densidad". Biometrika . 104 (3): 545–560. arXiv : 1605.03707 .
^ Delaigle, A; Hall, P (2012). "Lograr una clasificación casi perfecta para datos funcionales". Revista de la Royal Statistical Society. Serie B (Metodología estadística) . 74 (2): 267–286. doi : 10.1111/j.1467-9868.2011.01003.x . ISSN: 1369-7412. S2CID : 124261587.
^ Wang, JL; Chiou, JM; Müller, HG. (2016). "Análisis de datos funcionales". Revisión anual de estadística y su aplicación . 3 (1): 257–295. Bibcode :2016AnRSA...3..257W. doi : 10.1146/annurev-statistics-041715-033624 . S2CID 13709250.
^ Gasser, T; Müller, HG; Kohler, W; Molinari, L; Prader, A. (1984). "Análisis de regresión no paramétrica de curvas de crecimiento". Anales de Estadística . 12 (1): 210–229.
^ Ramsay, JO; Li, X. (1998). "Registro de curvas". Revista de la Royal Statistical Society, Serie B . 60 (2): 351–363. doi : 10.1111/1467-9868.00129 . S2CID 17175587.
^ abc Marron, JS; Ramsay, JO; Sangalli, LM; Srivastava, A (2015). "Análisis de datos funcionales de variación de amplitud y fase". Ciencia estadística . 30 (4): 468–484. arXiv : 1512.03216 . doi :10.1214/15-STS524. S2CID 55849758.
^ Sakoe, H; Chiba, S. (1978). "Optimización de algoritmos de programación dinámica para el reconocimiento de palabras habladas". IEEE Transactions on Acoustics, Speech, and Signal Processing . 26 : 43–49. doi :10.1109/TASSP.1978.1163055. S2CID 17900407.
^ Kneip, A; Gasser, T (1992). "Herramientas estadísticas para analizar datos que representan una muestra de curvas". Anales de Estadística . 20 (3): 1266–1305. doi : 10.1214/aos/1176348769 .
^ Gasser, T; Kneip, A (1995). "Búsqueda de estructura en una muestra de curva". Revista de la Asociación Estadounidense de Estadística . 90 (432): 1179–1188.
^ Tang, R; Müller, HG. (2008). "Sincronización de curvas por pares para datos funcionales". Biometrika . 95 (4): 875–889. doi :10.1093/biomet/asn047.
^ ab Anirudh, R; Turaga, P; Su, J; Srivastava, A (2015). "Codificación funcional elástica de acciones humanas: de campos vectoriales a variables latentes". Actas de la Conferencia IEEE sobre Visión artificial y reconocimiento de patrones : 3147–3155.
^ ab Dubey, P; Müller, HG (2021). "Modelado de objetos aleatorios variables en el tiempo y redes dinámicas". Revista de la Asociación Estadounidense de Estadística . 117 (540): 2252–2267. arXiv : 2104.04628 . doi :10.1080/01621459.2021.1917416. S2CID 233210300.
^ Pigoli, D; Hadjipantelis, PZ; Coleman, JS; Aston, JAD (2017). "El análisis estadístico de datos fonéticos acústicos: exploración de las diferencias entre las lenguas romances habladas". Revista de la Royal Statistical Society. Serie C (Estadística Aplicada) . 67 (5): 1130–1145.
^ Happ, C; Greven, S (2018). "Análisis de componentes principales funcionales multivariados para datos observados en diferentes dominios (dimensionales)". Revista de la Asociación Estadounidense de Estadística . 113 (522): 649–659. arXiv : 1509.02029 . doi :10.1080/01621459.2016.1273115. S2CID 88521295.
^ Chiou, JM; Yang, YF; Chen, YT (2014). "Análisis de componentes principales funcionales multivariados: un enfoque de normalización". Statistica Sinica . 24 : 1571–1596.
^ Carroll, C; Müller, HG; Kneip, A (2021). "Registro de componentes cruzados para datos funcionales multivariados, con aplicación a curvas de crecimiento". Biometría . 77 (3): 839–851. arXiv : 1811.01429 . doi :10.1111/biom.13340. S2CID 220687157.
^ Dai, X; Müller, HG (2018). "Análisis de componentes principales para datos funcionales en variedades y esferas de Riemann". Anales de Estadística . 46 (6B): 3334–3361. arXiv : 1705.06226 . doi :10.1214/17-AOS1660. S2CID 13671221.
^ Chen, K; Delicado, P; Müller, HG (2017). "Modelado de procesos estocásticos con valores de función, con aplicaciones a la dinámica de la fertilidad". Revista de la Royal Statistical Society. Serie B (Metodología estadística) . 79 (1): 177–196. doi :10.1111/rssb.12160. hdl : 2117/126653 . S2CID : 13719492.