stringtranslate.com

teorema de mercer

En matemáticas , específicamente en análisis funcional , el teorema de Mercer es una representación de una función simétrica definida positiva sobre un cuadrado como suma de una secuencia convergente de funciones producto. Este teorema, presentado en (Mercer 1909), es uno de los resultados más notables del trabajo de James Mercer (1883-1932). Es una herramienta teórica importante en la teoría de ecuaciones integrales ; se utiliza en la teoría espacial de procesos estocásticos de Hilbert , por ejemplo el teorema de Karhunen-Loève ; y también se utiliza en la teoría del espacio de Hilbert del núcleo reproductor, donde caracteriza un núcleo definido positivo simétrico como un núcleo reproductor. [1]

Introducción

Para explicar el teorema de Mercer , primero consideramos un caso especial importante; ver más abajo para una formulación más general. Un núcleo , en este contexto, es una función continua simétrica.

donde simétrico significa que para todos .

Se dice que K es un núcleo definido positivo si y sólo si

para todas las secuencias finitas de puntos x 1 , ...,  x n de [ ab ] y todas las elecciones de números reales c 1 , ...,  c n . Tenga en cuenta que el término "definido positivo" está bien establecido en la literatura a pesar de la débil desigualdad en la definición. [2] [3]

Asociado a K hay un operador lineal (más específicamente un operador integral de Hilbert-Schmidt ) en funciones definidas por la integral

Por consideraciones técnicas, asumimos que puede abarcar el espacio L 2 [ ab ] (ver espacio Lp ) de funciones de valor real integrables al cuadrado. Dado que T K es un operador lineal , podemos hablar de valores propios y funciones propias de T K.

Teorema . Supongamos que K es un núcleo definido positivo simétrico continuo. Entonces hay una base ortonormal { e i } i de L 2 [ ab ] que consta de funciones propias de T K tales que la secuencia correspondiente de valores propios {λ i } i no es negativa. Las funciones propias correspondientes a valores propios distintos de cero son continuas en [ ab ] y K tiene la representación

donde la convergencia es absoluta y uniforme.

Detalles

Ahora explicamos con mayor detalle la estructura de la prueba del teorema de Mercer, particularmente cómo se relaciona con la teoría espectral de operadores compactos .

Para mostrar la compacidad, demuestre que la imagen de la bola unitaria de L 2 [ a , b ] bajo T K es equicontinua y aplique el teorema de Ascoli , para mostrar que la imagen de la bola unitaria es relativamente compacta en C([ a , b ]) con la norma uniforme y a fortiori en L 2 [ a , b ].

Ahora aplique el teorema espectral para operadores compactos en espacios de Hilbert a T K para mostrar la existencia de la base ortonormal { e i } i de L 2 [ a , b ]

Si λ i ≠ 0, se considera que el vector propio ( función propia ) e i es continuo en [ a , b ]. Ahora

lo que demuestra que la secuencia

converge absoluta y uniformemente a un núcleo K 0 que se ve fácilmente que define el mismo operador que el núcleo K . Por tanto K = K 0 de donde se sigue el teorema de Mercer.

Finalmente, para mostrar la no negatividad de los valores propios, se puede escribir y expresar el lado derecho como una integral bien aproximada por sus sumas de Riemann, que no son negativas por la definición positiva de K , lo que implica , lo que implica .

Rastro

Lo siguiente es inmediato:

Teorema . Supongamos que K es un núcleo definido positivo simétrico continuo; T K tiene una secuencia de valores propios no negativos {λ i } i . Entonces

Esto muestra que el operador T K es un operador de clase de seguimiento y

Generalizaciones

El teorema de Mercer en sí es una generalización del resultado de que cualquier matriz semidefinida positiva simétrica es la matriz de Gramian de un conjunto de vectores.

La primera generalización [ cita requerida ] reemplaza el intervalo [ ab ] con cualquier espacio compacto de Hausdorff y la medida de Lebesgue en [ ab ] se reemplaza por una medida finita contablemente aditiva μ en el álgebra de Borel de X cuyo soporte es X. Esto significa que μ( U ) > 0 para cualquier subconjunto abierto no vacío U de X .

Una generalización reciente [ cita necesaria ] reemplaza estas condiciones por lo siguiente: el conjunto X es un primer espacio topológico contable dotado de una medida de Borel (completa) μ. X es el soporte de μ y, para todo x en X , existe un conjunto abierto U que contiene x y tiene medida finita. Entonces esencialmente se cumple el mismo resultado:

Teorema . Supongamos que K es un núcleo definido positivo simétrico continuo en X. Si la función κ es L 1 μ ( X ), donde κ(x)=K(x,x), para todo x en X , entonces hay un conjunto ortonormal { e i } i de L 2 μ ( X ) que consiste de funciones propias de T K tales que la secuencia correspondiente de valores propios {λ i } i no es negativa. Las funciones propias correspondientes a valores propios distintos de cero son continuas en X y K tiene la representación

donde la convergencia es absoluta y uniforme en subconjuntos compactos de X .

La siguiente generalización [ cita necesaria ] trata de representaciones de núcleos mensurables .

Sea ( X , M , μ ) un espacio de medida finita σ. Un núcleo L 2 (o integrable al cuadrado) en X es una función

Los núcleos L ​​2 definen un operador acotado T K mediante la fórmula

T K es un operador compacto (en realidad es incluso un operador de Hilbert-Schmidt ). Si el núcleo K es simétrico, según el teorema espectral , T K tiene una base ortonormal de vectores propios. Aquellos vectores propios que corresponden a valores propios distintos de cero se pueden organizar en una secuencia { e i } i (independientemente de la separabilidad).

Teorema . Si K es un núcleo simétrico definido positivo en ( X , M , μ), entonces

donde la convergencia en la norma L 2 . Tenga en cuenta que cuando no se supone la continuidad del núcleo, la expansión ya no converge uniformemente.

La condición de Mercer.

En matemáticas , se dice que una función de valor real K ( x , y ) cumple la condición de Mercer si para todas las funciones integrables al cuadrado g ( x ) se tiene

analógico discreto

Esto es análogo a la definición de una matriz semidefinida positiva . Esta es una matriz de dimensión , que satisface, para todos los vectores , la propiedad

.

Ejemplos

Una función constante positiva

satisface la condición de Mercer, ya que entonces la integral se convierte según el teorema de Fubini

lo cual de hecho no es negativo .

Ver también

Notas

  1. ^ Bartlett, Peter (2008). "Reproducción de espacios Kernel Hilbert" (PDF) . Apuntes de conferencias de la teoría del aprendizaje estadístico CS281B/Stat241B . Universidad de California en Berkeley.
  2. ^ Mohri, Mehryar (2018). Fundamentos del aprendizaje automático. Afshin Rostamizadeh, Ameet Talwalkar (Segunda ed.). Cambridge, Massachusetts. ISBN 978-0-262-03940-6. OCLC  1041560990.{{cite book}}: Mantenimiento CS1: falta el editor de la ubicación ( enlace )
  3. ^ Berlinet, A. (2004). Reproducción de espacios centrales de Hilbert en probabilidad y estadística. Christine Thomas-Agnan. Nueva York: Springer Science+Business Media. ISBN 1-4419-9096-8. OCLC  844346520.

Referencias