La teoría ergódica es una rama de las matemáticas que estudia las propiedades estadísticas de los sistemas dinámicos deterministas ; es el estudio de la ergodicidad . En este contexto, "propiedades estadísticas" se refiere a propiedades que se expresan a través del comportamiento de los promedios temporales de varias funciones a lo largo de las trayectorias de los sistemas dinámicos. La noción de sistemas dinámicos deterministas supone que las ecuaciones que determinan la dinámica no contienen ninguna perturbación aleatoria , ruido , etc. Por lo tanto, las estadísticas que nos interesan son propiedades de la dinámica.
La teoría ergódica, al igual que la teoría de la probabilidad , se basa en nociones generales de la teoría de la medida . Su desarrollo inicial estuvo motivado por problemas de física estadística .
Una preocupación central de la teoría ergódica es el comportamiento de un sistema dinámico cuando se le permite funcionar durante un largo tiempo. El primer resultado en esta dirección es el teorema de recurrencia de Poincaré , que afirma que casi todos los puntos en cualquier subconjunto del espacio de fases eventualmente vuelven a visitar el conjunto. Los sistemas para los cuales se cumple el teorema de recurrencia de Poincaré son sistemas conservativos ; por lo tanto, todos los sistemas ergódicos son conservativos.
Información más precisa la proporcionan varios teoremas ergódicos que afirman que, bajo ciertas condiciones, el promedio temporal de una función a lo largo de las trayectorias existe casi en todas partes y está relacionado con el promedio espacial. Dos de los teoremas más importantes son los de Birkhoff (1931) y von Neumann que afirman la existencia de un promedio temporal a lo largo de cada trayectoria. Para la clase especial de sistemas ergódicos , este promedio temporal es el mismo para casi todos los puntos iniciales: estadísticamente hablando, el sistema que evoluciona durante mucho tiempo "olvida" su estado inicial. También se han estudiado ampliamente propiedades más fuertes, como la mezcla y la equidistribución .
El problema de la clasificación métrica de los sistemas es otra parte importante de la teoría ergódica abstracta. Las diversas nociones de entropía para sistemas dinámicos desempeñan un papel destacado en la teoría ergódica y sus aplicaciones a los procesos estocásticos .
Los conceptos de ergodicidad y la hipótesis ergódica son fundamentales para las aplicaciones de la teoría ergódica. La idea subyacente es que para ciertos sistemas el promedio temporal de sus propiedades es igual al promedio en todo el espacio. Las aplicaciones de la teoría ergódica a otras partes de las matemáticas generalmente implican establecer propiedades de ergodicidad para sistemas de tipo especial. En geometría , se han utilizado métodos de la teoría ergódica para estudiar el flujo geodésico en variedades de Riemann , comenzando con los resultados de Eberhard Hopf para superficies de Riemann de curvatura negativa. Las cadenas de Markov forman un contexto común para aplicaciones en teoría de la probabilidad . La teoría ergódica tiene conexiones fructíferas con el análisis armónico , la teoría de Lie ( teoría de la representación , redes en grupos algebraicos ) y la teoría de números (la teoría de aproximaciones diofánticas , funciones L ).
La teoría ergódica se ocupa a menudo de las transformaciones ergódicas . La intuición detrás de estas transformaciones, que actúan sobre un conjunto dado, es que hacen un trabajo minucioso de "revolver" los elementos de ese conjunto. Por ejemplo, si el conjunto es una cantidad de avena caliente en un bol, y si se deja caer una cucharada de jarabe en el bol, entonces las iteraciones de la inversa de una transformación ergódica de la avena no permitirán que el jarabe permanezca en una subregión local de la avena, sino que lo distribuirán uniformemente por toda ella. Al mismo tiempo, estas iteraciones no comprimirán ni dilatarán ninguna porción de la avena: preservan la medida que es la densidad.
La definición formal es la siguiente:
Sea T : X → X una transformación que preserva la medida en un espacio de medida ( X , Σ , μ ) , con μ ( X ) = 1 . Entonces T es ergódico si para cada E en Σ con μ( T −1 ( E ) Δ E ) = 0 (es decir, E es invariante ), μ ( E ) = 0 o μ ( E ) = 1 .
El operador Δ es aquí la diferencia simétrica de conjuntos, equivalente a la operación o-exclusiva con respecto a la pertenencia a un conjunto. La condición de que la diferencia simétrica sea de medida cero se denomina ser esencialmente invariante .
Sea T : X → X una transformación que preserva la medida en un espacio de medida ( X , Σ, μ ) y supongamos que ƒ es una función μ -integrable, es decir ƒ ∈ L 1 ( μ ). Entonces definimos los siguientes promedios :
Promedio de tiempo: Se define como el promedio (si existe) a lo largo de iteraciones de T a partir de un punto inicial x :
Promedio espacial: Si μ ( X ) es finito y distinto de cero, podemos considerar el promedio espacial o de fase de ƒ:
En general, el promedio temporal y el promedio espacial pueden ser diferentes. Pero si la transformación es ergódica y la medida es invariante, entonces el promedio temporal es igual al promedio espacial en casi todas partes . Este es el célebre teorema ergódico, en forma abstracta debido a George David Birkhoff . (En realidad, el artículo de Birkhoff no considera el caso general abstracto sino solo el caso de sistemas dinámicos que surgen de ecuaciones diferenciales en una variedad suave). El teorema de equidistribución es un caso especial del teorema ergódico, que trata específicamente de la distribución de probabilidades en el intervalo unitario.
Más precisamente, el teorema ergódico puntual o fuerte establece que el límite en la definición del promedio temporal de ƒ existe para casi cada x y que la función límite (definida casi en todas partes) es integrable:
Además, es T -invariante, es decir
se cumple casi en todas partes, y si μ ( X ) es finito, entonces la normalización es la misma:
En particular, si T es ergódico, entonces debe ser una constante (casi en todas partes), y entonces se tiene que
casi en todas partes. Uniendo la primera a la última afirmación y suponiendo que μ ( X ) es finito y distinto de cero, se tiene que
para casi todos los x , es decir, para todos los x excepto para un conjunto de medida cero.
Para una transformación ergódica, el promedio del tiempo es casi con seguridad igual al promedio del espacio.
Como ejemplo, supongamos que el espacio de medida ( X , Σ, μ ) modela las partículas de un gas como se indicó anteriormente, y sea ƒ( x ) la velocidad de la partícula en la posición x . Entonces, los teoremas ergódicos puntuales dicen que la velocidad promedio de todas las partículas en un momento dado es igual a la velocidad promedio de una partícula a lo largo del tiempo.
Una generalización del teorema de Birkhoff es el teorema ergódico subaditivo de Kingman .
Teorema de Birkhoff-Khinchin . Sea ƒ medible, E (|ƒ|) < ∞ y T una función que preserva la medida. Entonces, con probabilidad 1 :
donde es la expectativa condicional dada la σ-álgebra de conjuntos invariantes de T .
Corolario ( Teorema Ergódico Puntual ): En particular, si T también es ergódico, entonces es la σ-álgebra trivial, y por lo tanto con probabilidad 1:
El teorema ergódico medio de von Neumann se cumple en los espacios de Hilbert. [1]
Sea U un operador unitario en un espacio de Hilbert H ; más generalmente, un operador lineal isométrico (es decir, un operador lineal no necesariamente sobreyectivo que satisface ‖ Ux ‖ = ‖ x ‖ para todo x en H , o equivalentemente, que satisface U * U = I, pero no necesariamente UU * = I). Sea P la proyección ortogonal sobre { ψ ∈ H | Uψ = ψ} = ker( I − U ).
Entonces, para cualquier x en H , tenemos:
donde el límite es con respecto a la norma en H . En otras palabras, la secuencia de promedios
converge a P en la topología del operador fuerte .
De hecho, no es difícil ver que en este caso cualquier admite una descomposición ortogonal en partes a partir de y respectivamente. La primera parte es invariante en todas las sumas parciales a medida que crece, mientras que para la segunda parte, a partir de la serie telescópica se tendría:
Este teorema se especializa en el caso en el que el espacio de Hilbert H consta de L 2 funciones en un espacio de medida y U es un operador de la forma
donde T es un endomorfismo que preserva la medida de X , considerado en aplicaciones como la representación de un paso de tiempo de un sistema dinámico discreto. [2] El teorema ergódico afirma entonces que el comportamiento promedio de una función ƒ en escalas de tiempo suficientemente grandes se aproxima por el componente ortogonal de ƒ que es invariante en el tiempo.
En otra forma del teorema ergódico medio, sea U t un grupo de operadores unitarios de un parámetro fuertemente continuo en H . Entonces el operador
converge en la topología de operadores fuertes cuando T → ∞. De hecho, este resultado también se extiende al caso de semigrupos monoparamétricos fuertemente continuos de operadores contractivos en un espacio reflexivo.
Observación: Se puede desarrollar cierta intuición para el teorema ergódico medio considerando el caso en el que los números complejos de longitud unitaria se consideran transformaciones unitarias en el plano complejo (por multiplicación izquierda). Si escogemos un único número complejo de longitud unitaria (al que consideramos como U ), es intuitivo que sus potencias llenarán el círculo. Dado que el círculo es simétrico alrededor de 0, tiene sentido que los promedios de las potencias de U converjan a 0. Además, 0 es el único punto fijo de U , y por lo tanto la proyección sobre el espacio de puntos fijos debe ser el operador cero (lo que concuerda con el límite que acabamos de describir).
Sea ( X , Σ, μ ) como se indicó anteriormente un espacio de probabilidad con una transformación que preserva la medida T , y sea 1 ≤ p ≤ ∞. La esperanza condicional con respecto a la sub-σ-álgebra Σ T de los conjuntos T -invariantes es un proyector lineal E T de norma 1 del espacio de Banach L p ( X , Σ, μ ) sobre su subespacio cerrado L p ( X , Σ T , μ ). Este último también puede caracterizarse como el espacio de todas las L p -funciones T -invariantes en X . Las medias ergódicas, como operadores lineales en L p ( X , Σ, μ ) también tienen norma de operador unitario; y, como una simple consecuencia del teorema de Birkhoff–Khinchin, convergen al proyector E T en la topología de operador fuerte de L p si 1 ≤ p ≤ ∞, y en la topología de operador débil si p = ∞. Más es cierto si 1 < p ≤ ∞ entonces el teorema de convergencia dominada ergódica de Wiener–Yoshida–Kakutani establece que las medias ergódicas de ƒ ∈ L p están dominadas en L p ; sin embargo, si ƒ ∈ L 1 , las medias ergódicas pueden no ser equidominadas en L p . Finalmente, si se supone que ƒ está en la clase Zygmund, es decir |ƒ| log + (|ƒ|) es integrable, entonces las medias ergódicas están incluso dominadas en L 1 .
Sea ( X , Σ, μ ) un espacio de medida tal que μ ( X ) es finito y distinto de cero. El tiempo transcurrido en un conjunto medible A se denomina tiempo de estancia . Una consecuencia inmediata del teorema ergódico es que, en un sistema ergódico, la medida relativa de A es igual al tiempo de estancia medio :
para todo x excepto para un conjunto de medida cero, donde χ A es la función indicadora de A .
Los tiempos de ocurrencia de un conjunto medible A se definen como el conjunto k 1 , k 2 , k 3 , ..., de tiempos k tales que T k ( x ) está en A , ordenados en orden creciente. Las diferencias entre tiempos de ocurrencia consecutivos R i = k i − k i −1 se denominan tiempos de recurrencia de A . Otra consecuencia del teorema ergódico es que el tiempo de recurrencia promedio de A es inversamente proporcional a la medida de A , suponiendo [ aclaración necesaria ] que el punto inicial x está en A , de modo que k 0 = 0.
(Ver casi con seguridad .) Es decir, cuanto más pequeño es A , más tiempo se tarda en volver a él.
La ergodicidad del flujo geodésico en superficies compactas de Riemann de curvatura negativa variable y en variedades compactas de curvatura negativa constante de cualquier dimensión fue demostrada por Eberhard Hopf en 1939, aunque casos especiales habían sido estudiados anteriormente: véase por ejemplo, el billar de Hadamard (1898) y el billar de Artin (1924). La relación entre flujos geodésicos en superficies de Riemann y subgrupos de un parámetro en SL(2, R ) fue descrita en 1952 por SV Fomin e IM Gelfand . El artículo sobre flujos de Anosov proporciona un ejemplo de flujos ergódicos en SL(2, R ) y en superficies de Riemann de curvatura negativa. Gran parte del desarrollo descrito allí se generaliza a variedades hiperbólicas, ya que pueden verse como cocientes del espacio hiperbólico por la acción de una red en el grupo de Lie semisimple SO(n,1) . La ergodicidad del flujo geodésico en espacios simétricos de Riemann fue demostrada por FI Mautner en 1957. En 1967, DV Anosov y Ya. G. Sinai demostraron la ergodicidad del flujo geodésico en variedades compactas de curvatura seccional negativa variable . Un criterio simple para la ergodicidad de un flujo homogéneo en un espacio homogéneo de un grupo de Lie semisimple fue dado por Calvin C. Moore en 1966. Muchos de los teoremas y resultados de esta área de estudio son típicos de la teoría de la rigidez .
En la década de 1930, GA Hedlund demostró que el flujo del horociclo en una superficie hiperbólica compacta es mínimo y ergódico. La ergodicidad única del flujo fue establecida por Hillel Furstenberg en 1972. Los teoremas de Ratner proporcionan una generalización importante de la ergodicidad para flujos unipotentes en los espacios homogéneos de la forma Γ \ G , donde G es un grupo de Lie y Γ es una red en G .
En los últimos 20 años, se han realizado muchos trabajos que han intentado encontrar un teorema de clasificación de medidas similar a los teoremas de Ratner pero para acciones diagonalizables, motivados por las conjeturas de Furstenberg y Margulis . Un resultado parcial importante (resolviendo esas conjeturas con un supuesto extra de entropía positiva) fue demostrado por Elon Lindenstrauss , y recibió la medalla Fields en 2010 por este resultado.