En matemáticas , el teorema de Radon-Nikodym es un resultado de la teoría de la medida que expresa la relación entre dos medidas definidas en el mismo espacio medible . Una medida es una función de conjunto que asigna una magnitud consistente a los subconjuntos mensurables de un espacio medible. Algunos ejemplos de una medida incluyen el área y el volumen, donde los subconjuntos son conjuntos de puntos; o la probabilidad de un evento, que es un subconjunto de resultados posibles dentro de un espacio de probabilidad más amplio .
Una forma de derivar una nueva medida a partir de una ya dada es asignar una densidad a cada punto del espacio y luego integrar sobre el subconjunto medible de interés. Esto se puede expresar como
donde ν es la nueva medida que se define para cualquier subconjunto medible A y la función f es la densidad en un punto dado. La integral es con respecto a una medida existente μ , que a menudo puede ser la medida de Lebesgue canónica en la línea real R o el espacio euclidiano n -dimensional R n (que corresponde a nuestras nociones estándar de longitud, área y volumen). Por ejemplo, si f representara la densidad de masa y μ fuera la medida de Lebesgue en el espacio tridimensional R 3 , entonces ν ( A ) sería igual a la masa total en una región espacial A .
El teorema de Radon-Nikodym establece básicamente que, en determinadas condiciones, cualquier medida ν puede expresarse de esta manera con respecto a otra medida μ en el mismo espacio. La función f se denomina entonces derivada de Radon-Nikodym y se denota por . [1] Una aplicación importante es en la teoría de la probabilidad , que conduce a la función de densidad de probabilidad de una variable aleatoria .
El teorema recibe su nombre de Johann Radon , quien demostró el teorema para el caso especial donde el espacio subyacente es R n en 1913, y de Otto Nikodym , quien demostró el caso general en 1930. [2] En 1936, Hans Freudenthal generalizó el teorema de Radon-Nikodym al demostrar el teorema espectral de Freudenthal , un resultado en la teoría del espacio de Riesz ; esto contiene el teorema de Radon-Nikodym como un caso especial. [3]
Se dice que un espacio de Banach Y tiene la propiedad de Radon-Nikodym si la generalización del teorema de Radon-Nikodym también se cumple, mutatis mutandis , para funciones con valores en Y . Todos los espacios de Hilbert tienen la propiedad de Radon-Nikodym.
El teorema de Radon-Nikodym implica un espacio medible en el que se definen dos medidas σ-finitas , y establece que, si (es decir, si es absolutamente continua con respecto a ), entonces existe una función medible tal que para cualquier conjunto medible
La función que satisface la igualdad anterior está definida de forma única hasta un conjunto nulo , es decir, si es otra función que satisface la misma propiedad, entonces casi en todas partes . La función se escribe comúnmente y se denomina Derivada de Radon-Nikodym . La elección de la notación y el nombre de la función reflejan el hecho de que la función es análoga a unaderivadaencálculoen el sentido de que describe la tasa de cambio de la densidad de una medida con respecto a otra (la forma en quese utilizadeterminante jacobiano
Se puede demostrar un teorema similar para medidas con signo y complejas : a saber, que si es una medida σ-finita no negativa, y es una medida con signo o compleja de valor finito tal que es decir, es absolutamente continua con respecto a entonces existe una función -integrable real- o de valor complejo en tal que para cada conjunto medible
En los siguientes ejemplos, el conjunto X es el intervalo real [0,1], y es el sigma-álgebra de Borel en X.
El teorema es muy importante para extender las ideas de la teoría de la probabilidad desde las masas de probabilidad y las densidades de probabilidad definidas sobre números reales a las medidas de probabilidad definidas sobre conjuntos arbitrarios. Indica si es posible cambiar de una medida de probabilidad a otra y cómo hacerlo. En concreto, la función de densidad de probabilidad de una variable aleatoria es la derivada de Radon-Nikodym de la medida inducida con respecto a alguna medida base (normalmente la medida de Lebesgue para variables aleatorias continuas ).
Por ejemplo, se puede utilizar para demostrar la existencia de una expectativa condicional para las medidas de probabilidad. Esta última es en sí misma un concepto clave en la teoría de la probabilidad , ya que la probabilidad condicional es solo un caso especial de ella.
Entre otros campos, las matemáticas financieras utilizan ampliamente este teorema, en particular a través del teorema de Girsanov . Estos cambios en la medida de probabilidad son la piedra angular de la fijación racional de precios de los derivados y se utilizan para convertir las probabilidades reales en probabilidades neutrales al riesgo .
Si μ y ν son medidas sobre X , y μ ≪ ν
El teorema de Radon-Nikodym anterior supone que la medida μ con respecto a la cual se calcula la tasa de cambio de ν es σ-finita .
He aquí un ejemplo en el que μ no es σ-finito y el teorema de Radon-Nikodym no se cumple.
Consideremos la σ-álgebra de Borel en la recta real . Sea la medida de conteo , μ , de un conjunto de Borel A definida como el número de elementos de A si A es finito, e ∞ en caso contrario. Se puede comprobar que μ es de hecho una medida. No es σ -finito, ya que no todo conjunto de Borel es como máximo una unión contable de conjuntos finitos. Sea ν la medida de Lebesgue habitual en esta álgebra de Borel. Entonces, ν es absolutamente continua con respecto a μ , ya que para un conjunto A se tiene μ ( A ) = 0 solo si A es el conjunto vacío , y entonces ν ( A ) también es cero.
Supongamos que se cumple el teorema de Radon-Nikodym, es decir, para alguna función medible f se tiene
para todos los conjuntos de Borel. Si tomamos A como un conjunto singleton , A = { a } y utilizamos la igualdad anterior, se obtiene
para todos los números reales a . Esto implica que la función f , y por lo tanto la medida de Lebesgue ν , es cero, lo cual es una contradicción.
Suponiendo que el teorema de Radon–Nikodym también se cumple si es localizable y es accesible con respecto a , [5] : p. 189, Ejercicio 9O es decir, para todo [6] : Teorema 1.111 (Radon–Nikodym, II) [5] : p. 190, Ejercicio 9T(ii)
En esta sección se presenta una demostración teórica del teorema. También se incluye una demostración analítico-funcional, que utiliza métodos del espacio de Hilbert, que fue presentada por primera vez por von Neumann .
Para medidas finitas μ y ν , la idea es considerar funciones f con f dμ ≤ dν . El supremo de todas esas funciones, junto con el teorema de convergencia monótona , proporciona entonces la derivada de Radon-Nikodym. El hecho de que la parte restante de μ sea singular con respecto a ν se desprende de un hecho técnico sobre medidas finitas. Una vez que se establece el resultado para medidas finitas, se puede extender de forma natural a medidas σ -finitas, con signo y complejas. Los detalles se dan a continuación.
Construcción de un candidato de valor extendido En primer lugar, supongamos que μ y ν son medidas no negativas de valor finito. Sea F el conjunto de esas funciones medibles de valor extendido f : X → [0, ∞] tales que:
F ≠ ∅ , ya que contiene al menos la función cero. Ahora, sean f 1 , f 2 ∈ F , y supongamos que A es un conjunto medible arbitrario, y definamos:
Entonces uno tiene
y por lo tanto, max{ f 1 , f 2 } ∈ F .
Ahora, sea { f n } una secuencia de funciones en F tales que
Reemplazando f n por el máximo de las primeras n funciones, se puede suponer que la sucesión { f n } es creciente. Sea g una función extendida definida como
Por el teorema de convergencia monótona de Lebesgue , se tiene
para cada A ∈ Σ , y por lo tanto, g ∈ F . Además, por la construcción de g ,
Demostración de igualdad Ahora, como g ∈ F ,
define una medida no negativa en Σ . Para demostrar la igualdad, mostramos que ν 0 = 0 .
Supóngase que ν 0 ≠ 0 ; entonces, como μ es finito, hay un ε > 0 tal que ν 0 ( X ) > ε μ ( X ) . Para derivar una contradicción de ν 0 ≠ 0 , buscamos un conjunto positivo P ∈ Σ para la medida con signo ν 0 − ε μ (es decir, un conjunto medible P , todos cuyos subconjuntos mesurables tienen una medida ν 0 − εμ no negativa ), donde también P tiene una medida μ positiva . Conceptualmente, estamos buscando un conjunto P , donde ν 0 ≥ ε μ en cada parte de P . Un enfoque conveniente es utilizar la descomposición de Hahn ( P , N ) para la medida con signo ν 0 − ε μ .
Nótese entonces que para cada A ∈ Σ se tiene ν 0 ( A ∩ P ) ≥ ε μ ( A ∩ P ) , y por lo tanto,
donde 1 P es la función indicadora de P . Además, observe que μ ( P ) > 0 como se desea; porque si μ ( P ) = 0 , entonces (ya que ν es absolutamente continua en relación con μ ) ν 0 ( P ) ≤ ν ( P ) = 0 , por lo que ν 0 ( P ) = 0 y
contradiciendo el hecho de que ν 0 ( X ) > εμ ( X ) .
Entonces, ya que también
g + ε 1 P ∈ F y satisface
Esto es imposible porque viola la definición de supremo ; por lo tanto, la suposición inicial de que ν 0 ≠ 0 debe ser falsa. Por lo tanto, ν 0 = 0 , como se deseaba.
Restringiendo a valores finitos Ahora, como g es μ -integrable, el conjunto { x ∈ X : g ( x ) = ∞} es μ - nulo . Por lo tanto, si una f se define como
entonces f tiene las propiedades deseadas.
Unicidad En cuanto a la unicidad, sean f , g : X → [0, ∞) funciones mensurables que satisfacen
para cada conjunto medible A . Entonces, g − f es μ -integrable, y
En particular, para A = { x ∈ X : f ( x ) > g ( x )}, o { x ∈ X : f ( x ) < g ( x )} . Se deduce que
y entonces, que ( g − f ) + = 0 μ -casi en todas partes; lo mismo es cierto para ( g − f ) − , y por lo tanto, f = g μ -casi en todas partes, como se deseaba.
Si μ y ν son σ -finitos, entonces X puede escribirse como la unión de una secuencia { B n } n de conjuntos disjuntos en Σ , cada uno de los cuales tiene medida finita tanto en μ como en ν . Para cada n , por el caso finito, existe una función Σ -medible f n : B n → [0, ∞) tal que
para cada subconjunto Σ -medible A de B n . La suma de esas funciones es entonces la función requerida tal que .
En cuanto a la unicidad, dado que cada una de las f n es μ -casi en todas partes única-, también lo es f .
Si ν es una medida con signo σ -finita, entonces puede descomponerse mediante Hahn-Jordan como ν = ν + − ν − donde una de las medidas es finita. Aplicando el resultado anterior a esas dos medidas, se obtienen dos funciones, g , h : X → [0, ∞) , que satisfacen el teorema de Radon-Nikodym para ν + y ν − respectivamente, al menos una de las cuales es μ -integrable (es decir, su integral con respecto a μ es finita). Está claro entonces que f = g − h satisface las propiedades requeridas, incluida la unicidad, ya que tanto g como h son únicas hasta μ -igualdad casi en todas partes.
Si ν es una medida compleja , se puede descomponer como ν = ν 1 + iν 2 , donde tanto ν 1 como ν 2 son medidas con signo de valor finito. Aplicando el argumento anterior, se obtienen dos funciones, g , h : X → [0, ∞) , que satisfacen las propiedades requeridas para ν 1 y ν 2 , respectivamente. Claramente, f = g + ih es la función requerida.
El teorema de descomposición de Lebesgue muestra que los supuestos del teorema de Radon-Nikodym pueden encontrarse incluso en una situación que es aparentemente más general. Considérese una medida positiva σ-finita en el espacio de medida y una medida con signo σ-finita en , sin suponer ninguna continuidad absoluta. Entonces existen medidas con signo únicas y en tales que , , y . El teorema de Radon-Nikodym puede entonces aplicarse al par .
Este artículo incorpora material del teorema de Radon-Nikodym en PlanetMath , que se encuentra bajo la licencia Creative Commons Attribution/Share-Alike License .