stringtranslate.com

Simetría de las segundas derivadas

En matemáticas , la simetría de las derivadas segundas (también llamada igualdad de las parciales mixtas ) es el hecho de intercambiar el orden de las derivadas parciales de una función multivariada.

no cambia el resultado si se satisfacen algunas condiciones de continuidad (ver más abajo); es decir, las derivadas parciales de segundo orden satisfacen las identidades

En otras palabras, la matriz de las derivadas parciales de segundo orden, conocida como matriz hessiana , es una matriz simétrica .

Las condiciones suficientes para que se cumpla la simetría están dadas por el teorema de Schwarz , también llamado teorema de Clairaut o teorema de Young . [1] [2]

En el contexto de las ecuaciones diferenciales parciales , se denomina condición de integrabilidad de Schwarz .

Expresiones formales de simetría

En símbolos, la simetría puede expresarse como:

Otra notación es:

En términos de la composición del operador diferencial D i que toma la derivada parcial con respecto a x i :

.

De esta relación se sigue que el anillo de operadores diferenciales con coeficientes constantes , generado por D i , es conmutativo ; pero esto sólo es cierto como operadores sobre un dominio de funciones suficientemente diferenciables. Es fácil comprobar la simetría tal como se aplica a los monomios , de modo que se pueden tomar polinomios en x i como dominio. De hecho, las funciones suaves son otro dominio válido.

Historia

El resultado sobre la igualdad de derivadas parciales mixtas bajo ciertas condiciones tiene una larga historia. La lista de pruebas propuestas sin éxito comenzó con la de Euler , publicada en 1740, [3] aunque ya en 1721 Bernoulli había asumido implícitamente el resultado sin justificación formal. [4] Clairaut también publicó una prueba propuesta en 1740, sin otros intentos hasta finales del siglo XVIII. A partir de entonces, durante un período de 70 años, se propusieron varias pruebas incompletas. La prueba de Lagrange (1797) fue mejorada por Cauchy (1823), pero asumió la existencia y continuidad de las derivadas parciales y . [5] Otros intentos fueron realizados por P. Blanchet (1841), Duhamel (1856), Sturm (1857), Schlömilch (1862) y Bertrand (1864). Finalmente, en 1867, Lindelöf analizó sistemáticamente todas las pruebas erróneas anteriores y pudo demostrar un contraejemplo específico en el que las derivadas mixtas no eran iguales. [6] [7]

Seis años después, Schwarz logró dar la primera prueba rigurosa. [8] Más tarde, Dini contribuyó al encontrar condiciones más generales que las de Schwarz. Finalmente, Jordan encontró una versión limpia y más general en 1883 que todavía es la prueba que se encuentra en la mayoría de los libros de texto. Laurent (1885), Peano (1889 y 1893), J. Edwards (1892), P. Haag (1893), JK Whittemore (1898), Vivanti (1899) y Pierpont (1905) publicaron variantes menores de pruebas anteriores. Se lograron más avances en 1907-1909 cuando EW Hobson y WH Young encontraron pruebas con condiciones más débiles que las de Schwarz y Dini. En 1918, Carathéodory dio una prueba diferente basada en la integral de Lebesgue . [7]

Teorema de Schwarz

En análisis matemático , el teorema de Schwarz (o teorema de Clairaut sobre igualdad de parciales mixtos ) [9] llamado así por Alexis Clairaut y Hermann Schwarz , establece que para una función definida en un conjunto , si es un punto tal que algún entorno de está contenido en y tiene derivadas parciales segundas continuas en ese entorno de , entonces para todos los i y j en

Las derivadas parciales de esta función conmutan en ese punto.

Una forma fácil de establecer este teorema (en el caso donde , , y , lo que implica fácilmente el resultado en general) es aplicar el teorema de Green al gradiente de

Una prueba elemental para funciones en subconjuntos abiertos del plano es la siguiente (por una reducción simple, el caso general del teorema de Schwarz se reduce fácilmente al caso planar). [10] Sea una función diferenciable en un rectángulo abierto que contiene un punto y supóngase que es continua con continua y sobre Definir

Estas funciones están definidas para , donde y está contenido en

Por el teorema del valor medio , para h fijos y k distintos de cero, se puede encontrar en el intervalo abierto con

Dado que , la primera igualdad a continuación se puede dividir por :

Dejando que tiende a cero en la última igualdad, los supuestos de continuidad en y ahora implican que

Este relato es un método clásico sencillo que se encuentra en muchos libros de texto, por ejemplo en Burkill, Apostol y Rudin. [10] [11] [12]

Aunque la derivación anterior es elemental, el enfoque también puede verse desde una perspectiva más conceptual para que el resultado se vuelva más evidente. [13] [14] [15] [16] [17] De hecho, los operadores de diferencia conmutan y tienden a cuando tiende a 0, con una declaración similar para los operadores de segundo orden. [a] Aquí, para un vector en el plano y un vector direccional o , el operador de diferencia se define por

Por el teorema fundamental del cálculo para funciones en un intervalo abierto con

Por eso

.

Esta es una versión generalizada del teorema del valor medio . Recordemos que la discusión elemental sobre máximos o mínimos para funciones de valor real implica que si es continua en y diferenciable en , entonces hay un punto en tal que

Para funciones vectoriales con un espacio normado de dimensión finita, no existe un análogo de la igualdad anterior; de hecho, falla. Pero como , la desigualdad anterior es un sustituto útil. Además, utilizando el emparejamiento del dual de con su norma dual, se obtiene la siguiente desigualdad:

.

Estas versiones del teorema del valor medio se analizan en Rudin, Hörmander y en otros lugares. [19] [20]

Para una función en un conjunto abierto en el plano, defina y . Además, para el conjunto

.

Entonces, en el conjunto abierto, el teorema del valor medio generalizado se puede aplicar dos veces:

Por lo tanto, tiende a como tiende a 0. El mismo argumento muestra que tiende a . Por lo tanto, dado que los operadores diferenciales conmutan, también lo hacen los operadores diferenciales parciales y , como se afirma. [21] [22] [23] [24] [25]

Observación. Mediante dos aplicaciones del teorema clásico del valor medio,

para algunos y en . Por lo tanto, la primera prueba elemental puede reinterpretarse utilizando operadores de diferencia. Por el contrario, en lugar de utilizar el teorema del valor medio generalizado en la segunda prueba, se podría utilizar el teorema del valor medio clásico.

Demostración del teorema de Clairaut mediante integrales iteradas

Las propiedades de las integrales de Riemann repetidas de una función continua F en un rectángulo compacto [ a , b ] × [ c , d ] se establecen fácilmente. [26] La continuidad uniforme de F implica inmediatamente que las funciones y son continuas. [27] De ello se deduce que

;

Además, es inmediato que la integral iterada es positiva si F es positiva. [28] La igualdad anterior es un caso simple del teorema de Fubini , que no involucra ninguna teoría de la medida . Titchmarsh (1939) lo demuestra de manera directa utilizando sumas aproximadas de Riemann correspondientes a subdivisiones de un rectángulo en rectángulos más pequeños.

Para demostrar el teorema de Clairaut, supongamos que f es una función diferenciable en un conjunto abierto U , para el cual las derivadas parciales mixtas secundarias f yx y f xy existen y son continuas. Utilizando el teorema fundamental del cálculo dos veces,

Similarmente

Las dos integrales iteradas son, por tanto, iguales. Por otra parte, dado que f xy ( x , y ) es continua, la segunda integral iterada se puede realizar integrando primero sobre x y después sobre y . Pero entonces la integral iterada de f yxf xy en [ a , b ] × [ c , d ] debe anularse. Sin embargo, si la integral iterada de una función continua F se anula para todos los rectángulos, entonces F debe ser idénticamente cero; de lo contrario F o F serían estrictamente positivas en algún punto y, por tanto, por continuidad en un rectángulo, lo que no es posible. Por tanto, f yxf xy debe anularse idénticamente, de modo que f yx = f xy en todas partes. [29] [30] [31] [32] [33]

Suficiencia de la doble diferenciabilidad

Una condición más débil que la continuidad de las derivadas parciales segundas (que está implícita en esta última) que es suficiente para asegurar la simetría es que todas las derivadas parciales sean ellas mismas diferenciables . [34] Otro fortalecimiento del teorema, en el que se afirma la existencia de la parcial mixta permutada, fue proporcionado por Peano en una breve nota de 1890 en Mathesis :

Si se define en un conjunto abierto ; y existe en todas partes en ; es continua en , y si existe en un entorno de , entonces existe en y . [35]

Formulación de la teoría de la distribución

La teoría de distribuciones (funciones generalizadas) elimina los problemas analíticos con la simetría. La derivada de una función integrable siempre se puede definir como una distribución, y la simetría de las derivadas parciales mixtas siempre se cumple como una igualdad de distribuciones. El uso de la integración formal por partes para definir la diferenciación de distribuciones devuelve la cuestión de la simetría a las funciones de prueba , que son suaves y ciertamente satisfacen esta simetría. En más detalle (donde f es una distribución, escrita como un operador en funciones de prueba, y φ es una función de prueba),

Otro enfoque, que define la transformada de Fourier de una función, es observar que en dichas transformadas las derivadas parciales se convierten en operadores de multiplicación que conmutan de forma mucho más obvia. [a]

Requisito de continuidad

La simetría puede romperse si la función no tiene derivadas parciales diferenciables, lo que es posible si no se satisface el teorema de Clairaut (las segundas derivadas parciales no son continuas ).

La función f ( x ,  y ), como se muestra en la ecuación ( 1 ), no tiene segundas derivadas simétricas en su origen.

Un ejemplo de no simetría es la función (debida a Peano ) [36] [37]

Esto se puede visualizar mediante la forma polar ; es continua en todas partes, pero sus derivadas en (0, 0) no se pueden calcular algebraicamente. En cambio, el límite de cocientes de diferencias muestra que , por lo que el gráfico tiene un plano tangente horizontal en (0, 0) , y las derivadas parciales existen y son continuas en todas partes. Sin embargo, las segundas derivadas parciales no son continuas en (0, 0) , y la simetría falla. De hecho, a lo largo del eje x la derivada y es , y por lo tanto:

Por el contrario, a lo largo del eje y la derivada de x , y por lo tanto . Es decir, en (0, 0) , aunque las derivadas parciales mixtas existen, y en cualquier otro punto la simetría se mantiene.

La función anterior, escrita en coordenadas polares, se puede expresar como

Demostrando que la función oscila cuatro veces cuando recorre una vuelta alrededor de un bucle arbitrariamente pequeño que contiene el origen. Intuitivamente, por lo tanto, el comportamiento local de la función en (0, 0) no puede describirse como una forma cuadrática y, por lo tanto, la matriz hessiana no es simétrica.

En general, el intercambio de operaciones limitantes no necesita conmutar . Dadas dos variables cercanas a (0, 0) y dos procesos limitantes en

correspondiente a hacer h → 0 primero, y a hacer k → 0 primero. Puede importar, mirando los términos de primer orden, cuál se aplica primero. Esto lleva a la construcción de ejemplos patológicos en los que las derivadas segundas no son simétricas. Este tipo de ejemplo pertenece a la teoría del análisis real donde el valor puntual de las funciones importa. Cuando se ve como una distribución, los valores de la segunda derivada parcial se pueden cambiar en un conjunto arbitrario de puntos siempre que este tenga una medida de Lebesgue 0. Dado que en el ejemplo la hessiana es simétrica en todas partes excepto (0, 0) , no hay contradicción con el hecho de que la hessiana, vista como una distribución de Schwartz , sea simétrica.

En la teoría de Lie

Consideremos que los operadores diferenciales de primer orden D i son operadores infinitesimales en el espacio euclidiano . Es decir, D i en cierto sentido genera el grupo de un parámetro de traslaciones paralelas al eje x i . Estos grupos conmutan entre sí y, por lo tanto, los generadores infinitesimales también lo hacen; el corchete de Lie

[ D i , D j ] = 0

es el reflejo de esta propiedad. En otras palabras, la derivada de Lie de una coordenada con respecto a otra es cero.

Aplicación a formas diferenciales

El teorema de Clairaut-Schwarz es el hecho clave necesario para demostrar que para cada forma diferencial (o al menos dos veces diferenciable) , la segunda derivada exterior se anula: . Esto implica que toda forma exacta diferenciable (es decir, una forma tal que para alguna forma ) es cerrada (es decir, ), ya que . [38]

A mediados del siglo XVIII, la teoría de las formas diferenciales se estudió por primera vez en el caso más simple de las 1-formas en el plano, es decir , donde y son funciones en el plano. El estudio de las 1-formas y las diferenciales de funciones comenzó con los artículos de Clairaut en 1739 y 1740. En esa etapa, sus investigaciones se interpretaron como formas de resolver ecuaciones diferenciales ordinarias . Formalmente, Clairaut demostró que una 1-forma en un rectángulo abierto es cerrada, es decir , si y solo tiene la forma para alguna función en el disco. La solución para se puede escribir mediante la fórmula integral de Cauchy.

mientras que si , la propiedad cerrada es la identidad . (En lenguaje moderno esta es una versión del lema de Poincaré .) [39]

Notas

  1. ^ ab Estos también pueden reformularse en términos de la acción de los operadores sobre las funciones de Schwartz en el plano. Bajo la transformada de Fourier , los operadores de diferencia y diferenciales son simplemente operadores de multiplicación. [18]
  1. ^ "Teorema de Young" (PDF) . Universidad de California, Berkeley. Archivado desde el original (PDF) el 18 de mayo de 2006. Consultado el 2 de enero de 2015 .
  2. ^ Allen 1964, págs. 300–305.
  3. ^ Euler 1740.
  4. ^ Sandifer 2007, págs. 142-147, nota al pie: Comm. Acad. Sci. Imp. Petropol. 7 (1734/1735) 1740 , 174-189, 180-183; Opera Omnia , 1.22, 34-56.
  5. ^ Minguzzi 2015.
  6. ^ Lindelöf 1867.
  7. ^Por Higgins 1940.
  8. ^ Schwarz 1873.
  9. ^ James 1966, p.  [ página necesaria ] .
  10. ^ de Burkill 1962, págs. 154-155
  11. ^ Apóstol 1965.
  12. ^ Rudin 1976.
  13. ^ Hörmander 2015, págs. 7, 11. Este relato condensado es posiblemente el más breve.
  14. ^ Dieudonné 1960, págs. 179-180.
  15. ^ Godement 1998b, págs. 287-289.
  16. ^ Lang 1969, págs. 108-111.
  17. ^ Cartan 1971, págs. 64–67.
  18. ^ Hörmander 2015, Capítulo VII.
  19. ^ Hörmander 2015, pág. 6.
  20. ^ Rudin 1976, p.  [ página necesaria ] .
  21. ^ Hörmander 2015, pág. 11.
  22. ^ Dieudonné 1960.
  23. ^ Godement 1998a.
  24. ^ Lang 1969.
  25. ^ Cartan 1971.
  26. ^ Titchmarsh 1939, pág.  [ página necesaria ] .
  27. ^ Titchmarsh 1939, págs. 23-25.
  28. ^ Titchmarsh 1939, págs. 49-50.
  29. ^ Spivak 1965, pág. 61.
  30. ^ McGrath 2014.
  31. ^ Aksoy y Martelli 2002.
  32. ^ Axler 2020, págs. 142-143.
  33. ^ Marshall, Donald E., Teoremas de Fubini y Clairaut (PDF) , Universidad de Washington
  34. ^ Hubbard y Hubbard 2015, págs. 732–733.
  35. ^ Rudin 1976, págs. 235-236.
  36. ^ Hobson 1921, págs. 403–404.
  37. ^ Apóstol 1974, págs. 358–359.
  38. ^ Mar 2010.
  39. ^ Katz 1981.

Referencias

Lectura adicional