En los campos matemáticos de las ecuaciones diferenciales y el análisis geométrico , el principio del máximo es una de las herramientas de estudio más útiles y conocidas. Las soluciones de una desigualdad diferencial en un dominio D satisfacen el principio del máximo si alcanzan sus máximos en el límite de D.
El principio del máximo permite obtener información sobre las soluciones de ecuaciones diferenciales sin necesidad de tener un conocimiento explícito de las soluciones mismas. En particular, el principio del máximo es una herramienta útil en la aproximación numérica de soluciones de ecuaciones diferenciales ordinarias y parciales y en la determinación de límites para los errores en dichas aproximaciones. [1]
En un caso bidimensional simple, considere una función de dos variables u ( x , y ) tales que
El principio de máximo débil , en este contexto, dice que para cualquier subconjunto precompacto abierto M del dominio de u , el máximo de u en el cierre de M se logra en el límite de M. El principio de máximo fuerte dice que, a menos que u sea una función constante, el máximo no puede lograrse en ningún lugar del propio M.
Tales afirmaciones dan una imagen cualitativa sorprendente de las soluciones de la ecuación diferencial dada. Tal imagen cualitativa puede extenderse a muchos tipos de ecuaciones diferenciales. En muchas situaciones, también se pueden utilizar estos principios de máximo para extraer conclusiones cuantitativas precisas sobre las soluciones de ecuaciones diferenciales, como el control sobre el tamaño de su gradiente . No existe un principio de máximo único o más general que se aplique a todas las situaciones a la vez.
En el campo de la optimización convexa , existe una afirmación análoga que afirma que el máximo de una función convexa en un conjunto convexo compacto se alcanza en el límite . [2]
Aquí consideramos el caso más simple, aunque el mismo razonamiento puede extenderse a escenarios más generales. Sea M un subconjunto abierto del espacio euclidiano y sea u una función C 2 en M tal que
donde para cada i y j entre 1 y n , a ij es una función en M con a ij = a ji .
Fijemos alguna elección de x en M . De acuerdo con el teorema espectral del álgebra lineal, todos los valores propios de la matriz [ a ij ( x )] son reales, y existe una base ortonormal de ℝ n que consiste en vectores propios. Denotemos los valores propios por λ i y los vectores propios correspondientes por v i , para i de 1 a n . Entonces la ecuación diferencial, en el punto x , puede reformularse como
La esencia del principio del máximo es la simple observación de que si cada valor propio es positivo (lo que equivale a una cierta formulación de "elipticidad" de la ecuación diferencial), entonces la ecuación anterior impone un cierto equilibrio de las derivadas secundarias direccionales de la solución. En particular, si una de las derivadas secundarias direccionales es negativa, entonces otra debe ser positiva. En un punto hipotético donde u se maximiza, todas las derivadas secundarias direccionales son automáticamente no positivas, y el "equilibrio" representado por la ecuación anterior requiere entonces que todas las derivadas secundarias direccionales sean idénticamente cero.
Se podría argumentar que este razonamiento elemental representa una formulación infinitesimal del principio de máximo fuerte, que establece que, bajo algunos supuestos adicionales (como la continuidad de a ), u debe ser constante si hay un punto de M donde u se maximiza.
Obsérvese que el razonamiento anterior no se ve afectado si se considera la ecuación diferencial parcial más general.
ya que el término añadido es automáticamente cero en cualquier punto máximo hipotético. El razonamiento tampoco se ve afectado si se considera la condición más general
En este caso, se puede incluso observar el fenómeno adicional de tener una contradicción absoluta si hay una desigualdad estricta ( > en lugar de ≥ ) en esta condición en el punto máximo hipotético. Este fenómeno es importante en la prueba formal del principio clásico del máximo débil.
Sin embargo, el razonamiento anterior ya no se aplica si se considera la condición
ya que ahora la condición de "equilibrio", evaluada en un punto máximo hipotético de u , sólo dice que un promedio ponderado de cantidades manifiestamente no positivas es no positivo. Esto es trivialmente cierto, y por lo tanto no se puede sacar ninguna conclusión no trivial de ello. Esto se refleja en cualquier número de ejemplos concretos, como el hecho de que
y en cualquier región abierta que contenga el origen, la función − x 2 − y 2 ciertamente tiene un máximo.
Sea M un subconjunto abierto del espacio euclidiano. Si una función suave se maximiza en un punto p , entonces automáticamente se tiene:
Se puede considerar una ecuación diferencial parcial como la imposición de una relación algebraica entre las distintas derivadas de una función. Por lo tanto, si u es la solución de una ecuación diferencial parcial, entonces es posible que las condiciones anteriores sobre la primera y la segunda derivadas de u formen una contradicción con esta relación algebraica. Esta es la esencia del principio del máximo. Claramente, la aplicabilidad de esta idea depende en gran medida de la ecuación diferencial parcial en cuestión.
Por ejemplo, si u resuelve la ecuación diferencial
Entonces es claramente imposible tener y en cualquier punto del dominio. Por lo tanto, siguiendo la observación anterior, es imposible que u tome un valor máximo. Si, en cambio, u resolviera la ecuación diferencial , entonces no tendríamos tal contradicción, y el análisis dado hasta ahora no implica nada interesante. Si u resolviera la ecuación diferencial , entonces el mismo análisis mostraría que u no puede tomar un valor mínimo.
La posibilidad de tal análisis no se limita ni siquiera a las ecuaciones diferenciales parciales. Por ejemplo, si es una función tal que
que es una especie de ecuación diferencial "no local", entonces la positividad estricta automática del lado derecho muestra, mediante el mismo análisis que el anterior, que u no puede alcanzar un valor máximo.
Existen muchos métodos para extender la aplicabilidad de este tipo de análisis de diversas maneras. Por ejemplo, si u es una función armónica, entonces el tipo de contradicción anterior no ocurre directamente, ya que la existencia de un punto p donde no está en contradicción con el requisito en todas partes. Sin embargo, se podría considerar, para un número real arbitrario s , la función u s definida por
Es fácil ver que
Por el análisis anterior, si entonces u s no puede alcanzar un valor máximo. Uno podría desear considerar el límite como s a 0 para concluir que u tampoco puede alcanzar un valor máximo. Sin embargo, es posible que el límite puntual de una secuencia de funciones sin máximos tenga un máximo. No obstante, si M tiene un límite tal que M junto con su límite es compacto, entonces suponiendo que u puede extenderse continuamente hasta el límite, se sigue inmediatamente que tanto u como u s alcanzan un valor máximo en Puesto que hemos demostrado que u s , como una función en M , no tiene un máximo, se sigue que el punto máximo de u s , para cualquier s , está en Por la compacidad secuencial de se sigue que el máximo de u se alcanza en Este es el principio del máximo débil para funciones armónicas. Esto, por sí mismo, no descarta la posibilidad de que el máximo de u también se alcance en algún lugar de M . Ese es el contenido del "principio del máximo fuerte", que requiere un análisis más profundo.
El uso de la función específica anterior no era esencial. Lo único que importaba era tener una función que se extendiera continuamente hasta el límite y cuyo laplaciano fuera estrictamente positivo. Por lo tanto, podríamos haber usado, por ejemplo,
con el mismo efecto.
Sea M un subconjunto abierto del espacio euclidiano. Sea una función dos veces diferenciable que alcanza su valor máximo C. Supóngase que
Supongamos que se puede encontrar (o probar la existencia de):
Entonces L ( u + h − C ) ≥ 0 en Ω con u + h − C ≤ 0 en el límite de Ω ; según el principio del máximo débil, se tiene u + h − C ≤ 0 en Ω . Esto se puede reorganizar para decir
para todo x en Ω . Si se puede elegir h de modo que el lado derecho tenga una naturaleza manifiestamente positiva, entonces esto proporcionará una contradicción con el hecho de que x 0 es un punto máximo de u en M , de modo que su gradiente debe anularse.
El "programa" anterior se puede llevar a cabo. Elija Ω como un anillo esférico; se selecciona su centro x c como un punto más cercano al conjunto cerrado u −1 ( C ) que al conjunto cerrado ∂ M , y se selecciona el radio exterior R como la distancia desde este centro a u −1 ( C ) ; sea x 0 un punto en este último conjunto que realiza la distancia. El radio interior ρ es arbitrario. Defina
Ahora bien, el límite de Ω consta de dos esferas; en la esfera exterior, se tiene h = 0 ; debido a la selección de R , se tiene u ≤ C en esta esfera, y por tanto u + h − C ≤ 0 se cumple en esta parte del límite, junto con el requisito h ( x 0 ) = 0 . En la esfera interior, se tiene u < C . Debido a la continuidad de u y a la compacidad de la esfera interior, se puede seleccionar δ > 0 de modo que u + δ < C . Puesto que h es constante en esta esfera interior, se puede seleccionar ε > 0 de modo que u + h ≤ C en la esfera interior y, por tanto, en todo el límite de Ω .
El cálculo directo muestra
Hay varias condiciones bajo las cuales se puede garantizar que el lado derecho no sea negativo; vea el enunciado del teorema a continuación.
Por último, observe que la derivada direccional de h en x 0 a lo largo de la línea radial que apunta hacia adentro del anillo es estrictamente positiva. Como se describe en el resumen anterior, esto garantizará que una derivada direccional de u en x 0 sea distinta de cero, en contradicción con el hecho de que x 0 sea un punto máximo de u en el conjunto abierto M .
A continuación se presenta el enunciado del teorema en los libros de Morrey y Smoller, siguiendo el enunciado original de Hopf (1927):
Sea M un subconjunto abierto del espacio euclidiano ℝ n . Para cada i y j entre 1 y n , sean a ij y b i funciones continuas en M con a ij = a ji . Supóngase que para todo x en M , la matriz simétrica [ a ij ] es definida positiva. Si u es una función C 2 no constante en M tal que
en M , entonces u no alcanza un valor máximo en M .
El punto del supuesto de continuidad es que las funciones continuas están acotadas en conjuntos compactos, siendo el conjunto compacto relevante aquí el anillo esférico que aparece en la prueba. Además, por el mismo principio, hay un número λ tal que para todo x en el anillo, la matriz [ a ij ( x )] tiene todos los valores propios mayores o iguales a λ . Entonces se toma α , como aparece en la prueba, como grande en relación con estos límites. El libro de Evans tiene una formulación ligeramente más débil, en la que se supone que hay un número positivo λ que es un límite inferior de los valores propios de [ a ij ] para todo x en M .
Es evidente que estos supuestos de continuidad no son los más generales posibles para que la prueba funcione. Por ejemplo, a continuación se presenta el enunciado del teorema de Gilbarg y Trudinger, después de la misma prueba:
Sea M un subconjunto abierto del espacio euclidiano ℝ n . Para cada i y j entre 1 y n , sean a ij y b i funciones en M con a ij = a ji . Supóngase que para todo x en M , la matriz simétrica [ a ij ] es definida positiva, y sea λ(x) su valor propio más pequeño. Supóngase que y son funciones acotadas en M para cada i entre 1 y n . Si u es una función C 2 no constante en M tal que
en M , entonces u no alcanza un valor máximo en M .
No se pueden extender ingenuamente estas afirmaciones a la ecuación elíptica lineal general de segundo orden, como ya se ha visto en el caso unidimensional. Por ejemplo, la ecuación diferencial ordinaria y ″ + 2 y = 0 tiene soluciones sinusoidales, que ciertamente tienen máximos interiores. Esto se extiende al caso de dimensiones superiores, donde a menudo se tienen soluciones para ecuaciones de "funciones propias" Δ u + cu = 0 que tienen máximos interiores. El signo de c es relevante, como también se ve en el caso unidimensional; por ejemplo, las soluciones de y ″ - 2 y = 0 son exponenciales, y el carácter de los máximos de tales funciones es bastante diferente del de las funciones sinusoidales.