[1] Este método reduce el problema restringido con n variables a uno sin restricciones de n + k variables, donde k es igual al número de restricciones, y cuyas ecuaciones pueden ser resueltas más fácilmente.
Estas nuevas variables escalares desconocidas, una para cada restricción, son llamadas multiplicadores de Lagrange.
El método dice que los puntos donde la función tiene un extremo condicionado con k restricciones, están entre los puntos estacionarios de una nueva función sin restricciones construida como una combinación lineal de la función y las funciones implicadas en las restricciones, cuyos coeficientes son los multiplicadores.
Se trata de extraer una función implícita de las restricciones, y encontrar las condiciones para que las derivadas parciales con respecto a las variables independientes de la función sean iguales a cero.
Supongamos que tenemos la función, f (x, y), y queremos maximizarla, estando sujeta a la condición: donde c es una constante.
Geométricamente traducimos la condición de tangencia diciendo que los gradientes de f y g son vectores paralelos en el máximo.
Una vez determinados los valores de λ, volvemos al número original de variables y así continuamos encontrando el extremo de la nueva ecuación no restringida.
Se definen s restricciones gk (x) = 0, k=1,..., s, y se observa (si las restricciones son satisfechas) que:
Se procede a buscar un extremo para h lo que es equivalente a Sea una superficie M contenida en Rn definida por g(x)=0 y sea f(x) la función a obtener su punto crítico.
M un punto crítico entonces se ha de cumplir: para todo v vector tangente a M en p (es decir, sea cual sea la dirección en la que nos desplacemos en M, el incremento de f a primer orden es nulo) La anterior condición significa que
es perpendicular al tangente a M en p y dado que dim M=n-1 existe un único vector perpendicular linealmente independiente que viene dado por
En el caso de que M esté definida por varias restricciones
el conjunto de vectores perpendiculares al tangente a M en p viene generado por
Los multiplicadores desconocidos λk se determinan a partir de las ecuaciones con las restricciones y conjuntamente se obtiene un extremo para h que al mismo tiempo satisface las restricciones (i.e.
Supongamos que queremos encontrar la distribución probabilística discreta con máxima entropía.
Para todo k desde 1 hasta n, necesitamos lo que nos da Derivando estas n ecuaciones, obtenemos Esto muestra que todo pi es igual (debido a que depende solamente de λ).
que están más cercanos al punto
para hacer más sencilla la operación se maximiza o minimiza el cuadrado de la distancia:
" y el resultado es: la manera más sencilla de resolver estas ecuaciones es dejar x, y, z en función de
En primer lugar se observa que
Uno de ellos es el más lejano (máximo de la función), y se puede observar que el punto más cercano es
Bastará entonces evaluar la función en esos puntos para determinar que:
Como en el caso no restringido en el que usamos la matriz Hessiana y el criterio de Sylvester para determinar la naturaleza de los puntos críticos, en presencia de multiplicadores de Lagrange existe un método análogo para descubrir si un punto crítico v0 es máximo, mínimo, o punto silla.
Sean f:U⊂ℝ2→ℝ y g:U⊂ℝ2→ℝ dos curvas suaves de clase C2.
Sea v0∈U tal que g(v0)= c y sea S el conjunto de nivel de g con valor c. Asumimos que
g(v0)≠0 y existe un número real
g tenemos la matriz hessiana limitada: Análogamente al caso bidimensional, consideramos el caso n-dimensional, Sea f:U⊂ℝn→ℝ y g:U⊂ℝn→ℝ dos curvas suaves de clase C2.
Sea v0∈U tal que g(v0)= c y sea S elconjunto de nivel de g con valor c. Asumimos que
g(v0)≠0 y existe un número real
g construimos la matriz hessiana limitada: Examinamos los determinantes de las submatrices en la diagonal de orden mayor o igual a 3: