stringtranslate.com

El método de Broyden

En el análisis numérico, el método de Broyden es un método cuasi-newtoniano para hallar raíces en k variables. Fue descrito originalmente por CG Broyden en 1965. [1]

El método de Newton para resolver f ( x ) = 0 utiliza la matriz jacobiana , J , en cada iteración. Sin embargo, calcular esta matriz jacobiana puede ser una operación difícil y costosa; para problemas grandes como los que implican resolver las ecuaciones de Kohn-Sham en mecánica cuántica, el número de variables puede ser de cientos de miles. La idea detrás del método de Broyden es calcular la matriz jacobiana completa como máximo solo en la primera iteración y hacer actualizaciones de rango uno en las demás iteraciones.

En 1979, Gay demostró que cuando el método de Broyden se aplica a un sistema lineal de tamaño n × n , termina en 2 n pasos, [2] aunque, como todos los métodos cuasi-Newton, puede no converger para sistemas no lineales.

Descripción del método

Solución de ecuaciones no lineales de una sola variable

En el método secante , reemplazamos la primera derivada f en x n con la aproximación de diferencias finitas :

y proceder de manera similar al método de Newton :

donde n es el índice de iteración.

Resolver un sistema de ecuaciones no lineales

Consideremos un sistema de k ecuaciones no lineales con incógnitas

donde f es una función vectorial del vector x

Para estos problemas, Broyden ofrece una variación del método unidimensional de Newton, reemplazando la derivada con una matriz jacobiana aproximada J. La matriz jacobiana aproximada se determina iterativamente basándose en la ecuación secante , una aproximación de diferencias finitas:

donde n es el índice de iteración. Para mayor claridad, defina

Por lo tanto, lo anterior puede reescribirse como

La ecuación anterior está subdeterminada cuando k es mayor que uno. Broyden sugirió utilizar la estimación más reciente de la matriz jacobiana, J n −1 , y luego mejorarla exigiendo que la nueva forma sea una solución a la ecuación secante más reciente y que haya una modificación mínima de J n −1 :

Esto minimiza la norma de Frobenius.

Luego se actualizan las variables utilizando el jacobiano aproximado, lo que se llama un enfoque cuasi-Newton.

Si este es el paso de Newton completo, se suele utilizar un método de búsqueda de línea o de región de confianza para controlar . El jacobiano inicial se puede tomar como una matriz unitaria diagonal, aunque lo más común es escalarlo en función del primer paso. [3] Broyden también sugirió utilizar la fórmula de Sherman-Morrison [4] para actualizar directamente la inversa de la matriz jacobiana aproximada:

Este primer método se conoce comúnmente como el "método del buen Broyden".

Se puede obtener una técnica similar utilizando una modificación ligeramente diferente de J n −1 . Esto produce un segundo método, el llamado "método del mal Broyden":

Esto minimiza una norma de Frobenius diferente

En su artículo original, Broyden no pudo lograr que el método incorrecto funcionara, pero hay casos en los que sí lo hace [5] para los cuales se han propuesto varias explicaciones. [6] [7] Se han sugerido muchos otros esquemas cuasi-Newton en optimización, como el BFGS , donde se busca un máximo o mínimo al encontrar ceros de las primeras derivadas (ceros del gradiente en múltiples dimensiones). El jacobiano del gradiente se llama hessiano y es simétrico, lo que agrega más restricciones a su aproximación.

La clase de métodos Broyden

Además de los dos métodos descritos anteriormente, Broyden definió una clase más amplia de métodos relacionados. [1] : 578  En general, los métodos de la clase Broyden se dan en la forma [8] : 150  donde y y para cada . La elección de determina el método.

Otros autores han introducido otros métodos en la clase Broyden.

Véase también

Referencias

  1. ^ abc Broyden, CG (1965). "Una clase de métodos para resolver ecuaciones simultáneas no lineales". Matemáticas de la computación . 19 (92). Sociedad Matemática Americana: 577–593. doi : 10.1090/S0025-5718-1965-0198670-6 . JSTOR  2003941.
  2. ^ Gay, DM (1979). "Algunas propiedades de convergencia del método de Broyden". Revista SIAM sobre análisis numérico . 16 (4). SIAM: 623–630. doi :10.1137/0716047.
  3. ^ Shanno, DF; Phua, Kang-Hoh (1978). "Condicionamiento matricial y optimización no lineal". Programación matemática . 14 (1): 149–160. doi :10.1007/BF01588962. ISSN  0025-5610.
  4. ^ Sherman, Jack; Morrison, Winifred J. (1950). "Ajuste de una matriz inversa correspondiente a un cambio en un elemento de una matriz dada". Anales de estadística matemática . 21 (1): 124–127. doi :10.1214/aoms/1177729893. ISSN  0003-4851.
  5. ^ Kvaalen, Eric (1991). "Un método de Broyden más rápido". BIT Numerical Mathematics . 31 (2). SIAM: 369–372. doi :10.1007/BF01931297.
  6. ^ Martínez, José Mario (2000). "Métodos prácticos cuasi-Newton para la resolución de sistemas no lineales". Revista de Matemática Computacional y Aplicada . 124 (1–2): 97–121. doi :10.1016/s0377-0427(00)00434-9. ISSN  0377-0427.
  7. ^ ab Marks, LD; Luke, DR (2008). "Mezcla robusta para cálculos mecánicos cuánticos ab initio". Physical Review B . 78 (7). doi :10.1103/physrevb.78.075114. ISSN  1098-0121.
  8. ^ ab Nocedal, Jorge; Wright, Stephen J. (2006). Optimización numérica. Springer Series en Investigación de Operaciones e Ingeniería Financiera. Springer Nueva York. doi :10.1007/978-0-387-40065-5. ISBN 978-0-387-30303-1.
  9. ^ Anderson, Donald G. (1965). "Procedimientos iterativos para ecuaciones integrales no lineales". Revista de la ACM . 12 (4): 547–560. doi :10.1145/321296.321305. ISSN  0004-5411.
  10. ^ Schubert, LK (1970). "Modificación de un método cuasi-Newton para ecuaciones no lineales con un jacobiano disperso". Matemáticas de la computación . 24 (109): 27–30. doi : 10.1090/S0025-5718-1970-0258276-9 . ISSN  0025-5718.
  11. ^ Pulay, Péter (1980). "Aceleración de la convergencia de secuencias iterativas. El caso de la iteración scf". Chemical Physics Letters . 73 (2): 393–398. doi :10.1016/0009-2614(80)80396-4.
  12. ^ Kresse, G.; Furthmüller, J. (1996). "Esquemas iterativos eficientes para cálculos de energía total ab initio utilizando un conjunto base de ondas planas". Physical Review B . 54 (16): 11169–11186. doi :10.1103/PhysRevB.54.11169. ISSN  0163-1829.
  13. ^ Srivastava, GP (1984). "Método de Broyden para la aceleración de convergencia de campo autoconsistente". Journal of Physics A: Mathematical and General . 17 (6): L317–L321. doi :10.1088/0305-4470/17/6/002. ISSN  0305-4470.
  14. ^ Klement, Jan (2014). "Sobre el uso de algoritmos cuasi-Newton de la clase Broyden para la correlación entre modelos y pruebas". Revista de tecnología y gestión aeroespacial . 6 (4): 407–414. doi : 10.5028/jatm.v6i4.373 . ISSN  2175-9146.
  15. ^ "Métodos de la clase Broyden – Intercambio de archivos – MATLAB Central". www.mathworks.com . Consultado el 4 de febrero de 2016 .
  16. ^ Woods, ND; Payne, MC; Hasnip, PJ (2019). "Cálculo del campo autoconsistente en la teoría funcional de la densidad de Kohn-Sham". Journal of Physics: Condensed Matter . 31 (45): 453001. doi :10.1088/1361-648X/ab31c0. ISSN  0953-8984.

Lectura adicional

Enlaces externos