stringtranslate.com

Monte Carlo variacional

En física computacional , el Monte Carlo variacional (VMC) es un método de Monte Carlo cuántico que aplica el método variacional para aproximar el estado fundamental de un sistema cuántico. [1]

El componente básico es una función de onda genérica que depende de algunos parámetros . Los valores óptimos de los parámetros se obtienen al minimizar la energía total del sistema.

En particular, dado el hamiltoniano , y denotando con una configuración de muchos cuerpos , el valor esperado de la energía se puede escribir como: [2]

Siguiendo el método de Monte Carlo para evaluar integrales , podemos interpretarla como una función de distribución de probabilidad , muestrearla y evaluar el valor esperado de energía como el promedio de la llamada energía local . Una vez que se conoce para un conjunto dado de parámetros variacionales , se realiza la optimización para minimizar la energía y obtener la mejor representación posible de la función de onda del estado fundamental.

El método de Monte Carlo no es diferente de cualquier otro método variacional, excepto que las integrales multidimensionales se evalúan numéricamente. La integración de Monte Carlo es particularmente crucial en este problema, ya que la dimensión del espacio de Hilbert de muchos cuerpos, que comprende todos los valores posibles de las configuraciones , generalmente crece exponencialmente con el tamaño del sistema físico. Por lo tanto, otros enfoques para la evaluación numérica de los valores esperados de energía limitarían, en general, las aplicaciones a sistemas mucho más pequeños que los analizables gracias al enfoque de Monte Carlo.

La precisión del método depende en gran medida de la elección del estado variacional. La opción más simple corresponde típicamente a una forma de campo medio , donde el estado se escribe como una factorización sobre el espacio de Hilbert. Esta forma particularmente simple no suele ser muy precisa ya que descuida los efectos de muchos cuerpos. Una de las mayores ganancias en precisión sobre la escritura de la función de onda de forma separable proviene de la introducción del llamado factor de Jastrow. En este caso, la función de onda se escribe como , donde es la distancia entre un par de partículas cuánticas y es una función variacional a determinar. Con este factor, podemos dar cuenta explícitamente de la correlación partícula-partícula, pero la integral de muchos cuerpos se vuelve inseparable, por lo que Monte Carlo es la única forma de evaluarla de manera eficiente. En sistemas químicos, versiones ligeramente más sofisticadas de este factor pueden obtener el 80-90% de la energía de correlación (ver correlación electrónica ) con menos de 30 parámetros. En comparación, un cálculo de interacción de configuración puede requerir alrededor de 50.000 parámetros para alcanzar esa precisión, aunque depende en gran medida del caso particular que se esté considerando. Además, VMC generalmente se escala como una pequeña potencia del número de partículas en la simulación, normalmente algo así como N 2−4 para el cálculo del valor esperado de energía, dependiendo de la forma de la función de onda.

Optimización de la función de onda en VMC

Los cálculos de QMC dependen fundamentalmente de la calidad de la función de prueba, por lo que es esencial disponer de una función de onda optimizada lo más cercana posible al estado fundamental. El problema de la optimización de funciones es un tema de investigación muy importante en la simulación numérica. En QMC, además de las dificultades habituales para encontrar el mínimo de una función paramétrica multidimensional, el ruido estadístico está presente en la estimación de la función de coste (normalmente la energía) y sus derivadas, necesarias para una optimización eficiente.

Se utilizaron diferentes funciones de costo y diferentes estrategias para optimizar una función de prueba de muchos cuerpos. Por lo general, se utilizaron tres funciones de costo en la optimización de QMC: energía, varianza o una combinación lineal de ellas. El método de optimización de la varianza tiene la ventaja de que se conoce la varianza exacta de la función de onda. (Como la función de onda exacta es una función propia del hamiltoniano, la varianza de la energía local es cero). Esto significa que la optimización de la varianza es ideal porque está acotada desde abajo, está definida positivamente y se conoce su mínimo. Sin embargo, la minimización de la energía puede resultar en última instancia más efectiva, ya que diferentes autores demostraron recientemente que la optimización de la energía es más efectiva que la de la varianza.

Hay diferentes motivaciones para esto: primero, usualmente uno está interesado en la energía más baja en lugar de la varianza más baja tanto en el Monte Carlo variacional como en el de difusión; segundo, la optimización de la varianza requiere muchas iteraciones para optimizar los parámetros determinantes y a menudo la optimización puede quedar atrapada en múltiples mínimos locales y sufre el problema de la "falsa convergencia"; tercero, las funciones de onda de energía minimizada en promedio producen valores más precisos de otros valores de expectativa que las funciones de onda de varianza minimizada.

Las estrategias de optimización se pueden dividir en tres categorías. La primera estrategia se basa en el muestreo correlacionado junto con métodos de optimización deterministas. Aunque esta idea arrojó resultados muy precisos para los átomos de la primera fila, este procedimiento puede tener problemas si los parámetros afectan a los nodos y, además, la relación de densidad de la función de prueba actual e inicial aumenta exponencialmente con el tamaño del sistema. En la segunda estrategia, se utiliza un intervalo grande para evaluar la función de costo y sus derivadas de tal manera que se pueda ignorar el ruido y se puedan utilizar métodos deterministas.

El tercer enfoque se basa en una técnica iterativa para trabajar directamente con funciones de ruido. El primer ejemplo de estos métodos es la denominada aproximación de gradiente estocástico (SGA), que también se utilizó para la optimización de estructuras. Recientemente se propuso un enfoque mejorado y más rápido de este tipo, el denominado método de reconfiguración estocástica (SR).

VMC y aprendizaje profundo

En 2017, Giuseppe Carleo y Matthias Troyer [3] utilizaron una función objetivo VMC para entrenar una red neuronal artificial para encontrar el estado fundamental de un sistema mecánico cuántico. En términos más generales, las redes neuronales artificiales se utilizan como un ansatz de función de onda (conocido como estados cuánticos de red neuronal ) en los marcos VMC para encontrar estados fundamentales de sistemas mecánicos cuánticos. El uso de ansatzes de red neuronal para VMC se ha extendido a los fermiones , lo que permite cálculos de estructura electrónica que son significativamente más precisos que los cálculos VMC que no utilizan redes neuronales. [4] [5] [6]

Véase también

Lectura adicional

General

Optimización de la función de onda en VMC

Referencias

  1. ^ Scherer, Philipp OJ (2017). Física computacional. Textos de posgrado en física. Cham: Springer International Publishing. doi :10.1007/978-3-319-61088-7. ISBN 978-3-319-61087-0.
  2. ^ Kalos, Malvin H., ed. (1984). Métodos de Monte Carlo en problemas cuánticos. Dordrecht: Springer Países Bajos. doi :10.1007/978-94-009-6384-9. ISBN 978-94-009-6386-3.
  3. ^ Carleo, Giuseppe; Troyer, Matthias (2017). "Resolución del problema cuántico de muchos cuerpos con redes neuronales artificiales". Science . 355 (6325): 602–606. arXiv : 1606.02318 . Bibcode :2017Sci...355..602C. doi :10.1126/science.aag2302. PMID  28183973. S2CID  206651104.
  4. ^ Pfau, David; Spencer, James; Matthews, Alexander G. de G.; Foulkes, WMC (2020). "Solución ab-initio de la ecuación de Schrödinger de muchos electrones con redes neuronales profundas". Physical Review Research . 2 (3): 033429. arXiv : 1909.02487 . Código Bibliográfico :2020PhRvR...2c3429P. doi :10.1103/PhysRevResearch.2.033429. S2CID  202120723.
  5. ^ Hermann, Jan; Schätzle, Zeno; Noé, Frank (2020). "Solución de red neuronal profunda de la ecuación electrónica de Schrödinger". Nature Chemistry . 12 (10): 891–897. arXiv : 1909.08423 . Código Bibliográfico :2020NatCh..12..891H. doi :10.1038/s41557-020-0544-y. PMID  32968231. S2CID  202660909.
  6. ^ Choo, Kenny; Mezzacapo, Antonio; Carleo, Giuseppe (2020). "Estados de redes neuronales fermiónicas para la estructura electrónica ab-initio". Nature Communications . 11 (1): 2368. arXiv : 1909.12852 . Código Bibliográfico :2020NatCo..11.2368C. doi :10.1038/s41467-020-15724-9. PMC 7217823 . PMID  32398658.