La mecánica matricial es una formulación de la mecánica cuántica creada por Werner Heisenberg , Max Born y Pascual Jordan en 1925. Fue la primera formulación conceptualmente autónoma y lógicamente consistente de la mecánica cuántica. Su explicación de los saltos cuánticos suplantó las órbitas de los electrones del modelo de Bohr . Lo hizo interpretando las propiedades físicas de las partículas como matrices que evolucionan en el tiempo. Es equivalente a la formulación ondulatoria de Schrödinger de la mecánica cuántica, como se manifiesta en la notación bra-ket de Dirac .
En cierto contraste con la formulación ondulatoria, produce espectros de operadores (principalmente de energía) mediante métodos de operadores de escalera puramente algebraicos . [1] Basándose en estos métodos, Wolfgang Pauli derivó el espectro del átomo de hidrógeno en 1926, [2] antes del desarrollo de la mecánica ondulatoria.
En 1925, Werner Heisenberg , Max Born y Pascual Jordan formularon la representación matricial de la mecánica cuántica.
En 1925, Werner Heisenberg trabajaba en Gotinga en el problema de calcular las líneas espectrales del hidrógeno . En mayo de 1925, comenzó a intentar describir los sistemas atómicos sólo mediante observables . El 7 de junio, después de semanas de no poder aliviar su fiebre del heno con aspirina y cocaína, [3] Heisenberg partió hacia la isla de Helgoland , en el Mar del Norte , libre de polen . Mientras estuvo allí, entre escaladas y memorización de poemas del West-östlicher Diwan de Goethe , continuó reflexionando sobre la cuestión espectral y finalmente se dio cuenta de que adoptar observables no conmutables podría resolver el problema. Más tarde escribió:
Eran aproximadamente las tres de la noche cuando tuve ante mí el resultado final del cálculo. Al principio me sentí profundamente conmovido. Estaba tan emocionado que no podía pensar en dormir. Así que salí de la casa y esperé el amanecer en lo alto de una roca. [4] : 275
Después de regresar a Gotinga, Heisenberg le mostró sus cálculos a Wolfgang Pauli y en un momento comentó:
Todo me parece todavía vago y confuso, pero parece que los electrones ya no se moverán en órbitas. [5]
El 9 de julio, Heisenberg entregó el mismo artículo con sus cálculos a Max Born, diciendo que "había escrito un artículo disparatado y no se atrevía a enviarlo para su publicación, y que Born debería leerlo y aconsejarle" antes de publicarlo. Luego, Heisenberg se marchó por un tiempo, dejando a Born para que analizara el artículo. [6]
En el artículo, Heisenberg formuló la teoría cuántica sin órbitas electrónicas definidas. Hendrik Kramers había calculado anteriormente las intensidades relativas de las líneas espectrales en el modelo de Sommerfeld interpretando los coeficientes de Fourier de las órbitas como intensidades. Pero su respuesta, como todos los demás cálculos de la antigua teoría cuántica , solo era correcta para órbitas grandes .
Heisenberg, después de una colaboración con Kramers, [7] comenzó a comprender que las probabilidades de transición no eran cantidades completamente clásicas, porque las únicas frecuencias que aparecen en la serie de Fourier deberían ser las que se observan en los saltos cuánticos, no las ficticias que provienen de las órbitas clásicas agudas que analiza Fourier. Reemplazó la serie clásica de Fourier con una matriz de coeficientes, un análogo cuántico difuso de la serie de Fourier. Clásicamente, los coeficientes de Fourier dan la intensidad de la radiación emitida , por lo que en mecánica cuántica la magnitud de los elementos de la matriz del operador de posición era la intensidad de la radiación en el espectro de línea brillante. Las cantidades en la formulación de Heisenberg eran la posición y el momento clásicos, pero ahora ya no estaban definidas con precisión. Cada cantidad estaba representada por una colección de coeficientes de Fourier con dos índices, correspondientes a los estados inicial y final. [8]
Cuando Born leyó el artículo, reconoció que la formulación podía transcribirse y extenderse al lenguaje sistemático de matrices , [9] que había aprendido en su estudio con Jakob Rosanes [10] en la Universidad de Breslau . Born, con la ayuda de su asistente y ex alumno Pascual Jordan, comenzó inmediatamente a realizar la transcripción y extensión, y presentaron sus resultados para su publicación; el artículo se recibió para su publicación solo 60 días después del artículo de Heisenberg. [11]
Los tres autores presentaron un artículo de seguimiento para su publicación antes de fin de año. [12] (Una breve revisión del papel de Born en el desarrollo de la formulación de la mecánica matricial de la mecánica cuántica junto con una discusión de la fórmula clave que involucra la no conmutatividad de las amplitudes de probabilidad se puede encontrar en un artículo de Jeremy Bernstein . [13] Se puede encontrar un relato histórico y técnico detallado en el libro de Mehra y Rechenberg The Historical Development of Quantum Theory. Volume 3. The Formulation of Matrix Mechanics and Its Modifications 1925–1926. [14] )
Los tres documentos fundamentales:
- W. Heisenberg, Über quantentheoretische Umdeutung kinematischer und mechanischer Beziehungen , Zeitschrift für Physik , 33 , 879-893, 1925 (recibido el 29 de julio de 1925). [Traducción al inglés en: BL van der Waerden, editor, Sources of Quantum Mechanics (Dover Publications, 1968) ISBN 0-486-61881-1 (Título en inglés: Quantum-Theoretical Re-interpretation of Kinematic and Mechanical Relations ).]
- M. Born y P. Jordan, Zur Quantenmechanik , Zeitschrift für Physik , 34 , 858-888, 1925 (recibido el 27 de septiembre de 1925). [Traducción al inglés en: BL van der Waerden, editor, Sources of Quantum Mechanics (Dover Publications, 1968) ISBN 0-486-61881-1 (Título en inglés: On Quantum Mechanics ).]
- M. Born, W. Heisenberg y P. Jordan, Zur Quantenmechanik II , Zeitschrift für Physik , 35 , 557-615, 1926 (recibido el 16 de noviembre de 1925). [Traducción al inglés en: BL van der Waerden, editor, Sources of Quantum Mechanics (Dover Publications, 1968) ISBN 0-486-61881-1 (título en inglés: On Quantum Mechanics II ).]
Hasta ese momento, los físicos rara vez utilizaban las matrices, pues se consideraba que pertenecían al ámbito de las matemáticas puras. Gustav Mie las había utilizado en un artículo sobre electrodinámica en 1912 y Born las había utilizado en su trabajo sobre la teoría de redes de cristales en 1921. Si bien en estos casos se utilizaban matrices, el álgebra de matrices con su multiplicación no entraba en escena como sí lo hacía en la formulación matricial de la mecánica cuántica. [15]
Born, sin embargo, había aprendido álgebra matricial de Rosanes, como ya se señaló, pero Born también había aprendido la teoría de ecuaciones integrales y formas cuadráticas de Hilbert para un número infinito de variables, como era evidente a partir de una cita de Born de la obra de Hilbert Grundzüge einer allgemeinen Theorie der Linearen Integralgleichungen publicada en 1912. [16] [17]
Jordan también estaba bien preparado para la tarea. Durante varios años había sido asistente de Richard Courant en Göttingen en la preparación del libro de Courant y David Hilbert Methoden der mathematischen Physik I , que se publicó en 1924. [18] Este libro, fortuitamente, contenía una gran cantidad de herramientas matemáticas necesarias para el desarrollo continuo de la mecánica cuántica.
En 1926, John von Neumann se convirtió en asistente de David Hilbert y acuñaría el término espacio de Hilbert para describir el álgebra y el análisis que se utilizaron en el desarrollo de la mecánica cuántica. [19] [20]
Una contribución fundamental a esta formulación se logró en el artículo de reinterpretación/síntesis de Dirac de 1925, [21] que inventó el lenguaje y el marco que se emplean habitualmente hoy en día, mostrando plenamente la estructura no conmutativa de toda la construcción.
Antes de la mecánica matricial, la antigua teoría cuántica describía el movimiento de una partícula mediante una órbita clásica, con posición y momento bien definidos X ( t ), P ( t ), con la restricción de que la integral temporal sobre un periodo T del momento por la velocidad debe ser un múltiplo entero positivo de la constante de Planck . Si bien esta restricción selecciona correctamente órbitas con valores de energía más o menos correctos E n , el antiguo formalismo mecánico cuántico no describía procesos dependientes del tiempo, como la emisión o absorción de radiación.
Cuando una partícula clásica está débilmente acoplada a un campo de radiación, de modo que se puede despreciar el amortiguamiento radiativo, emitirá radiación en un patrón que se repite en cada período orbital . Las frecuencias que componen la onda saliente son entonces múltiplos enteros de la frecuencia orbital, y esto es un reflejo del hecho de que X ( t ) es periódica, de modo que su representación de Fourier tiene frecuencias 2π n / T solamente. Los coeficientes X n son números complejos . Los que tienen frecuencias negativas deben ser los conjugados complejos de los que tienen frecuencias positivas, de modo que X ( t ) siempre será real.
Por otra parte, una partícula mecánica cuántica no puede emitir radiación de forma continua, sino que solo puede emitir fotones. Suponiendo que la partícula cuántica comenzó en la órbita número n , emitió un fotón y luego terminó en la órbita número m , la energía del fotón es E n − E m , lo que significa que su frecuencia es ( E n − E m )/ h .
Para n y m grandes , pero con n − m relativamente pequeño, estas son las frecuencias clásicas según el principio de correspondencia de Bohr . En la fórmula anterior, T es el período clásico de la órbita n o de la órbita m , ya que la diferencia entre ellas es de orden superior en h . Pero para n y m pequeños, o si n − m es grande, las frecuencias no son múltiplos enteros de ninguna frecuencia individual.
Dado que las frecuencias que emite la partícula son las mismas que las frecuencias en la descripción de Fourier de su movimiento, esto sugiere que algo en la descripción dependiente del tiempo de la partícula está oscilando con frecuencia ( E n − E m )/ h . Heisenberg llamó a esta cantidad X nm , y exigió que se redujera a los coeficientes de Fourier clásicos en el límite clásico. Para valores grandes de n , m pero con n − m relativamente pequeño, X nm es el ( n − m ) ésimo coeficiente de Fourier del movimiento clásico en la órbita n . Dado que X nm tiene frecuencia opuesta a X mn , la condición de que X sea real se convierte en
Por definición, X nm sólo tiene la frecuencia ( E n − E m )/ h , por lo que su evolución temporal es simple: Esta es la forma original de la ecuación de movimiento de Heisenberg.
Dados dos conjuntos X nm y P nm que describen dos magnitudes físicas, Heisenberg pudo formar un nuevo conjunto del mismo tipo combinando los términos X nk P km , que también oscilan con la frecuencia correcta. Puesto que los coeficientes de Fourier del producto de dos magnitudes son la convolución de los coeficientes de Fourier de cada una por separado, la correspondencia con las series de Fourier permitió a Heisenberg deducir la regla por la que se deben multiplicar los conjuntos,
Born señaló que ésta es la ley de multiplicación de matrices , de modo que la posición, el momento, la energía, todas las magnitudes observables en la teoría, se interpretan como matrices. Bajo esta regla de multiplicación, el producto depende del orden: XP es diferente de PX .
La matriz X es una descripción completa del movimiento de una partícula mecánica cuántica. Debido a que las frecuencias en el movimiento cuántico no son múltiplos de una frecuencia común, los elementos de la matriz no pueden interpretarse como los coeficientes de Fourier de una trayectoria clásica aguda . Sin embargo, como matrices, X ( t ) y P ( t ) satisfacen las ecuaciones clásicas de movimiento; véase también el teorema de Ehrenfest, a continuación.
Cuando Werner Heisenberg, Max Born y Pascual Jordan la introdujeron en 1925, la mecánica matricial no fue aceptada de inmediato y al principio fue fuente de controversia. La introducción posterior de la mecánica ondulatoria por parte de Schrödinger fue muy bien recibida.
En parte, la razón era que la formulación de Heisenberg estaba en un lenguaje matemático extraño para la época, mientras que la de Schrödinger se basaba en ecuaciones de onda conocidas. Pero también había una razón sociológica más profunda. La mecánica cuántica se había estado desarrollando por dos caminos, uno liderado por Einstein, que hizo hincapié en la dualidad onda-partícula que propuso para los fotones, y el otro liderado por Bohr, que hizo hincapié en los estados de energía discretos y los saltos cuánticos que Bohr descubrió. De Broglie había reproducido los estados de energía discretos dentro del marco de Einstein (la condición cuántica es la condición de onda estacionaria), y esto dio esperanzas a los de la escuela de Einstein de que todos los aspectos discretos de la mecánica cuántica se subsumirían en una mecánica de ondas continuas.
Por otra parte, la mecánica matricial surgió de la escuela de Bohr, que se ocupaba de los estados de energía discretos y los saltos cuánticos. Los seguidores de Bohr no apreciaban los modelos físicos que representaban a los electrones como ondas, o como cualquier otra cosa. Preferían centrarse en las magnitudes que estaban directamente relacionadas con los experimentos.
En física atómica, la espectroscopia proporcionaba datos observacionales sobre las transiciones atómicas que surgían de las interacciones de los átomos con los cuantos de luz. La escuela de Bohr exigía que en la teoría sólo aparecieran aquellas magnitudes que en principio eran mensurables mediante espectroscopia. Estas magnitudes incluyen los niveles de energía y sus intensidades, pero no incluyen la ubicación exacta de una partícula en su órbita de Bohr. Es muy difícil imaginar un experimento que pudiera determinar si un electrón en el estado fundamental de un átomo de hidrógeno está a la derecha o a la izquierda del núcleo. Era una convicción profunda que tales preguntas no tenían respuesta.
La formulación matricial se construyó sobre la premisa de que todos los observables físicos están representados por matrices, cuyos elementos están indexados por dos niveles de energía diferentes. [22] El conjunto de valores propios de la matriz se entendió finalmente como el conjunto de todos los valores posibles que puede tener el observable. Dado que las matrices de Heisenberg son hermíticas , los valores propios son reales.
Si se mide un observable y el resultado es un valor propio determinado, el vector propio correspondiente es el estado del sistema inmediatamente después de la medición. El acto de medición en la mecánica matricial "colapsa" el estado del sistema. Si se miden dos observables simultáneamente, el estado del sistema colapsa a un vector propio común de los dos observables. Dado que la mayoría de las matrices no tienen ningún vector propio en común, la mayoría de los observables nunca pueden medirse con precisión al mismo tiempo. Este es el principio de incertidumbre .
Si dos matrices comparten sus vectores propios, pueden diagonalizarse simultáneamente. En el caso de que ambas sean diagonales, es evidente que su producto no depende de su orden, ya que la multiplicación de matrices diagonales es simplemente una multiplicación de números. El principio de incertidumbre, por el contrario, es una expresión del hecho de que, a menudo, dos matrices A y B no siempre conmutan, es decir, que AB − BA no necesariamente es igual a 0. La relación de conmutación fundamental de la mecánica de matrices implica entonces que no hay estados que tengan simultáneamente una posición y un momento definidos .
Este principio de incertidumbre se aplica también a muchos otros pares de observables. Por ejemplo, la energía tampoco conmuta con la posición, por lo que es imposible determinar con precisión la posición y la energía de un electrón en un átomo.
En 1928, Albert Einstein nominó a Heisenberg, Born y Jordan para el Premio Nobel de Física . [23] El anuncio del Premio Nobel de Física de 1932 se retrasó hasta noviembre de 1933. [24] Fue en ese momento que se anunció que Heisenberg había ganado el Premio de 1932 "por la creación de la mecánica cuántica, cuya aplicación ha llevado, entre otras cosas , al descubrimiento de las formas alotrópicas del hidrógeno" [25] y Erwin Schrödinger y Paul Adrien Maurice Dirac compartieron el Premio de 1933 "por el descubrimiento de nuevas formas productivas de teoría atómica". [25]
Se podría preguntar por qué Born no recibió el premio en 1932, junto con Heisenberg, y Bernstein ofrece especulaciones sobre este asunto. Una de ellas se relaciona con que Jordan se unió al Partido Nazi el 1 de mayo de 1933 y se convirtió en un soldado de asalto . [26] Las afiliaciones partidarias de Jordan y los vínculos de Jordan con Born pueden haber afectado la oportunidad de Born de obtener el premio en ese momento. Bernstein señala además que cuando Born finalmente ganó el premio en 1954, Jordan todavía estaba vivo, mientras que el premio se otorgó por la interpretación estadística de la mecánica cuántica, atribuible únicamente a Born. [27]
Las reacciones de Heisenberg ante la recepción del premio por parte de Born en 1932 y de Born en 1954 también son ilustrativas para evaluar si Born debería haber compartido el premio con Heisenberg. El 25 de noviembre de 1933, Born recibió una carta de Heisenberg en la que le decía que se había demorado en escribir debido a una "mala conciencia" de que sólo él había recibido el premio "por el trabajo realizado en Gotinga en colaboración: usted, Jordan y yo". Heisenberg continuó diciendo que la contribución de Born y Jordan a la mecánica cuántica no puede ser cambiada por "una decisión equivocada desde el exterior". [28]
En 1954, Heisenberg escribió un artículo en homenaje a Max Planck por su descubrimiento de 1900. En el artículo, Heisenberg atribuyó a Born y Jordan la formulación matemática final de la mecánica matricial y continuó destacando cuán grandes fueron sus contribuciones a la mecánica cuántica, que no fueron "adecuadamente reconocidas a los ojos del público". [29]
Una vez que Heisenberg introdujo las matrices para X y P , pudo encontrar sus elementos matriciales en casos especiales mediante conjeturas, guiado por el principio de correspondencia. Dado que los elementos matriciales son los análogos mecánicos cuánticos de los coeficientes de Fourier de las órbitas clásicas, el caso más simple es el oscilador armónico , donde la posición y el momento clásicos, X ( t ) y P ( t ), son sinusoidales.
En unidades donde la masa y la frecuencia del oscilador son iguales a uno (ver adimensionalización ), la energía del oscilador es
Los conjuntos de niveles de H son las órbitas en el sentido de las agujas del reloj y son círculos anidados en el espacio de fases. La órbita clásica con energía E es
La antigua condición cuántica dicta que la integral de P dX sobre una órbita, que es el área del círculo en el espacio de fases, debe ser un múltiplo entero de la constante de Planck . El área del círculo de radio √ 2 E es 2 πE . Por lo tanto, en unidades naturales donde ħ = 1 , la energía es un número entero.
Los componentes de Fourier de X ( t ) y P ( t ) son simples, y más aún si se combinan en las cantidades Tanto A como A † tienen solo una frecuencia única, y X y P se pueden recuperar a partir de su suma y diferencia.
Dado que A ( t ) tiene una serie de Fourier clásica con solo la frecuencia más baja, y el elemento de matriz A mn es el ( m − n ) ésimo coeficiente de Fourier de la órbita clásica, la matriz para A es distinta de cero solo en la línea justo encima de la diagonal, donde es igual a √ 2 E n . La matriz para A † también es distinta de cero solo en la línea debajo de la diagonal, con los mismos elementos. Por lo tanto, a partir de A y A † , la reconstrucción produce y que, hasta la elección de las unidades, son las matrices de Heisenberg para el oscilador armónico. Ambas matrices son hermíticas , ya que se construyen a partir de los coeficientes de Fourier de cantidades reales.
Encontrar X ( t ) y P ( t ) es directo, ya que son coeficientes cuánticos de Fourier, por lo que evolucionan simplemente con el tiempo,
El producto matricial de X y P no es hermítico, sino que tiene una parte real y una imaginaria. La parte real es la mitad de la expresión simétrica XP + PX , mientras que la parte imaginaria es proporcional al conmutador Es sencillo verificar explícitamente que XP − PX en el caso del oscilador armónico, es iħ , multiplicado por la identidad .
También es sencillo verificar que la matriz es una matriz diagonal , con valores propios E i .
El oscilador armónico es un caso importante. Encontrar las matrices es más fácil que determinar las condiciones generales a partir de estas formas especiales. Por esta razón, Heisenberg investigó el oscilador anarmónico , con Hamiltonianos
En este caso, las matrices X y P ya no son simples matrices fuera de la diagonal, ya que las órbitas clásicas correspondientes están ligeramente aplastadas y desplazadas, de modo que tienen coeficientes de Fourier en cada frecuencia clásica. Para determinar los elementos de la matriz, Heisenberg requirió que las ecuaciones clásicas de movimiento se cumplieran como ecuaciones matriciales,
Observó que si esto se pudiera hacer, entonces H , considerada como una función matricial de X y P , tendrá derivada temporal cero. donde A ∗ B es el anticonmutador ,
Dado que todos los elementos fuera de la diagonal tienen una frecuencia distinta de cero, el hecho de que H sea constante implica que H es diagonal. Para Heisenberg era evidente que en este sistema la energía podía conservarse exactamente en un sistema cuántico arbitrario, una señal muy alentadora.
El proceso de emisión y absorción de fotones parecía exigir que la conservación de la energía se mantuviera en el mejor de los casos en promedio. Si una onda que contiene exactamente un fotón pasa sobre algunos átomos y uno de ellos la absorbe, ese átomo necesita decirle a los otros que ya no pueden absorber el fotón. Pero si los átomos están muy separados, ninguna señal puede llegar a los otros átomos a tiempo, y podrían terminar absorbiendo el mismo fotón de todos modos y disipando la energía al medio ambiente. Cuando la señal los alcanzara, los otros átomos tendrían que recuperar de alguna manera esa energía. Esta paradoja llevó a Bohr, Kramers y Slater a abandonar la conservación exacta de la energía. El formalismo de Heisenberg, cuando se amplió para incluir el campo electromagnético, obviamente iba a eludir este problema, un indicio de que la interpretación de la teoría implicará el colapso de la función de onda .
Exigir que se mantengan las ecuaciones clásicas de movimiento no es una condición lo suficientemente fuerte para determinar los elementos de la matriz. La constante de Planck no aparece en las ecuaciones clásicas, de modo que las matrices podrían construirse para muchos valores diferentes de ħ y aun así satisfacer las ecuaciones de movimiento, pero con diferentes niveles de energía.
Así pues, para implementar su programa, Heisenberg tuvo que utilizar la antigua condición cuántica para fijar los niveles de energía, luego rellenar las matrices con los coeficientes de Fourier de las ecuaciones clásicas y luego alterar ligeramente los coeficientes de la matriz y los niveles de energía para asegurarse de que se cumplieran las ecuaciones clásicas. Esto claramente no es satisfactorio. Las antiguas condiciones cuánticas se refieren al área encerrada por las órbitas clásicas agudas, que no existen en el nuevo formalismo.
Lo más importante que descubrió Heisenberg es cómo traducir la antigua condición cuántica en un enunciado simple en mecánica matricial.
Para ello, investigó la integral de acción como una cantidad matricial,
Existen varios problemas con esta integral, todos ellos derivados de la incompatibilidad del formalismo matricial con la antigua imagen de las órbitas. ¿Qué período T se debe utilizar? Semiclásicamente , debería ser m o n , pero la diferencia es de orden ħ , y se busca una respuesta de orden ħ . La condición cuántica nos dice que J mn es 2π n en la diagonal, por lo que el hecho de que J sea clásicamente constante nos dice que los elementos fuera de la diagonal son cero.
Su idea fundamental fue diferenciar la condición cuántica con respecto a n . Esta idea sólo tiene pleno sentido en el límite clásico, donde n no es un entero sino la variable de acción continua J , pero Heisenberg realizó manipulaciones análogas con matrices, donde las expresiones intermedias son a veces diferencias discretas y a veces derivadas.
En la siguiente discusión, para mayor claridad, la diferenciación se realizará en las variables clásicas y la transición a la mecánica matricial se hará después, guiada por el principio de correspondencia.
En el contexto clásico, la derivada es la derivada con respecto a J de la integral que define J , por lo que es tautológicamente igual a 1. donde las derivadas dP / dJ y dX / dJ deben interpretarse como diferencias con respecto a J en tiempos correspondientes en órbitas cercanas, exactamente lo que se obtendría si se diferenciaran los coeficientes de Fourier del movimiento orbital. (Estas derivadas son simplécticamente ortogonales en el espacio de fases a las derivadas temporales dP / dt y dX / dt ).
La expresión final se aclara introduciendo la variable canónicamente conjugada a J , que se llama variable angular θ : La derivada con respecto al tiempo es una derivada con respecto a θ , hasta un factor de 2π T , Por lo que la integral de condición cuántica es el valor promedio durante un ciclo del corchete de Poisson de X y P.
Una diferenciación análoga de la serie de Fourier de P dX demuestra que los elementos fuera de la diagonal del corchete de Poisson son todos cero. El corchete de Poisson de dos variables canónicamente conjugadas, como X y P , es el valor constante 1, por lo que esta integral es realmente el valor medio de 1; por lo tanto, es 1, como sabíamos desde el principio, porque es dJ/dJ después de todo. Pero Heisenberg, Born y Jordan, a diferencia de Dirac, no estaban familiarizados con la teoría de los corchetes de Poisson, por lo que, para ellos, la diferenciación evaluaba efectivamente { X, P } en coordenadas J, θ .
El corchete de Poisson, a diferencia de la integral de acción, tiene una traducción simple a la mecánica matricial: normalmente corresponde a la parte imaginaria del producto de dos variables, el conmutador .
Para ver esto, examine el producto (antisimetrizado) de dos matrices A y B en el límite de correspondencia, donde los elementos de la matriz son funciones que varían lentamente del índice, teniendo en cuenta que la respuesta es cero clásicamente.
En el límite de correspondencia, cuando los índices m , n son grandes y cercanos, mientras que k , r son pequeños, la tasa de cambio de los elementos de la matriz en la dirección diagonal es el elemento de la matriz de la derivada J de la cantidad clásica correspondiente. Por lo tanto, es posible desplazar cualquier elemento de la matriz en diagonal a través de la correspondencia, donde el lado derecho es realmente solo el componente de Fourier ( m − n ) de dA / dJ en la órbita cercana a m para este orden semiclásico, no una matriz completa bien definida.
La derivada temporal semiclásica de un elemento de la matriz se obtiene hasta un factor i multiplicando por la distancia desde la diagonal, ya que el coeficiente A m ( m + k ) es semiclásicamente el k ésimo coeficiente de Fourier de la m ésima órbita clásica.
La parte imaginaria del producto de A y B se puede evaluar desplazando los elementos de la matriz para reproducir la respuesta clásica, que es cero.
El residuo distinto de cero principal se obtiene entonces en su totalidad mediante el desplazamiento. Dado que todos los elementos de la matriz se encuentran en índices que tienen una distancia pequeña con respecto a la posición del índice grande ( m , m ), resulta útil introducir dos notaciones temporales: A [ r , k ] = A ( m + r )( m + k ) para las matrices, y ( dA / dJ )[ r ] para los componentes de Fourier r'ésimos de las cantidades clásicas,
Invirtiendo la variable de suma en la primera suma de r a r ′ = k − r , el elemento de la matriz se convierte en , y queda claro que la parte principal (clásica) se cancela.
La parte cuántica principal, despreciando el producto de orden superior de las derivadas en la expresión residual, es entonces igual a , de modo que, finalmente, que puede identificarse con i veces el k -ésimo componente clásico de Fourier del corchete de Poisson.
El truco de diferenciación original de Heisenberg se extendió finalmente a una derivación semiclásica completa de la condición cuántica, en colaboración con Born y Jordan. Una vez que pudieron establecer que esta condición reemplazaba y ampliaba la antigua regla de cuantificación, permitía determinar los elementos matriciales de P y X para un sistema arbitrario simplemente a partir de la forma del hamiltoniano.
Se supuso que la nueva regla de cuantificación era universalmente cierta , aunque la derivación de la antigua teoría cuántica requería un razonamiento semiclásico. (Sin embargo, en la década de 1940 se consideró que un tratamiento cuántico completo para argumentos más elaborados de los corchetes equivalía a extender los corchetes de Poisson a los corchetes de Moyal ).
Para realizar la transición a la mecánica cuántica estándar, la adición más importante fue el vector de estado cuántico , ahora escrito | ψ ⟩, que es el vector sobre el que actúan las matrices. Sin el vector de estado, no está claro qué movimiento en particular describen las matrices de Heisenberg, ya que incluyen todos los movimientos en algún lugar.
La interpretación del vector de estado, cuyos componentes se escriben ψ m , fue proporcionada por Born. Esta interpretación es estadística: el resultado de una medición de la cantidad física correspondiente a la matriz A es aleatorio, con un valor medio igual a Alternativamente, y de manera equivalente, el vector de estado da la amplitud de probabilidad ψ n para que el sistema cuántico se encuentre en el estado de energía n .
Una vez que se introdujo el vector de estado, la mecánica matricial se pudo rotar a cualquier base , donde la matriz H ya no necesita ser diagonal. La ecuación de movimiento de Heisenberg en su forma original establece que A mn evoluciona en el tiempo como un componente de Fourier, que se puede reformular en forma diferencial y se puede replantear para que sea verdadera en una base arbitraria, al notar que la matriz H es diagonal con valores diagonales E m . Esta es ahora una ecuación matricial, por lo que se cumple en cualquier base. Esta es la forma moderna de la ecuación de movimiento de Heisenberg.
Su solución formal es:
Todas estas formas de la ecuación de movimiento anteriores dicen lo mismo, que A ( t ) es equivalente a A (0) , a través de una rotación de base por la matriz unitaria e iHt , una imagen sistemática dilucidada por Dirac en su notación de corchetes.
Por el contrario, al rotar la base del vector de estado en cada momento por e iHt , se puede deshacer la dependencia temporal en las matrices. Las matrices ahora son independientes del tiempo, pero el vector de estado rota, Esta es la ecuación de Schrödinger para el vector de estado, y este cambio de base dependiente del tiempo equivale a una transformación a la imagen de Schrödinger , con ⟨ x | ψ ⟩ = ψ ( x ).
En la mecánica cuántica, en la imagen de Heisenberg , el vector de estado , | ψ ⟩ no cambia con el tiempo, mientras que un observable A satisface la ecuación de movimiento de Heisenberg ,
El término adicional es para operadores como que tienen una dependencia temporal explícita , además de la dependencia temporal de la evolución unitaria analizada.
La imagen de Heisenberg no distingue entre tiempo y espacio, por lo que se adapta mejor a las teorías relativistas que la ecuación de Schrödinger. Además, la similitud con la física clásica es más manifiesta: las ecuaciones de movimiento hamiltonianas para la mecánica clásica se recuperan reemplazando el conmutador anterior por el corchete de Poisson (véase también más abajo). Por el teorema de Stone-von Neumann , la imagen de Heisenberg y la imagen de Schrödinger deben ser unitariamente equivalentes, como se detalla a continuación.
La mecánica matricial evolucionó rápidamente hasta convertirse en la mecánica cuántica moderna y produjo resultados físicos interesantes en los espectros de los átomos.
Jordan señaló que las relaciones de conmutación garantizan que P actúe como un operador diferencial .
La identidad del operador permite la evaluación del conmutador de P con cualquier potencia de X , e implica que , junto con la linealidad, implica que un conmutador P diferencia efectivamente cualquier función matricial analítica de X .
Suponiendo que los límites se definen sensatamente, esto se extiende a funciones arbitrarias, pero no es necesario hacer explícita la extensión hasta que se requiera un cierto grado de rigor matemático.
Como X es una matriz hermítica, debería ser diagonalizable y, a partir de la forma final de P, quedará claro que todo número real puede ser un valor propio. Esto hace que algunas de las matemáticas sean sutiles, ya que existe un vector propio independiente para cada punto del espacio.
En la base donde X es diagonal, un estado arbitrario puede escribirse como una superposición de estados con valores propios x , de modo que ψ ( x ) = ⟨ x | ψ ⟩, y el operador X multiplica cada vector propio por x ,
Defina un operador lineal D que diferencie ψ , y observe que para que el operador − iD obedezca la misma relación de conmutación que P . Por lo tanto, la diferencia entre P y − iD debe conmutar con X , por lo que puede diagonalizarse simultáneamente con X : su valor que actúa sobre cualquier estado propio de X es alguna función f del valor propio x .
Esta función debe ser real, porque tanto P como − iD son hermíticas, rotando cada estado por una fase f ( x ) , es decir, redefiniendo la fase de la función de onda: El operador iD se redefine por una cantidad: lo que significa que, en la base rotada, P es igual a − iD .
Por lo tanto, siempre hay una base para los valores propios de X donde se conoce la acción de P sobre cualquier función de onda: y el hamiltoniano en esta base es un operador diferencial lineal sobre los componentes del vector de estado,
Por lo tanto, la ecuación de movimiento para el vector de estado no es más que una famosa ecuación diferencial,
Como D es un operador diferencial, para que se pueda definir de forma sensata, deben existir valores propios de X que sean vecinos de cada valor dado. Esto sugiere que la única posibilidad es que el espacio de todos los valores propios de X sean todos los números reales, y que P sea iD, hasta una rotación de fase .
Para que esto sea riguroso es necesario un análisis sensato del espacio límite de funciones, y en este espacio se trata del teorema de Stone-von Neumann : cualesquiera operadores X y P que obedezcan las relaciones de conmutación pueden actuar sobre un espacio de funciones de onda, siendo P un operador derivado. Esto implica que siempre se dispone de una imagen de Schrödinger.
La mecánica matricial se extiende fácilmente a muchos grados de libertad de manera natural. Cada grado de libertad tiene un operador X independiente y un operador diferencial efectivo independiente P , y la función de onda es una función de todos los valores propios posibles de las variables X conmutativas independientes .
En particular, esto significa que un sistema de N partículas interactuantes en 3 dimensiones se describe mediante un vector cuyos componentes en una base donde todas las X son diagonales es una función matemática de un espacio 3 N -dimensional que describe todas sus posibles posiciones , efectivamente una colección de valores mucho mayor que la mera colección de N funciones de onda tridimensionales en un espacio físico. Schrödinger llegó a la misma conclusión de forma independiente y, finalmente, demostró la equivalencia de su propio formalismo con el de Heisenberg.
Como la función de onda es una propiedad de todo el sistema, no de una sola parte, la descripción en mecánica cuántica no es completamente local. La descripción de varias partículas cuánticas las tiene correlacionadas o entrelazadas . Este entrelazamiento conduce a correlaciones extrañas entre partículas distantes que violan la desigualdad clásica de Bell .
Incluso si las partículas solo pueden estar en dos posiciones, la función de onda para N partículas requiere 2 N números complejos, uno para cada configuración total de posiciones. Esto es exponencialmente muchos números en N , por lo que simular la mecánica cuántica en una computadora requiere recursos exponenciales. Por el contrario, esto sugiere que podría ser posible encontrar sistemas cuánticos de tamaño N que calculen físicamente las respuestas a problemas que clásicamente requieren 2 N bits para resolverse. Esta es la aspiración detrás de la computación cuántica .
Para los operadores independientes del tiempo X y P , ∂ A /∂ t = 0 , por lo que la ecuación de Heisenberg anterior se reduce a: [30] donde los corchetes [ , ] denotan el conmutador. Para un hamiltoniano que es , los operadores X y P satisfacen: donde el primero es clásicamente la velocidad , y el segundo es clásicamente la fuerza o gradiente de potencial . Estos reproducen la forma de Hamilton de las leyes de movimiento de Newton . En la imagen de Heisenberg, los operadores X y P satisfacen las ecuaciones clásicas de movimiento. Puede tomar el valor esperado de ambos lados de la ecuación para ver que, en cualquier estado | ψ ⟩:
De modo que las leyes de Newton se cumplen exactamente con los valores esperados de los operadores en cualquier estado dado. Este es el teorema de Ehrenfest , que es un corolario obvio de las ecuaciones de movimiento de Heisenberg, pero es menos trivial en la teoría de Schrödinger, donde Ehrenfest lo descubrió.
En mecánica clásica, una transformación canónica de las coordenadas del espacio de fases es aquella que conserva la estructura de los corchetes de Poisson. Las nuevas variables x ′, p ′ tienen los mismos corchetes de Poisson entre sí que las variables originales x , p . La evolución temporal es una transformación canónica, ya que el espacio de fases en cualquier momento es una elección de variables tan buena como el espacio de fases en cualquier otro momento.
El flujo hamiltoniano es la transformación canónica :
Dado que el hamiltoniano puede ser una función arbitraria de x y p , existen transformaciones canónicas infinitesimales correspondientes a cada cantidad clásica G , donde G sirve como el hamiltoniano para generar un flujo de puntos en el espacio de fases para un incremento de tiempo s ,
Para una función general A ( x , p ) en el espacio de fases, su cambio infinitesimal en cada paso ds bajo este mapa es La cantidad G se denomina generador infinitesimal de la transformación canónica.
En mecánica cuántica, el análogo cuántico G es ahora una matriz hermítica, y las ecuaciones de movimiento están dadas por conmutadores,
Los movimientos canónicos infinitesimales pueden integrarse formalmente, tal como se integró la ecuación de movimiento de Heisenberg, donde U = e iGs y s es un parámetro arbitrario.
La definición de una transformación canónica cuántica es, por tanto, un cambio de base unitario arbitrario en el espacio de todos los vectores de estado. U es una matriz unitaria arbitraria, una rotación compleja en el espacio de fases, Estas transformaciones dejan invariante la suma del cuadrado absoluto de los componentes de la función de onda , mientras que llevan estados que son múltiplos entre sí (incluidos estados que son múltiplos imaginarios entre sí) a estados que son el mismo múltiplo entre sí.
La interpretación de las matrices es que actúan como generadores de movimientos en el espacio de estados .
Por ejemplo, el movimiento generado por P se puede encontrar resolviendo la ecuación de movimiento de Heisenberg usando P como hamiltoniano. Estas son traslaciones de la matriz X por un múltiplo de la matriz identidad. Esta es la interpretación del operador derivado D : e iPs = e D , la exponencial de un operador derivado es una traslación (por lo tanto, el operador de desplazamiento de Lagrange ).
El operador X también genera traslaciones en P. El hamiltoniano genera traslaciones en el tiempo , el momento angular genera rotaciones en el espacio físico y el operador X 2 + P 2 genera rotaciones en el espacio de fases .
Cuando una transformación, como una rotación en el espacio físico, conmuta con el hamiltoniano, la transformación se denomina simetría ( detrás de una degeneración) del hamiltoniano: el hamiltoniano expresado en términos de coordenadas rotadas es el mismo que el hamiltoniano original. Esto significa que el cambio en el hamiltoniano bajo el generador de simetría infinitesimal L se desvanece.
De ello se deduce que el cambio en el generador bajo la traslación temporal también se desvanece, de modo que la matriz L es constante en el tiempo: se conserva.
La asociación biunívoca de los generadores de simetría infinitesimal y las leyes de conservación fue descubierta por Emmy Noether para la mecánica clásica, donde los conmutadores son corchetes de Poisson , pero el razonamiento mecánico-cuántico es idéntico. En mecánica cuántica, cualquier transformación de simetría unitaria produce una ley de conservación, ya que si la matriz U tiene la propiedad de que entonces se sigue que y que la derivada temporal de U es cero, se conserva.
Los valores propios de las matrices unitarias son fases puras, de modo que el valor de una cantidad conservada unitaria es un número complejo de magnitud unitaria, no un número real. Otra forma de decir esto es que una matriz unitaria es la exponencial de i por una matriz hermítica, de modo que la cantidad real conservada aditiva, la fase, solo está bien definida hasta un múltiplo entero de 2π . Solo cuando la matriz de simetría unitaria es parte de una familia que se acerca arbitrariamente a la identidad, las cantidades reales conservadas son univaluadas, y entonces la exigencia de que se conserven se convierte en una restricción mucho más exigente.
Las simetrías que se pueden conectar de forma continua a la identidad se denominan continuas y, por ejemplo, las traslaciones, las rotaciones y los impulsos. Las simetrías que no se pueden conectar de forma continua a la identidad son discretas y, por ejemplo, la operación de inversión espacial o paridad y la conjugación de carga .
La interpretación de las matrices como generadoras de transformaciones canónicas se debe a Paul Dirac. [31] Eugene Wigner demostró que la correspondencia entre simetrías y matrices es completa si se incluyen matrices antiunitarias que describen simetrías que incluyen inversión temporal.
Para Heisenberg estaba físicamente claro que los cuadrados absolutos de los elementos de la matriz de X , que son los coeficientes de Fourier de la oscilación, darían la tasa de emisión de radiación electromagnética.
En el límite clásico de órbitas grandes, si una carga con posición X ( t ) y carga q oscila junto a una carga igual y opuesta en la posición 0, el momento dipolar instantáneo es q X ( t ) , y la variación temporal de este momento se traduce directamente en la variación espacio-temporal del potencial vectorial, lo que produce ondas esféricas salientes anidadas.
Para los átomos, la longitud de onda de la luz emitida es aproximadamente 10.000 veces el radio atómico, y el momento dipolar es la única contribución al campo radiativo, mientras que todos los demás detalles de la distribución de carga atómica pueden ignorarse.
Ignorando la reacción inversa, la potencia radiada en cada modo saliente es una suma de contribuciones separadas del cuadrado de cada modo de Fourier de tiempo independiente de d ,
Ahora bien, en la representación de Heisenberg, los coeficientes de Fourier del momento dipolar son los elementos de la matriz de X . Esta correspondencia permitió a Heisenberg proporcionar la regla para las intensidades de transición, la fracción del tiempo en que, a partir de un estado inicial i , se emite un fotón y el átomo salta a un estado final j ,
Esto permitió entonces interpretar estadísticamente la magnitud de los elementos de la matriz: dan la intensidad de las líneas espectrales, la probabilidad de saltos cuánticos a partir de la emisión de radiación dipolar .
Dado que las tasas de transición están dadas por los elementos de la matriz de X , siempre que X ij sea cero, la transición correspondiente debería estar ausente. Estas se denominaban reglas de selección y eran un enigma hasta la llegada de la mecánica matricial.
Un estado arbitrario del átomo de hidrógeno, ignorando el espín, se etiqueta por | n ; ℓ , m ⟩, donde el valor de ℓ es una medida del momento angular orbital total y m es su componente z , que define la orientación de la órbita. Los componentes del pseudovector de momento angular son donde los productos en esta expresión son independientes del orden y reales, porque diferentes componentes de X y P conmutan.
Las relaciones de conmutación de L con las tres matrices de coordenadas X , Y , Z ( o con cualquier vector) son fáciles de encontrar, lo que confirma que el operador L genera rotaciones entre los tres componentes del vector de matrices de coordenadas X.
A partir de esto, se puede leer el conmutador de L z y las matrices de coordenadas X , Y , Z ,
Esto significa que las cantidades X + iY , X − iY tienen una regla de conmutación simple,
Al igual que los elementos matriciales de X + iP y X − iP para el hamiltoniano del oscilador armónico, esta ley de conmutación implica que estos operadores solo tienen ciertos elementos matriciales fuera de la diagonal en estados de m definido , lo que significa que la matriz ( X + iY ) toma un vector propio de L z con valor propio m a un vector propio con valor propio m + 1. De manera similar, ( X − iY ) disminuye m en una unidad, mientras que Z no cambia el valor de m .
Así, en una base de | ℓ , m ⟩ estados donde L 2 y L z tienen valores definidos, los elementos de la matriz de cualquiera de los tres componentes de la posición son cero, excepto cuando m es el mismo o cambia en una unidad.
Esto impone una restricción al cambio en el momento angular total. Cualquier estado puede rotarse de modo que su momento angular esté en la dirección z tanto como sea posible, donde m = ℓ . El elemento de matriz de la posición que actúa sobre | ℓ , m ⟩ solo puede producir valores de m que sean mayores en una unidad, de modo que si las coordenadas se rotan de modo que el estado final sea | ℓ',ℓ' ⟩, el valor de ℓ' puede ser como máximo uno mayor que el valor más grande de ℓ que ocurre en el estado inicial. Por lo tanto, ℓ ' es como máximo ℓ + 1.
Los elementos de la matriz se desvanecen para ℓ ' > ℓ + 1 , y el elemento de la matriz inversa está determinado por la hermiticidad, por lo que estos también se desvanecen cuando ℓ' < ℓ − 1: Las transiciones dipolares están prohibidas con un cambio en el momento angular de más de una unidad.
La ecuación de movimiento de Heisenberg determina los elementos de la matriz de P en la base de Heisenberg a partir de los elementos de la matriz de X , lo que convierte la parte diagonal de la relación de conmutación en una regla de suma para la magnitud de los elementos de la matriz:
Esto produce una relación para la suma de las intensidades espectroscópicas hacia y desde cualquier estado dado, aunque para que sea absolutamente correcta, las contribuciones de la probabilidad de captura radiativa para estados de dispersión no ligados deben incluirse en la suma: