En física , específicamente en la mecánica cuántica relativista (RQM) y sus aplicaciones a la física de partículas , las ecuaciones de onda relativistas predicen el comportamiento de partículas a altas energías y velocidades comparables a la velocidad de la luz . En el contexto de la teoría cuántica de campos (QFT), las ecuaciones determinan la dinámica de los campos cuánticos . Las soluciones de las ecuaciones, universalmente denotadas como ψ o Ψ ( del griego psi ), se denominan " funciones de onda " en el contexto de la RQM y " campos " en el contexto de la QFT. Las ecuaciones en sí mismas se denominan "ecuaciones de onda" o "ecuaciones de campo", porque tienen la forma matemática de una ecuación de onda o se generan a partir de una densidad lagrangiana y las ecuaciones de Euler-Lagrange de teoría de campos (consulte la teoría clásica de campos para obtener información).
En la imagen de Schrödinger , la función de onda o campo es la solución de la ecuación de Schrödinger , uno de los postulados de la mecánica cuántica . Todas las ecuaciones de onda relativistas se pueden construir especificando varias formas del operador hamiltoniano Ĥ que describe el sistema cuántico . Alternativamente, la formulación de la integral de trayectoria de Feynman utiliza un operador lagrangiano en lugar de un operador hamiltoniano.
De manera más general, el formalismo moderno detrás de las ecuaciones de onda relativistas es la teoría de grupos de Lorentz , en donde el espín de la partícula tiene una correspondencia con las representaciones del grupo de Lorentz . [1]
El fracaso de la mecánica clásica aplicada a sistemas moleculares , atómicos , nucleares y de menor tamaño indujo la necesidad de una nueva mecánica: la mecánica cuántica . La formulación matemática fue liderada por De Broglie , Bohr , Schrödinger , Pauli y Heisenberg , y otros, alrededor de mediados de la década de 1920, y en ese momento era análoga a la de la mecánica clásica. La ecuación de Schrödinger y la imagen de Heisenberg se asemejan a las ecuaciones clásicas de movimiento en el límite de los grandes números cuánticos y a medida que la constante de Planck reducida ħ , el cuanto de acción , tiende a cero. Este es el principio de correspondencia . En este punto, la relatividad especial no estaba completamente combinada con la mecánica cuántica, por lo que las formulaciones de Schrödinger y Heisenberg, tal como se propusieron originalmente, no podían usarse en situaciones donde las partículas viajan cerca de la velocidad de la luz , o cuando el número de cada tipo de partícula cambia (esto sucede en interacciones de partículas reales ; las numerosas formas de desintegración de partículas , aniquilación , creación de materia , producción de pares , etc.).
Muchos físicos teóricos desde finales de la década de 1920 hasta mediados de la década de 1940 buscaron una descripción de los sistemas mecánicos cuánticos que pudieran explicar los efectos relativistas . [2] La primera base para la mecánica cuántica relativista , es decir, la relatividad especial aplicada con la mecánica cuántica en conjunto, fue encontrada por todos aquellos que descubrieron lo que frecuentemente se denomina la ecuación de Klein-Gordon :
insertando el operador de energía y el operador de momento en la relación relativista energía-momento :
Las soluciones de ( 1 ) son campos escalares . La ecuación de KG es indeseable debido a su predicción de energías y probabilidades negativas , como resultado de la naturaleza cuadrática de ( 2 ), inevitable en una teoría relativista. Esta ecuación fue propuesta inicialmente por Schrödinger, y la descartó por tales razones, solo para darse cuenta unos meses después de que su límite no relativista (lo que ahora se llama la ecuación de Schrödinger ) todavía era importante. Sin embargo, ( 1 ) es aplicable a bosones de espín 0. [3]
Ni las ecuaciones relativistas ni las no relativistas encontradas por Schrödinger podían predecir la estructura fina en la serie espectral del hidrógeno . La misteriosa propiedad subyacente era el espín . Las primeras matrices de espín bidimensionales (mejor conocidas como matrices de Pauli ) fueron introducidas por Pauli en la ecuación de Pauli ; la ecuación de Schrödinger con un hamiltoniano no relativista que incluía un término adicional para partículas en campos magnéticos , pero esto era fenomenológico . Weyl encontró una ecuación relativista en términos de las matrices de Pauli; la ecuación de Weyl , para espín sin masa .1/2 fermiones. El problema fue resuelto por Dirac a finales de la década de 1920, cuando amplió la aplicación de la ecuación ( 2 ) al electrón : mediante diversas manipulaciones, factorizó la ecuación en la forma:
y uno de estos factores es la ecuación de Dirac (ver abajo), al insertar los operadores de energía y momento. Por primera vez, esto introdujo nuevas matrices de espín de cuatro dimensiones α y β en una ecuación de onda relativista, y explicó la estructura fina del hidrógeno. Las soluciones de ( 3A ) son campos de espín multicomponentes , y cada componente satisface ( 1 ). Un resultado notable de las soluciones de espín es que la mitad de los componentes describen una partícula mientras que la otra mitad describe una antipartícula ; en este caso el electrón y el positrón . Ahora se sabe que la ecuación de Dirac se aplica a todos los espín-1/2 fermiones . En el límite no relativista se recupera la ecuación de Pauli, mientras que en el caso sin masa resulta la ecuación de Weyl.
Aunque es un hito en la teoría cuántica, la ecuación de Dirac solo es válida para el espín-1/2fermiones , y todavía predice soluciones de energía negativa, lo que causó controversia en ese momento (en particular, no todos los físicos se sentían cómodos con el " mar de Dirac " de estados de energía negativa).
El problema natural se hizo evidente: generalizar la ecuación de Dirac a partículas con cualquier espín ; tanto fermiones como bosones, y en las mismas ecuaciones sus antipartículas (posible debido al formalismo de espinor introducido por Dirac en su ecuación, y a los desarrollos entonces recientes en el cálculo de espinor por van der Waerden en 1929), e idealmente con soluciones de energía positiva. [2]
Majorana introdujo y resolvió este problema en 1932, mediante un enfoque diferente al de Dirac. Majorana consideró una "raíz" de ( 3A ):
donde ψ es un campo de espinores ahora con infinitos componentes, irreducible a un número finito de tensores o espinores, para eliminar la indeterminación en el signo. Las matrices α y β son matrices de dimensión infinita, relacionadas con transformaciones infinitesimales de Lorentz . No exigió que cada componente de 3B satisficiera la ecuación ( 2 ); en cambio, regeneró la ecuación utilizando una acción invariante de Lorentz , a través del principio de mínima acción y la aplicación de la teoría de grupos de Lorentz . [4] [5]
Majorana produjo otras contribuciones importantes que no fueron publicadas, incluyendo ecuaciones de onda de varias dimensiones (5, 6 y 16). Fueron anticipadas más tarde (de una manera más elaborada) por de Broglie (1934), y Duffin, Kemmer y Petiau (alrededor de 1938-1939) véase Álgebra de Duffin-Kemmer-Petiau . El formalismo de Dirac-Fierz-Pauli era más sofisticado que el de Majorana, ya que los espinores eran nuevas herramientas matemáticas a principios del siglo XX, aunque el artículo de Majorana de 1932 era difícil de entender por completo; Pauli y Wigner tardaron algún tiempo en entenderlo, alrededor de 1940. [2]
Dirac en 1936, y Fierz y Pauli en 1939, construyeron ecuaciones a partir de los espinores irreducibles A y B , simétricos en todos los índices, para una partícula masiva de espín n + 1 ⁄ 2 para el entero n (véase la notación de Van der Waerden para el significado de los índices punteados):
donde p es el momento como operador de espinor covariante. Para n = 0 , las ecuaciones se reducen a las ecuaciones de Dirac acopladas y A y B juntas se transforman como el espinor de Dirac original . La eliminación de A o B muestra que A y B cumplen ( 1 ). [2] La derivación directa de las ecuaciones de Dirac-Pauli-Fierz usando los operadores de Bargmann-Wigner se da en. [6]
En 1941, Rarita y Schwinger se centraron en partículas de espín 3 ⁄ 2 y derivaron la ecuación de Rarita-Schwinger , incluyendo un lagrangiano para generarla, y más tarde generalizaron las ecuaciones análogas a espín n + 1 ⁄ 2 para el entero n . En 1945, Pauli sugirió el artículo de Majorana de 1932 a Bhabha , quien volvió a las ideas generales introducidas por Majorana en 1932. Bhabha y Lubanski propusieron un conjunto completamente general de ecuaciones reemplazando los términos de masa en ( 3A ) y ( 3B ) por una constante arbitraria, sujeta a un conjunto de condiciones que las funciones de onda deben obedecer. [7]
Finalmente, en el año 1948 (el mismo año en que se formuló la formulación de la integral de trayectorias de Feynman ), Bargmann y Wigner formularon la ecuación general para partículas masivas que podrían tener cualquier espín, considerando la ecuación de Dirac con un espín de componentes finitos totalmente simétrico, y utilizando la teoría de grupos de Lorentz (como lo hizo Majorana): las ecuaciones de Bargmann-Wigner . [2] [8] A principios de la década de 1960, H. Joos y Steven Weinberg hicieron una reformulación de las ecuaciones de Bargmann-Wigner , la ecuación de Joos-Weinberg . Varios teóricos en este momento realizaron más investigaciones en hamiltonianos relativistas para partículas de espín más alto. [1] [9] [10]
La descripción relativista de las partículas de espín ha sido un problema difícil en la teoría cuántica. Todavía es un área de investigación actual porque el problema está resuelto solo parcialmente; incluir interacciones en las ecuaciones es problemático y aún existen predicciones paradójicas (incluso a partir de la ecuación de Dirac). [5]
Las siguientes ecuaciones tienen soluciones que satisfacen el principio de superposición , es decir, las funciones de onda son aditivas .
En todo el texto se utilizan las convenciones estándar de notación de índices tensoriales y notación de barras de Feynman , incluidos los índices griegos que toman los valores 1, 2, 3 para los componentes espaciales y 0 para el componente temporal de las cantidades indexadas. Las funciones de onda se denotan ψ y ∂ μ son los componentes del operador de cuatro gradientes .
En ecuaciones matriciales , las matrices de Pauli se denotan por σ μ en la que μ = 0, 1, 2, 3 , donde σ 0 es la matriz identidad 2 × 2 : y las otras matrices tienen sus representaciones habituales. La expresión es un operador matricial 2 × 2 que actúa sobre campos de espinores de 2 componentes .
Las matrices gamma se denotan por γ μ , en la que nuevamente μ = 0, 1, 2, 3 , y hay varias representaciones para elegir. La matriz γ 0 no es necesariamente la matriz identidad 4 × 4 . La expresión es un operador de matriz 4 × 4 que actúa sobre campos de espinores de 4 componentes .
Tenga en cuenta que términos como " mc " multiplican escalarmente una matriz identidad de la dimensión relevante , los tamaños comunes son 2 × 2 o 4 × 4 y convencionalmente no se escriben para simplificar.
La ecuación de Duffin-Kemmer-Petiau es una ecuación alternativa para partículas de espín 0 y espín 1:
Comience con los 4 vectores de la relatividad especial (SR) estándar
Nótese que cada 4-vector está relacionado con otro mediante un escalar de Lorentz :
Ahora, simplemente aplique la regla del producto escalar de Lorentz estándar a cada uno:
La última ecuación es una relación cuántica fundamental.
Cuando se aplica a un campo escalar de Lorentz , se obtiene la ecuación de Klein-Gordon, la más básica de las ecuaciones de onda relativistas cuánticas.
La ecuación de Schrödinger es el caso límite de baja velocidad ( v ≪ c ) de la ecuación de Klein-Gordon .
Cuando la relación se aplica a un campo de cuatro vectores en lugar de a un campo escalar de Lorentz , se obtiene la ecuación de Proca (en calibre de Lorenz ):
Si el término de masa en reposo se establece en cero (partículas similares a la luz), entonces esto da la ecuación de Maxwell libre (en calibre de Lorenz )
Bajo una transformación ortócrona adecuada de Lorentz x → Λ x en el espacio de Minkowski , todos los estados cuánticos de una partícula ψ j σ de espín j con componente de espín z σ se transforman localmente bajo alguna representación D del grupo de Lorentz : [12] [13] donde D (Λ) es alguna representación de dimensión finita, es decir, una matriz. Aquí ψ se considera como un vector columna que contiene componentes con los valores permitidos de σ . Se suprimen los números cuánticos j y σ , así como otras etiquetas, continuas o discretas, que representan otros números cuánticos. Un valor de σ puede aparecer más de una vez dependiendo de la representación. A continuación se consideran representaciones con varios valores posibles para j .
Las representaciones irreducibles se etiquetan mediante un par de semienteros o enteros ( A , B ) . A partir de estos, se pueden construir todas las demás representaciones utilizando una variedad de métodos estándar, como tomar productos tensoriales y sumas directas . En particular, el espacio-tiempo en sí mismo constituye una representación de 4 vectores ( 1/2 , 1/2 ) de modo que Λ ∈ D (1/2, 1/2) . Para poner esto en contexto; los espinores de Dirac se transforman bajo la ( 1/2 , 0) ⊕ (0, 1/2) representación . En general, el espacio de representación ( A , B ) tiene subespacios que bajo el subgrupo de rotaciones espaciales , SO(3) , se transforman irreduciblemente como objetos de espín j , donde cada valor permitido: ocurre exactamente una vez. [14] En general, los productos tensoriales de representaciones irreducibles son reducibles; se descomponen como sumas directas de representaciones irreducibles.
Las representaciones D ( j , 0) y D (0, j ) pueden representar por separado partículas de espín j . Un estado o campo cuántico en una representación de este tipo no satisfaría ninguna ecuación de campo excepto la ecuación de Klein–Gordon.
Hay ecuaciones que tienen soluciones que no satisfacen el principio de superposición.