stringtranslate.com

ecuación de dirac

En física de partículas , la ecuación de Dirac es una ecuación de onda relativista derivada por el físico británico Paul Dirac en 1928. En su forma libre, o incluyendo interacciones electromagnéticas, describe todas las partículas masivas de espín 12 , llamadas "partículas de Dirac", como electrones y quarks para los cuales la paridad es una simetría . Es consistente tanto con los principios de la mecánica cuántica como con la teoría de la relatividad especial , [1] y fue la primera teoría que explica completamente la relatividad especial en el contexto de la mecánica cuántica. Fue validado teniendo en cuenta la estructura fina del espectro del hidrógeno de una forma completamente rigurosa.

La ecuación implicaba también la existencia de una nueva forma de materia, la antimateria , hasta entonces insospechada y no observada y que fue confirmada experimentalmente varios años después. También proporcionó una justificación teórica para la introducción de varias funciones de onda componentes en la teoría fenomenológica del espín de Pauli . Las funciones de onda en la teoría de Dirac son vectores de cuatro números complejos (conocidos como bispinores ), dos de los cuales se parecen a la función de onda de Pauli en el límite no relativista, a diferencia de la ecuación de Schrödinger , que describía funciones de onda de un solo valor complejo. Además, en el límite de masa cero, la ecuación de Dirac se reduce a la ecuación de Weyl .

Aunque al principio Dirac no apreció plenamente la importancia de sus resultados, la explicación que implicaba del espín como consecuencia de la unión de la mecánica cuántica y la relatividad (y el eventual descubrimiento del positrón ) representa uno de los grandes triunfos de la física teórica . Este logro ha sido descrito como totalmente a la par de los trabajos de Newton , Maxwell y Einstein antes que él. [2] Algunos físicos lo han considerado la "verdadera semilla de la física moderna". [3] En el contexto de la teoría cuántica de campos , la ecuación de Dirac se reinterpreta para describir campos cuánticos correspondientes a partículas de espín 12 .

La ecuación de Dirac está inscrita en una placa en el suelo de la Abadía de Westminster . Inaugurada el 13 de noviembre de 1995, la placa conmemora la vida de Paul Dirac. [4]

formulación matemática

En su formulación moderna para la teoría de campos, la ecuación de Dirac se escribe en términos de un campo de espinor de Dirac que toma valores en un espacio vectorial complejo descrito concretamente como , definido en un espaciotiempo plano ( espacio de Minkowski ) . Su expresión también contiene matrices gamma y un parámetro interpretado como masa, así como otras constantes físicas. Dirac obtuvo por primera vez su ecuación mediante una factorización de la relación de equivalencia energía-momento-masa de Einstein asumiendo un producto escalar de vectores de momento determinado por el tensor métrico y cuantizó la relación resultante asociando momentos a sus respectivos operadores.

En términos de un campo , la ecuación de Dirac es entonces

ecuación de dirac

y en unidades naturales , con notación de barra diagonal de Feynman ,

Ecuación de Dirac (unidades naturales)

Las matrices gamma son un conjunto de cuatro matrices complejas (elementos de ) que satisfacen las relaciones anticonmutación definitorias:

matrices de Pauli

La notación de barra diagonal es una notación compacta para

Adjunto de Dirac y la ecuación adjunta

El adjunto de Dirac del campo de espinor se define como

Ecuación de Klein-Gordon

Aplicando a la ecuación de Dirac se obtiene

ecuación de Klein-Gordon

corriente conservada

Una corriente conservada de la teoría es

Prueba de conservación a partir de la ecuación de Dirac

Sumar las ecuaciones de Dirac y las ecuaciones de Dirac adjuntas da como resultado

Entonces, según la regla de Leibniz,

Otro enfoque para derivar esta expresión es mediante métodos variacionales, aplicando el teorema de Noether para la simetría global para derivar la corriente conservada.

Prueba de conservación del teorema de Noether

Recuerde que el lagrangiano es

Bajo una simetría que envía
encontramos que el lagrangiano es invariante.

Ahora, considerando que el parámetro de variación es infinitesimal, trabajamos en primer orden e ignoramos los términos. De la discusión anterior vemos inmediatamente que la variación explícita en el lagrangiano debido a está desapareciendo, es decir, bajo la variación,

dónde .

Como parte del teorema de Noether, encontramos la variación implícita en el Lagrangiano debido a la variación de campos. Si se satisfacen las ecuaciones de movimiento para , entonces

Esto se simplifica inmediatamente ya que no hay derivadas parciales de en el lagrangiano. es la variación infinitesimal

evaluamos
La ecuación ( * ) se convierte en
y terminamos.

Soluciones

Dado que el operador de Dirac actúa sobre 4 tuplas de funciones integrables al cuadrado , sus soluciones deben ser miembros del mismo espacio de Hilbert . El hecho de que las energías de las soluciones no tengan un límite inferior es inesperado.

Soluciones de onda plana

Las soluciones de onda plana son aquellas que surgen de un ansatz.

Para este ansatz, la ecuación de Dirac se convierte en una ecuación para :

aquí

Por ejemplo, en la representación quiral de , el espacio de solución está parametrizado por un vector , con

Estas soluciones de onda plana proporcionan un punto de partida para la cuantificación canónica.

formulación lagrangiana

Tanto la ecuación de Dirac como la ecuación de Dirac adjunta se pueden obtener a partir de (variando) la acción con una densidad lagrangiana específica que viene dada por:

Si se varía esto con respecto a se obtiene la ecuación de Dirac adjunta. Mientras tanto, si se varía esto con respecto a se obtiene la ecuación de Dirac.

En unidades naturales y con la notación de barra, la acción es entonces

Acción de Dirac

Para esta acción, la corriente conservada anterior surge como la corriente conservada correspondiente a la simetría global mediante el teorema de Noether para la teoría de campos. Medir esta teoría de campo cambiando la simetría a una local, dependiente del punto del espacio-tiempo, proporciona simetría de calibre (en realidad, redundancia de calibre). La teoría resultante es la electrodinámica cuántica o QED. Consulte a continuación para obtener una discusión más detallada.

invariancia de Lorentz

La ecuación de Dirac es invariante bajo transformaciones de Lorentz, es decir, bajo la acción del grupo de Lorentz o estrictamente , el componente conectado a la identidad.

Para un espinor de Dirac visto concretamente tomando valores , la transformación bajo una transformación de Lorentz viene dada por una matriz compleja . Hay algunas sutilezas en la definición de la notación correspondiente , así como un abuso estándar de notación.

La mayoría de los tratamientos ocurren en el nivel de álgebra de Lie . Para un tratamiento más detallado consulte aquí . El grupo de Lorentz de matrices reales que actúan es generado por un conjunto de seis matrices con componentes

Estos satisfacen las relaciones de conmutación del álgebra de Lorentz.

álgebra de Dirac

Una transformación de Lorentz se puede escribir como

La transformación correspondiente en el espacio de espín es

Bajo una transformación de Lorentz, la ecuación de Dirac

Resto de la prueba de invariancia de Lorentz

Multiplicar ambos lados desde la izquierda por y devolver la variable ficticia a da

Habremos mostrado invariancia si
o equivalente
Esto se muestra más fácilmente en el nivel de álgebra. Suponiendo que las transformaciones están parametrizadas por componentes infinitesimales , entonces en el primer orden , en el lado izquierdo obtenemos
mientras que en el lado derecho tenemos
Es un ejercicio estándar evaluar el conmutador del lado izquierdo. Escribir en términos de componentes completa la prueba.

Asociada a la invariancia de Lorentz hay una corriente de Noether conservada, o más bien un tensor de corrientes de Noether conservadas . De manera similar, dado que la ecuación es invariante bajo traslaciones, existe un tensor de corrientes de Noether conservadas , que puede identificarse como el tensor de tensión-energía de la teoría. La corriente de Lorentz se puede escribir en términos del tensor tensión-energía además de un tensor que representa el momento angular interno.

Desarrollos históricos y más detalles matemáticos.

La ecuación de Dirac también se utilizó (históricamente) para definir una teoría mecánico-cuántica que, en cambio, se interpreta como una función de onda .

La ecuación de Dirac en la forma propuesta originalmente por Dirac es: [5]

ψ ( x , t )función de ondamasa en reposo mespacio-temporales x , tp 1 , p 2 , p 3momentooperador de momentoecuación de Schrödingercvelocidad de la luzħconstante de Planck reducidaconstantes físicas

El propósito de Dirac al formular esta ecuación era explicar el comportamiento del electrón que se mueve relativistamente y así permitir que el átomo sea tratado de una manera consistente con la relatividad. Su esperanza más bien modesta era que las correcciones introducidas de esta manera pudieran tener alguna relación con el problema de los espectros atómicos .

Hasta entonces, los intentos de hacer compatible la antigua teoría cuántica del átomo con la teoría de la relatividad, que se basaban en la discretización del momento angular almacenado en la órbita posiblemente no circular del electrón del núcleo atómico , habían fracasado, y la nueva La mecánica cuántica de Heisenberg , Pauli , Jordan , Schrödinger y el propio Dirac no se había desarrollado lo suficiente para tratar este problema. Aunque las intenciones originales de Dirac quedaron satisfechas, su ecuación tuvo implicaciones mucho más profundas para la estructura de la materia e introdujo nuevas clases matemáticas de objetos que ahora son elementos esenciales de la física fundamental.

Los nuevos elementos en esta ecuación son las cuatro matrices de 4 × 4 α 1 , α 2 , α 3 y β , y la función de onda de cuatro componentes ψ . Hay cuatro componentes en ψ porque su evaluación en cualquier punto dado en el espacio de configuración es un bispinor . Se interpreta como una superposición de un electrón de espín ascendente , un electrón de espín descendente, un positrón de espín ascendente y un positrón de espín descendente.

Las matrices 4 × 4 α k y β son todas hermitianas y son involutivas :

se oponen

Estas matrices y la forma de la función de onda tienen un profundo significado matemático. La estructura algebraica representada por las matrices gamma había sido creada unos 50 años antes por el matemático inglés WK Clifford . A su vez, las ideas de Clifford habían surgido del trabajo de mediados del siglo XIX del matemático alemán Hermann Grassmann en su Lineare Ausdehnungslehre ( Teoría de la expansión lineal ). Esto último había sido considerado casi incomprensible por la mayoría de sus contemporáneos. La aparición de algo tan aparentemente abstracto, en una fecha tan tardía y de una manera física tan directa, es uno de los capítulos más notables de la historia de la física. [ cita necesaria ] (Más aún, una validación de la exquisita visión mostrada por los matemáticos Grassmann y Clifford).

La única ecuación simbólica se descompone así en cuatro ecuaciones diferenciales parciales lineales acopladas de primer orden para las cuatro cantidades que componen la función de onda. La ecuación se puede escribir más explícitamente en unidades de Planck como: [6]

Hacer relativista la ecuación de Schrödinger

La ecuación de Dirac es superficialmente similar a la ecuación de Schrödinger para una partícula libre masiva :

El lado izquierdo representa el cuadrado del operador de momento dividido por el doble de la masa, que es la energía cinética no relativista. Debido a que la relatividad trata el espacio y el tiempo como un todo, una generalización relativista de esta ecuación requiere que las derivadas del espacio y del tiempo entren simétricamente como lo hacen en las ecuaciones de Maxwell que gobiernan el comportamiento de la luz: las ecuaciones deben ser diferencialmente del mismo orden en el espacio. y tiempo. En relatividad, el impulso y las energías son las partes espacio y tiempo de un vector espacio-temporal, el cuatro impulso , y están relacionados por la relación relativistamente invariante.

que dice que la longitud de este cuatro vectores es proporcional a la masa en reposo m . La sustitución de los operadores equivalentes de la energía y el momento de la teoría de Schrödinger produce la ecuación de Klein-Gordon que describe la propagación de ondas, construida a partir de objetos relativistas invariantes,

ϕdensidad de probabilidad

El hecho de que la densidad sea positiva definida y convectiva de acuerdo con esta ecuación de continuidad implica que se puede integrar la densidad en un determinado dominio y establecer el total en 1, y esta condición se mantendrá mediante la ley de conservación . Una teoría relativista adecuada con una corriente de densidad de probabilidad también debe compartir esta característica. Para mantener la noción de densidad convectiva, se debe generalizar la expresión de Schrödinger de la densidad y la corriente de modo que las derivadas del espacio y del tiempo vuelvan a entrar simétricamente en relación con la función de onda escalar. La expresión de Schrödinger se puede mantener para la corriente, pero la densidad de probabilidad debe reemplazarse por la expresión formada simétricamente [ se necesita más explicación ]

probabilidad de densidad de corriente de 4

La ecuación de continuidad es como antes. Ahora todo es compatible con la relatividad, pero la expresión de la densidad ya no es definida positiva; los valores iniciales de ψ y t ψ pueden elegirse libremente y, por tanto, la densidad puede volverse negativa, algo que es imposible para una densidad de probabilidad legítima. Por lo tanto, no se puede obtener una generalización simple de la ecuación de Schrödinger bajo el ingenuo supuesto de que la función de onda es un escalar relativista, y la ecuación que satisface, de segundo orden en el tiempo.

Aunque no es una generalización relativista exitosa de la ecuación de Schrödinger, esta ecuación resucita en el contexto de la teoría cuántica de campos , donde se la conoce como ecuación de Klein-Gordon , y describe un campo de partículas sin espín (por ejemplo , el mesón pi o el bosón de Higgs ). . Históricamente, el propio Schrödinger llegó a esta ecuación antes que la que lleva su nombre pero pronto la descartó. En el contexto de la teoría cuántica de campos, se entiende que la densidad indefinida corresponde a la densidad de carga , que puede ser positiva o negativa, y no a la densidad de probabilidad.

El golpe de Dirac

Por tanto, Dirac pensó en probar una ecuación de primer orden tanto en el espacio como en el tiempo. Postuló una ecuación de la forma

[7] : 205 

Se podría, por ejemplo, tomar formalmente (es decir, por abuso de notación ) la expresión relativista para la energía

pserie infinita

Según cuenta la historia, Dirac estaba mirando la chimenea en Cambridge, reflexionando sobre este problema, cuando se le ocurrió la idea de sacar la raíz cuadrada del operador de onda de la siguiente manera:

Al multiplicar el lado derecho es evidente que, para que todos los términos cruzados como xy desaparezcan, se debe suponer

Dirac, que en ese momento había estado intensamente involucrado en la elaboración de los fundamentos de la mecánica matricial de Heisenberg , comprendió inmediatamente que estas condiciones podrían cumplirse si A , B , C y D son matrices , con la implicación de que la función de onda tiene múltiples componentes . Esto explicó inmediatamente la aparición de funciones de onda de dos componentes en la teoría fenomenológica del espín de Pauli , algo que hasta entonces había sido considerado como un misterio, incluso para el propio Pauli. Sin embargo, se necesitan al menos matrices de 4 × 4 para establecer un sistema con las propiedades requeridas, por lo que la función de onda tenía cuatro componentes, no dos, como en la teoría de Pauli, o uno, como en la teoría de Schrödinger. La función de onda de cuatro componentes representa una nueva clase de objeto matemático en las teorías físicas que hace su primera aparición aquí.

Dada la factorización en términos de estas matrices, ahora se puede escribir inmediatamente una ecuación

La toma muestra que todos los componentes de la función de onda satisfacen individualmente la relación relativista energía-momento. Por lo tanto, la ecuación buscada que es de primer orden tanto en el espacio como en el tiempo es

Configuración

Forma covariante e invariancia relativista

Para demostrar la invariancia relativista de la ecuación, es ventajoso expresarla en una forma en la que las derivadas espacio y tiempo aparezcan en pie de igualdad. Las nuevas matrices se introducen de la siguiente manera:

gradiente de 40 =1/Ct
ecuación de dirac

donde hay una suma implícita sobre los valores del índice repetido dos veces μ = 0, 1, 2, 3 y μ es el gradiente de 4. En la práctica, a menudo se escriben las matrices gamma en términos de submatrices de 2 × 2 tomadas de las matrices de Pauli y la matriz identidad de 2 × 2 . Explícitamente la representación estándar es

El sistema completo se resume utilizando la métrica de Minkowski en el espacio-tiempo en la forma

anticonmutadorálgebra de Cliffordfirma métrica (+ − − −)álgebra de Diracálgebra geométrica

La ecuación de Dirac ahora se puede interpretar como una ecuación de valores propios , donde la masa en reposo es proporcional a un valor propio del operador de 4 momentos , siendo la constante de proporcionalidad la velocidad de la luz:

Usando ( se pronuncia "d-barra"), [8] según la notación de barra diagonal de Feynman, la ecuación de Dirac se convierte en:

En la práctica, los físicos suelen utilizar unidades de medida tales que ħ = c = 1 , conocidas como unidades naturales . La ecuación entonces toma la forma simple

Ecuación de Dirac (unidades naturales)

Un teorema fundamental establece que si se dan dos conjuntos distintos de matrices que satisfacen las relaciones de Clifford , entonces están conectados entre sí mediante una transformación de similitud :

Si además las matrices son todas unitarias , como lo es el conjunto de Dirac, entonces S mismo es unitario ;

La transformación U es única hasta un factor multiplicativo de valor absoluto 1. Imaginemos ahora que se ha realizado una transformación de Lorentz sobre las coordenadas espaciales y temporales, y sobre los operadores derivativos, que forman un vector covariante. Para que el operador γ μμ permanezca invariante, las gammas deben transformarse entre sí como un vector contravariante con respecto a su índice espacio-temporal. Estas nuevas gammas satisfarán por sí mismas las relaciones de Clifford, debido a la ortogonalidad de la transformación de Lorentz. Según el teorema fundamental, se puede sustituir el nuevo conjunto por el antiguo sujeto a una transformación unitaria. En el nuevo marco, recordando que la masa en reposo es un escalar relativista, la ecuación de Dirac tomará la forma

Si el espinor transformado se define como

una invariancia relativista manifiesta

Por lo tanto, decidirse por cualquier representación unitaria de las gammas es definitivo, siempre que el espinor se transforme de acuerdo con la transformación unitaria que corresponde a la transformación de Lorentz dada.

Las diversas representaciones de las matrices de Dirac empleadas pondrán de relieve aspectos particulares del contenido físico de la función de onda de Dirac. La representación aquí mostrada se conoce como representación estándar : en ella, los dos componentes superiores de la función de onda se unen a la función de onda de 2 espinores de Pauli en el límite de energías bajas y velocidades pequeñas en comparación con la luz.

Las consideraciones anteriores revelan el origen de las gammas en geometría , remontándose a la motivación original de Grassmann; representan una base fija de vectores unitarios en el espacio-tiempo. De manera similar, los productos de gammas como γ μ γ ν representan elementos de superficie orientados , y así sucesivamente. Teniendo esto en cuenta, se puede encontrar la forma del elemento unitario de volumen en el espacio-tiempo en términos de gammas de la siguiente manera. Por definición, es

Para que esto sea una invariante, el símbolo épsilon debe ser un tensor y, por lo tanto, debe contener un factor de g , donde g es el determinante del tensor métrico . Como esto es negativo, ese factor es imaginario . De este modo

Esta matriz recibe el símbolo especial γ 5 , debido a su importancia cuando se consideran transformaciones impropias del espacio-tiempo, es decir, aquellas que cambian la orientación de los vectores base. En la representación estándar, es

También se encontrará que esta matriz anticonmuta con las otras cuatro matrices de Dirac:

Asume un papel de liderazgo cuando surgen cuestiones de paridad porque el elemento de volumen como magnitud dirigida cambia de signo bajo una reflexión espacio-temporal. Por lo tanto, tomar la raíz cuadrada positiva anterior equivale a elegir una convención de lateralidad en el espacio-tiempo.

Comparación con teorías relacionadas.

Teoría de Pauli

La necesidad de introducir un espín semientero se remonta experimentalmente a los resultados del experimento de Stern-Gerlach . Un haz de átomos pasa a través de un fuerte campo magnético no homogéneo , que luego se divide en N partes dependiendo del momento angular intrínseco de los átomos. Se encontró que para los átomos de plata , el haz se partía en dos; por lo tanto, el estado fundamental no podría ser un número entero , porque incluso si el momento angular intrínseco de los átomos fuera lo más pequeño posible, 1, el haz se dividiría en tres partes, correspondientes a átomos con L z = −1, 0, +1. . La conclusión es que los átomos de plata tienen un momento angular intrínseco neto de 12 . Pauli estableció una teoría que explicaba esta división introduciendo una función de onda de dos componentes y un término de corrección correspondiente en el hamiltoniano , que representa un acoplamiento semiclásico de esta función de onda a un campo magnético aplicado, como en unidades SI : (Nota que los caracteres en negrita implican vectores euclidianos en 3  dimensiones , mientras que los cuatro vectores de Minkowski A μ se pueden definir como .)

Aquí A y representan los componentes del cuatro potencial electromagnético en sus unidades estándar SI, y las tres sigmas son las matrices de Pauli . Al elevar al cuadrado el primer término, se encuentra una interacción residual con el campo magnético, junto con el hamiltoniano clásico habitual de una partícula cargada que interactúa con un campo aplicado en unidades SI :

Este hamiltoniano es ahora una matriz de 2 × 2 , por lo que la ecuación de Schrödinger basada en ella debe utilizar una función de onda de dos componentes. Al introducir el potencial electromagnético externo de 4 vectores en la ecuación de Dirac de manera similar, conocida como acoplamiento mínimo , toma la forma:

Una segunda aplicación del operador de Dirac ahora reproducirá el término de Pauli exactamente como antes, porque las matrices espaciales de Dirac multiplicadas por i tienen las mismas propiedades de cuadratura y conmutación que las matrices de Pauli. Además, el valor de la relación giromagnética del electrón, que se encuentra frente al nuevo término de Pauli, se explica desde los primeros principios. Este fue un logro importante de la ecuación de Dirac y dio a los físicos una gran fe en su exactitud general. Sin embargo, hay más. La teoría de Pauli puede verse como el límite de baja energía de la teoría de Dirac de la siguiente manera. Primero, la ecuación se escribe en forma de ecuaciones acopladas para 2 espinores con las unidades SI restauradas:

Suponiendo que el campo es débil y el movimiento del electrón no relativista, la energía total del electrón es aproximadamente igual a su energía en reposo , y el impulso pasa al valor clásico,

que es de ordenv/C– por lo tanto, a energías y velocidades típicas, los componentes inferiores del espinor de Dirac en la representación estándar están mucho más suprimidos en comparación con los componentes superiores. Al sustituir esta expresión en la primera ecuación se obtiene, después de algún reordenamiento

El operador de la izquierda representa la energía de la partícula reducida por su energía en reposo, que es solo la energía clásica, por lo que se puede recuperar la teoría de Pauli al identificar su 2-espinor con los componentes superiores del espinor de Dirac en la aproximación no relativista. Una mayor aproximación da la ecuación de Schrödinger como límite de la teoría de Pauli. Por tanto, la ecuación de Schrödinger puede verse como una aproximación no relativista de la ecuación de Dirac cuando se puede ignorar el espín y trabajar sólo a bajas energías y velocidades. Esto también fue un gran triunfo para la nueva ecuación, ya que rastreaba la misteriosa i que aparece en ella y la necesidad de una función de onda compleja hasta la geometría del espacio-tiempo a través del álgebra de Dirac. También resalta por qué la ecuación de Schrödinger, aunque superficialmente tiene la forma de una ecuación de difusión , en realidad representa la propagación de ondas.

Se debe enfatizar fuertemente que esta separación del espinor de Dirac en componentes grandes y pequeños depende explícitamente de una aproximación de baja energía. Todo el espinor de Dirac representa un todo irreductible , y los componentes que aquí se han descuidado para llegar a la teoría de Pauli traerán nuevos fenómenos al régimen relativista: la antimateria y la idea de creación y aniquilación de partículas.

Teoría de Weyl

En el caso sin masa , la ecuación de Dirac se reduce a la ecuación de Weyl , que describe partículas relativistas de espín sin masa de 1⁄2 . [9]

La teoría adquiere una segunda simetría: ver más abajo.

Interpretación física

Identificación de observables

La cuestión física crítica en una teoría cuántica es la siguiente: ¿cuáles son las cantidades físicamente observables definidas por la teoría? Según los postulados de la mecánica cuántica, tales cantidades están definidas por operadores hermitianos que actúan en el espacio de Hilbert de posibles estados de un sistema. Los valores propios de estos operadores son entonces los posibles resultados de medir la cantidad física correspondiente. En la teoría de Schrödinger, el objeto más simple es el hamiltoniano general, que representa la energía total del sistema. Para mantener esta interpretación al pasar a la teoría de Dirac, se debe considerar que el hamiltoniano es

suma implícitak = 1, 2, 3A = 0cqA 0

Por tanto, el hamiltoniano de Dirac se distingue fundamentalmente de su contraparte clásica, y hay que tener mucho cuidado para identificar correctamente lo que es observable en esta teoría. Gran parte del comportamiento aparentemente paradójico que implica la ecuación de Dirac equivale a una identificación errónea de estos observables. [ cita necesaria ]

Teoría del agujero

Las soluciones E negativas de la ecuación son problemáticas, porque se suponía que la partícula tiene energía positiva. Sin embargo, desde el punto de vista matemático, no parece haber razón para que rechacemos las soluciones de energía negativa. Dado que existen, no pueden simplemente ignorarse, porque una vez que se incluye la interacción entre el electrón y el campo electromagnético, cualquier electrón colocado en un estado propio de energía positiva se descompondría en estados propios de energía negativa de energía sucesivamente más baja. Los electrones reales obviamente no se comportan de esta manera, o desaparecerían emitiendo energía en forma de fotones .

Para hacer frente a este problema, Dirac introdujo la hipótesis, conocida como teoría de los huecos , de que el vacío es el estado cuántico de muchos cuerpos en el que están ocupados todos los estados propios de los electrones de energía negativa. Esta descripción del vacío como un "mar" de electrones se denomina mar de Dirac . Dado que el principio de exclusión de Pauli prohíbe que los electrones ocupen el mismo estado, cualquier electrón adicional se vería obligado a ocupar un estado propio de energía positiva, y a los electrones de energía positiva se les prohibiría descomponerse en estados propios de energía negativa.

Dirac razonó además que si los estados propios de energía negativa no están completamente llenos, cada estado propio desocupado (llamado agujero ) se comportaría como una partícula cargada positivamente. El agujero posee una energía positiva porque se requiere energía para crear un par partícula-agujero a partir del vacío. Como se señaló anteriormente, Dirac inicialmente pensó que el agujero podría ser el protón, pero Hermann Weyl señaló que el agujero debería comportarse como si tuviera la misma masa que un electrón, mientras que el protón es 1800 veces más pesado. El agujero finalmente fue identificado como el positrón , descubierto experimentalmente por Carl Anderson en 1932. [10]

No es del todo satisfactorio describir el "vacío" utilizando un mar infinito de electrones de energía negativa. Las contribuciones infinitamente negativas del mar de electrones de energía negativa tienen que ser canceladas por una energía "desnuda" positiva infinita y la contribución a la densidad de carga y corriente proveniente del mar de electrones de energía negativa es exactamente cancelada por una "energía positiva infinita" fondo de gelatina de modo que la densidad de carga eléctrica neta del vacío sea cero. En la teoría cuántica de campos , una transformación de Bogoliubov en los operadores de creación y aniquilación (convertir un estado de electrón de energía negativa ocupado en un estado de positrón de energía positiva desocupado y un estado de positrón de energía negativa desocupado en un estado de positrón de energía positiva ocupado) nos permite evitar el formalismo del mar de Dirac aunque, formalmente, le equivale.

Sin embargo, en determinadas aplicaciones de la física de la materia condensada son válidos los conceptos subyacentes de la "teoría de los agujeros". El mar de electrones de conducción en un conductor eléctrico , llamado mar de Fermi , contiene electrones con energías hasta el potencial químico del sistema. Un estado vacío en el mar de Fermi se comporta como un electrón cargado positivamente y, aunque también se lo denomina "hueco electrónico", es distinto de un positrón. La carga negativa del mar de Fermi se equilibra con la red iónica del material cargada positivamente.

En la teoría cuántica de campos

En las teorías cuánticas de campos , como la electrodinámica cuántica , el campo de Dirac está sujeto a un proceso de segunda cuantificación , que resuelve algunas de las características paradójicas de la ecuación.

Más discusión sobre la covarianza de Lorentz de la ecuación de Dirac

La ecuación de Dirac es covariante de Lorentz . Articular esto ayuda a iluminar no sólo la ecuación de Dirac, sino también el espinor de Majorana y el espinor de Elko, que aunque están estrechamente relacionados, tienen diferencias sutiles e importantes.

La comprensión de la covarianza de Lorentz se simplifica teniendo en cuenta el carácter geométrico del proceso. [11] Sea un punto único y fijo en la variedad del espacio-tiempo . Su ubicación se puede expresar en múltiples sistemas de coordenadas . En la literatura de física, estos se escriben como y , en el entendido de que ambos y describen el mismo punto , pero en diferentes marcos de referencia locales (un marco de referencia sobre una pequeña porción extendida de espacio-tiempo). Uno puede imaginar que tiene una fibra de diferentes sistemas de coordenadas encima. En términos geométricos, se dice que el espacio-tiempo se puede caracterizar como un haz de fibras , y específicamente, el haz de marcos . La diferencia entre dos puntos y en la misma fibra es una combinación de rotaciones y impulsos de Lorentz . Una elección de marco de coordenadas es una sección (local) a través de ese paquete.

Acoplado al haz de marcos hay un segundo haz, el haz de espinores . Una sección a través del haz de espinores es simplemente el campo de partículas (el espinor de Dirac, en el presente caso). Diferentes puntos de la fibra espinórica corresponden al mismo objeto físico (el fermión) pero expresado en diferentes marcos de Lorentz. Claramente, el haz de marco y el haz de espinor deben unirse de manera consistente para obtener resultados consistentes; formalmente, se dice que el haz de espinores es el haz asociado ; está asociado a un paquete principal , que en el presente caso es el paquete marco. Las diferencias entre puntos de la fibra corresponden a las simetrías del sistema. El haz de espinores tiene dos generadores distintos de sus simetrías: el momento angular total y el momento angular intrínseco . Ambas corresponden a las transformaciones de Lorentz, pero de diferentes maneras.

La presentación aquí sigue a la de Itzykson y Zuber. [12] Es casi idéntico al de Bjorken y Drell. [13] Una derivación similar en un contexto relativista general se puede encontrar en Weinberg. [14] Aquí arreglamos nuestro espacio-tiempo para que sea plano, es decir, nuestro espacio-tiempo es el espacio de Minkowski.

Bajo una transformación de Lorentz, el espinor de Dirac se transforma como

Esta matriz puede interpretarse como el momento angular intrínseco del campo de Dirac. Que merece esta interpretación surge al contrastarlo con el generador de transformaciones de Lorentz , que tiene la forma

momento angular total
no

La interpretación geométrica de lo anterior es que el campo del marco es afín y no tiene un origen preferido. El generador genera las simetrías de este espacio: proporciona un reetiquetado de un punto fijo. El generador genera un movimiento de un punto de la fibra a otro: un movimiento entre ambos y aún correspondiente al mismo punto espacio-temporal. Estas observaciones quizás obtusas pueden ser dilucidado con álgebra explícita.

Sea una transformación de Lorentz. La ecuación de Dirac es

etc.matriz unitaria de
tensor métrico

Después de antisimetrizar adecuadamente, se obtiene el generador de simetrías indicado anteriormente. Así, se puede decir que ambos y son los "generadores de transformaciones de Lorentz", pero con una sutil distinción: el primero corresponde a un reetiquetado de puntos en el haz de marcos afines , que fuerza una traslación a lo largo de la fibra del espinor en el espín. haz , mientras que el segundo corresponde a traslaciones a lo largo de la fibra del haz de espín (tomada como un movimiento a lo largo del haz de estructura, así como un movimiento a lo largo de la fibra del haz de espín). Weinberg proporciona argumentos adicionales para la interpretación física de estos como Momento angular total e intrínseco. [15]

Otras formulaciones

La ecuación de Dirac se puede formular de otras formas.

Espacio-tiempo curvo

En este artículo se ha desarrollado la ecuación de Dirac en el espaciotiempo plano según la relatividad especial. Es posible formular la ecuación de Dirac en el espaciotiempo curvo .

El álgebra del espacio físico.

Este artículo desarrolló la ecuación de Dirac utilizando cuatro vectores y operadores de Schrödinger. La ecuación de Dirac en el álgebra del espacio físico utiliza un álgebra de Clifford sobre los números reales, un tipo de álgebra geométrica.

Espinores de Weyl acoplados

Como se mencionó anteriormente, la ecuación de Dirac sin masa se reduce inmediatamente a la ecuación homogénea de Weyl . Al utilizar la representación quiral de las matrices gamma , la ecuación de masa distinta de cero también se puede descomponer en un par de ecuaciones de Weyl no homogéneas acopladas que actúan sobre el primer y el último par de índices del espinor original de cuatro componentes, es decir, donde y son cada uno espinores de Weyl de dos componentes . Esto se debe a que la forma de bloque sesgado de las matrices gamma quirales significa que intercambian y aplican las matrices de Pauli de dos por dos a cada una:

.

Entonces la ecuación de Dirac

se convierte

lo que a su vez es equivalente a un par de ecuaciones de Weyl no homogéneas para espinores de hélice izquierda y derecha sin masa , donde la fuerza de acoplamiento es proporcional a la masa:

. [ se necesita aclaración ]

Esto se ha propuesto como una explicación intuitiva de Zitterbewegung , ya que estos componentes sin masa se propagarían a la velocidad de la luz y se moverían en direcciones opuestas, ya que la helicidad es la proyección del espín sobre la dirección del movimiento. [16] Aquí el papel de la "masa" no es hacer que la velocidad sea menor que la velocidad de la luz, sino que controla la velocidad promedio a la que ocurren estas inversiones; Específicamente, las reversiones se pueden modelar como un proceso de Poisson . [17]

simetría U(1)

En esta sección se utilizan unidades naturales. La constante de acoplamiento está etiquetada por convención con : este parámetro también puede verse como un modelo de la carga del electrón.

simetría vectorial

La ecuación y acción de Dirac admite una simetría donde los campos se transforman como

vectorialaxial : ver más abajo). el teorema de Noether,

Medir la simetría

Si 'promovemos' la simetría global, parametrizada por la constante , a una simetría local, parametrizada por una función , o equivalentemente, la ecuación de Dirac ya no es invariante: hay una derivada residual de .

La solución procede como en la electrodinámica escalar : la derivada parcial se convierte en derivada covariante.

campo calibreconexión

La ley de transformación bajo transformaciones de calibre para es entonces la habitual

Acción QED

Ampliar la derivada covariante permite escribir la acción en una segunda forma útil:

simetría axial

Los fermiones de Dirac sin masa , es decir, los campos que satisfacen la ecuación de Dirac con , admiten una segunda simetría no equivalente.

Esto se ve más fácilmente escribiendo el fermión de Dirac de cuatro componentes como un par de campos vectoriales de dos componentes,

representación quiral

La acción de Dirac toma entonces la forma

espinores de Weyl

La simetría vectorial anterior todavía está presente, donde y giran de manera idéntica. Esta forma de acción hace manifiesta la segunda simetría no equivalente:

Esta no es la única simetría posible, pero es convencional. Cualquier 'combinación lineal' de las simetrías vectorial y axial también es una simetría.

Clásicamente, la simetría axial admite una teoría de calibre bien formulada. Pero a nivel cuántico hay una anomalía , es decir, una obstrucción a la medición.

Extensión a la simetría de color.

Podemos extender esta discusión desde una simetría abeliana a una simetría general no abeliana bajo un grupo de calibre , el grupo de simetrías de color para una teoría.

Para ser más concretos, fijamos , el grupo unitario especial de matrices que actúan sobre .

Antes de esta sección, podría verse como un campo de espín en el espacio de Minkowski, en otras palabras, una función , y sus componentes están etiquetados por índices de espín, índices convencionalmente griegos tomados del comienzo del alfabeto .

Al promover la teoría a una teoría de calibre, adquiere informalmente una parte transformadora como , y estas se etiquetan mediante índices de color, convencionalmente índices latinos . En total, tiene componentes, dados en índices por . El 'spinor' etiqueta sólo cómo se transforma el campo bajo transformaciones del espacio-tiempo.

Formalmente, se valora en un producto tensorial, es decir, es una función

La medición procede de manera similar al caso abeliano, con algunas diferencias. Bajo una transformación de calibre, los campos de espinor se transforman como

La escritura de una acción invariante de calibre se realiza exactamente como en el caso, reemplazando el lagrangiano de Maxwell por el lagrangiano de Yang-Mills.

La acción es entonces

Acción QCD

Aplicaciones físicas

Para aplicaciones físicas, el caso describe el sector de quarks del modelo estándar que modela interacciones fuertes . Los quarks se modelan como espinores de Dirac; el campo de calibre es el campo de gluones . El caso describe parte del sector electrodébil del modelo Estándar. Los leptones como los electrones y los neutrinos son los espinores de Dirac; el campo de calibre es el bosón de calibre.

Generalizaciones

Esta expresión se puede generalizar a un grupo de Lie arbitrario con conexión y una representación , donde la parte de color se valora en . Formalmente, el campo de Dirac es una función.

Luego se transforma bajo una transformación de calibre como

asociada

Esta teoría se puede generalizar al espacio-tiempo curvo, pero hay sutilezas que surgen en la teoría de calibre en un espacio-tiempo general (o más generalmente aún, una variedad) que, en el espacio-tiempo plano, pueden ignorarse. En última instancia, esto se debe a la contractibilidad del espacio-tiempo plano, que nos permite ver un campo de calibre y las transformaciones de calibre tal como se definen globalmente en .

Ver también

Referencias

Citas

  1. ^ PW Atkins (1974). Quanta: un manual de conceptos . Prensa de la Universidad de Oxford. pag. 52.ISBN _ 978-0-19-855493-6.
  2. ^ T. Hola, P. Walters (2009). El nuevo universo cuántico . Prensa de la Universidad de Cambridge. pag. 228.ISBN _ 978-0-521-56457-1.
  3. ^ Zichichi, Antonino (2 de marzo de 2000). "Dirac, Einstein y la física". Mundo de la Física . Consultado el 22 de octubre de 2023 .
  4. ^ Gisela Dirac-Wahrenburg. "Paul Dirac". Dirac.ch . Consultado el 12 de julio de 2013 .
  5. ^ Dirac, Paul AM (1982) [1958]. Principios de la Mecánica Cuántica . Serie internacional de monografías sobre física (4ª ed.). Prensa de la Universidad de Oxford. pag. 255.ISBN _ 978-0-19-852011-5.
  6. ^ Collas, Pedro; Klein, David (2019). La ecuación de Dirac en el espacio-tiempo curvo: una guía para los cálculos. Saltador. pag. 7.ISBN _ 978-3-030-14825-6.Extracto de la página 7
  7. ^ Pato, Ian; Sudarshan, ECG (1998). Pauli y el teorema de la estadística de espín. CIENTÍFICO MUNDIAL. doi :10.1142/3457. ISBN 978-981-02-3114-9.
  8. ^ Pendleton, Brian (2012-2013). Teoría cuántica (PDF) . sección 4.3 "La ecuación de Dirac". Archivado (PDF) desde el original el 9 de octubre de 2022.
  9. ^ Ohlsson, Tommy (22 de septiembre de 2011). Física cuántica relativista: desde la mecánica cuántica avanzada hasta la introducción a la teoría cuántica de campos. Prensa de la Universidad de Cambridge. pag. 86.ISBN _ 978-1-139-50432-4.
  10. ^ Penrose, Roger (2004). El camino a la realidad . Jonathan Cabo. pag. 625.ISBN _ 0-224-04447-8.
  11. ^ Jurgen Jost, (2002) "Geometría y análisis geométrico de Riemann (tercera edición)" Springer Universitext. (Ver el capítulo 1 para estructuras de giro y el capítulo 3 para conexiones en estructuras de giro)
  12. ^ Claude Itzykson y Jean-Bernard Zuber, (1980) "Teoría cuántica de campos", McGraw-Hill (ver capítulo 2)
  13. ^ James D. Bjorken, Sidney D. Drell (1964) "Mecánica cuántica relativista", McGraw-Hill. (Ver Capítulo 2)
  14. ^ Steven Weinberg, (1972) "Gravitación y cosmología: principios y aplicaciones de la teoría general de la relatividad", Wiley & Sons (consulte el capítulo 12.5, "Formalismo tétrada", páginas 367 y siguientes) .
  15. ^ Weinberg, "Gravitación", op cit. (Consulte el capítulo 2.9 "Centrifugado", páginas 46-47.)
  16. ^ Penrose, Roger (2004). El camino a la realidad (Sexta edición ed.). Alfred A. Knopf. págs. 628–632. ISBN 0-224-04447-8.
  17. ^ Gaveau, B.; Jacobson, T.; Kac, M.; Schulman, LS (30 de julio de 1984). "Extensión relativista de la analogía entre la mecánica cuántica y el movimiento browniano". Cartas de revisión física . 53 (5): 419–422. doi :10.1103/PhysRevLett.53.419.

Artículos seleccionados

Libros de texto

enlaces externos