En mecánica cuántica , la interacción espín-órbita (también llamada efecto espín-órbita o acoplamiento espín-órbita ) es una interacción relativista del espín de una partícula con su movimiento dentro de un potencial . Un ejemplo clave de este fenómeno es la interacción espín-órbita que conduce a cambios en los niveles de energía atómica de un electrón , debido a la interacción electromagnética entre el dipolo magnético del electrón , su movimiento orbital y el campo electrostático del núcleo cargado positivamente . Este fenómeno es detectable como una división de líneas espectrales , que puede considerarse como un efecto Zeeman producto de dos efectos: el campo magnético aparente visto desde la perspectiva del electrón debido a la relatividad especial y el momento magnético del electrón asociado con su espín intrínseco debido a la mecánica cuántica.
En el caso de los átomos, la división de los niveles de energía producida por la interacción espín-órbita suele ser del mismo orden de magnitud que las correcciones relativistas a la energía cinética y el efecto Zitterbewegung . La suma de estas tres correcciones se conoce como estructura fina . La interacción entre el campo magnético creado por el electrón y el momento magnético del núcleo es una corrección más leve de los niveles de energía conocida como estructura hiperfina .
Un efecto similar, debido a la relación entre el momento angular y la fuerza nuclear fuerte , ocurre para los protones y neutrones que se mueven dentro del núcleo, lo que lleva a un cambio en sus niveles de energía en el modelo de capas del núcleo . En el campo de la espintrónica , se exploran los efectos de espín-órbita para los electrones en semiconductores y otros materiales para aplicaciones tecnológicas. La interacción espín-órbita está en el origen de la anisotropía magnetocristalina y el efecto Hall de espín .
En esta sección se presenta una descripción relativamente simple y cuantitativa de la interacción espín-órbita de un electrón unido a un átomo similar al hidrógeno , hasta el primer orden en la teoría de perturbaciones , utilizando algo de electrodinámica semiclásica y mecánica cuántica no relativista. Esto arroja resultados que concuerdan razonablemente bien con las observaciones.
Un cálculo riguroso del mismo resultado utilizaría la mecánica cuántica relativista , utilizando la ecuación de Dirac , e incluiría interacciones de muchos cuerpos . Para lograr un resultado aún más preciso, sería necesario calcular pequeñas correcciones a partir de la electrodinámica cuántica .
La energía de un momento magnético en un campo magnético está dada por donde μ es el momento magnético de la partícula y B es el campo magnético que experimenta.
Primero trataremos el campo magnético . Aunque en el marco de reposo del núcleo no hay campo magnético que actúe sobre el electrón, sí lo hay en el marco de reposo del electrón (véase electromagnetismo clásico y relatividad especial ). Ignorando por ahora que este marco no es inercial , terminamos con la ecuación donde v es la velocidad del electrón y E es el campo eléctrico a través del cual viaja. [a] Aquí, en el límite no relativista, suponemos que el factor de Lorentz . Ahora sabemos que E es radial, por lo que podemos reescribir . También sabemos que el momento del electrón . Sustituyendo estos y cambiando el orden del producto vectorial (usando la identidad ) obtenemos
A continuación, expresamos el campo eléctrico como el gradiente del potencial eléctrico . Aquí hacemos la aproximación del campo central , es decir, que el potencial electrostático es esféricamente simétrico, por lo que es solo una función del radio. Esta aproximación es exacta para el hidrógeno y los sistemas similares al hidrógeno. Ahora podemos decir que
donde es la energía potencial del electrón en el campo central, y e es la carga elemental . Ahora recordamos de la mecánica clásica que el momento angular de una partícula . Poniendo todo junto, obtenemos
Es importante señalar en este punto que B es un número positivo multiplicado por L , lo que significa que el campo magnético es paralelo al momento angular orbital de la partícula, que es perpendicular a la velocidad de la partícula.
El momento magnético de espín del electrón es donde es el vector de momento angular de espín, es el magnetón de Bohr y es el factor g de espín del electrón . Aquí hay una constante negativa multiplicada por el espín , por lo que el momento magnético de espín es antiparalelo al momento angular de espín.
El potencial de espín-órbita consta de dos partes. La parte de Larmor está relacionada con la interacción del momento magnético de espín del electrón con el campo magnético del núcleo en el marco de movimiento conjunto del electrón. La segunda contribución está relacionada con la precesión de Thomas .
La energía de interacción de Larmor es
Sustituyendo en esta ecuación expresiones para el momento magnético de espín y el campo magnético, se obtiene
Ahora tenemos que tener en cuenta la corrección de precesión de Thomas para la trayectoria curva del electrón.
En 1926, Llewellyn Thomas volvió a calcular relativistamente la separación de dobletes en la estructura fina del átomo. [1] La tasa de precesión de Thomas está relacionada con la frecuencia angular del movimiento orbital de una partícula giratoria de la siguiente manera: [2] [3] donde es el factor de Lorentz de la partícula en movimiento. El hamiltoniano que produce la precesión de espín está dado por
Para el primer orden en , obtenemos
El potencial total de espín-órbita en un potencial electrostático externo toma la forma El efecto neto de la precesión de Thomas es la reducción de la energía de interacción de Larmor por un factor de aproximadamente 1/2, lo que llegó a conocerse como la mitad de Thomas .
Gracias a todas las aproximaciones anteriores, ahora podemos evaluar el cambio de energía detallado en este modelo. Nótese que L z y S z ya no son cantidades conservadas. En particular, deseamos encontrar una nueva base que diagonalice tanto H 0 (el hamiltoniano no perturbado) como Δ H . Para averiguar cuál es esta base, primero definimos el operador de momento angular total
Tomando el producto escalar de esto consigo mismo, obtenemos (ya que L y S viajan conmutativa), y por lo tanto
Se puede demostrar que los cinco operadores H 0 , J 2 , L 2 , S 2 y J z conmutan entre sí y con Δ H . Por lo tanto, la base que buscábamos es la base propia simultánea de estos cinco operadores (es decir, la base donde los cinco son diagonales). Los elementos de esta base tienen los cinco números cuánticos : (el "número cuántico principal"), (el "número cuántico del momento angular total"), (el "número cuántico del momento angular orbital"), (el "número cuántico de espín") y (el " componente z del momento angular total").
Para evaluar las energías, observamos que para las funciones de onda hidrogénicas (aquí está el radio de Bohr dividido por la carga nuclear Z ); y
Ahora podemos decir que donde la constante de acoplamiento espín-órbita es
Para obtener el resultado relativista exacto, consulte las soluciones de la ecuación de Dirac para un átomo similar al hidrógeno .
La derivación anterior calcula la energía de interacción en el marco de reposo (momentáneo) del electrón y en este marco de referencia hay un campo magnético que está ausente en el marco de reposo del núcleo.
Otro enfoque es calcularlo en el marco de reposo del núcleo, véase por ejemplo George P. Fisher: Electric Dipole Moment of a Moving Magnetic Dipole (1971). [4] Sin embargo, a veces se evita el cálculo del marco de reposo, porque hay que tener en cuenta el momento oculto . [5]
Un sólido cristalino (semiconductor, metal, etc.) se caracteriza por su estructura de bandas . Si bien en la escala general (incluidos los niveles del núcleo) la interacción espín-órbita sigue siendo una pequeña perturbación, puede desempeñar un papel relativamente más importante si nos centramos en las bandas cercanas al nivel de Fermi ( ). La interacción atómica (espín-órbita), por ejemplo, divide bandas que de otro modo estarían degeneradas, y la forma particular de esta división espín-órbita (normalmente del orden de unos pocos a unos cientos de milielectronvoltios) depende del sistema particular. Las bandas de interés pueden describirse entonces mediante varios modelos eficaces, normalmente basados en algún enfoque perturbativo. En el artículo sobre las interacciones de Rashba y Dresselhaus se explica un ejemplo de cómo la interacción atómica espín-órbita influye en la estructura de bandas de un cristal.
En iones paramagnéticos contenidos en sólidos cristalinos, por ejemplo iones con subcapa atómica d o f no cerrada, existen estados electrónicos localizados. [6] [7] En este caso, la estructura de niveles electrónicos similares a los atómicos está determinada por interacciones intrínsecas de espín-órbita magnéticas e interacciones con campos eléctricos cristalinos . [8] Dicha estructura se denomina estructura electrónica fina . Para los iones de tierras raras, las interacciones de espín-órbita son mucho más fuertes que las interacciones del campo eléctrico cristalino (CEF). [9] El fuerte acoplamiento de espín-órbita hace que J sea un número cuántico relativamente bueno, porque el primer multiplete excitado está al menos ~130 meV (1500 K) por encima del multiplete primario. El resultado es que llenarlo a temperatura ambiente (300 K) es despreciablemente pequeño. En este caso, un multiplete primario degenerado (2 J + 1) veces dividido por un CEF externo puede considerarse como la contribución básica al análisis de las propiedades de dichos sistemas. En el caso de cálculos aproximados de base , para determinar cuál es el multiplete primario, se aplican los principios de Hund , conocidos de la física atómica:
La S , L y J del multiplete fundamental se determinan mediante las reglas de Hund . El multiplete fundamental está degenerado en 2 J + 1 ; su degeneración se elimina mediante interacciones CEF e interacciones magnéticas. Las interacciones CEF y las interacciones magnéticas se parecen, de alguna manera, al efecto Stark y al efecto Zeeman conocidos de la física atómica . Las energías y funciones propias de la estructura electrónica fina discreta se obtienen mediante la diagonalización de la matriz (2 J + 1)-dimensional. La estructura electrónica fina se puede detectar directamente mediante muchos métodos espectroscópicos diferentes, incluidos los experimentos de dispersión de neutrones inelásticos (INS). El caso de las interacciones CEF cúbicas fuertes [10] (para iones de metales de transición 3 d ) forma un grupo de niveles (por ejemplo, T 2 g , A 2 g ), que se dividen parcialmente mediante interacciones de espín-órbita y (si ocurren) interacciones CEF de simetría inferior. Las energías y funciones propias de la estructura electrónica fina discreta (para el término más bajo) se obtienen por diagonalización de la matriz (2 L + 1)(2 S + 1)-dimensional. A temperatura cero ( T = 0 K) solo está ocupado el estado más bajo. El momento magnético a T = 0 K es igual al momento del estado fundamental. Permite la evaluación de los momentos total, de espín y orbital. Los estados propios y las funciones propias correspondientes se pueden encontrar a partir de la diagonalización directa de la matriz hamiltoniana que contiene el campo cristalino y las interacciones espín-órbita. Teniendo en cuenta la población térmica de estados, se establece la evolución térmica de las propiedades de un solo ión del compuesto. Esta técnica se basa en la teoría del operador equivalente [11] definida como el CEF ampliado por cálculos termodinámicos y analíticos definidos como el suplemento de la teoría CEF al incluir cálculos termodinámicos y analíticos.
Las bandas de huecos de un semiconductor de blenda de zinc a granel (3D) se dividirán en huecos pesados y ligeros (que forman un cuadruplete en el punto de la zona de Brillouin) y una banda dividida ( doblete). Incluyendo dos bandas de conducción ( doblete en el punto ), el sistema se describe mediante el modelo efectivo de ocho bandas de Kohn y Luttinger . Si solo es de interés la parte superior de la banda de valencia (por ejemplo, cuando , nivel de Fermi medido desde la parte superior de la banda de valencia), el modelo efectivo de cuatro bandas adecuado es donde son los parámetros de Luttinger (análogos a la masa efectiva única de un modelo de una banda de electrones) y son matrices de momento angular 3/2 ( es la masa del electrón libre). En combinación con la magnetización, este tipo de interacción de espín-órbita distorsionará las bandas electrónicas dependiendo de la dirección de magnetización, causando así anisotropía magnetocristalina (un tipo especial de anisotropía magnética ). Si además el semiconductor carece de simetría de inversión, las bandas de huecos exhibirán una división cúbica de Dresselhaus. Dentro de las cuatro bandas (huecos ligeros y pesados), el término dominante es
donde el parámetro material para GaAs (ver pág. 72 en el libro de Winkler, según datos más recientes la constante de Dresselhaus en GaAs es 9 eVÅ 3 ; [12] el hamiltoniano total será ). El gas de electrones bidimensional en un pozo cuántico asimétrico (o heteroestructura) sentirá la interacción de Rashba. El hamiltoniano efectivo de dos bandas apropiado es donde es la matriz identidad 2 × 2, las matrices de Pauli y la masa efectiva del electrón. La parte de espín-órbita del hamiltoniano, está parametrizada por , a veces llamado parámetro de Rashba (su definición varía un poco), que está relacionado con la asimetría de la estructura.
Las expresiones anteriores para la interacción espín-órbita acoplan las matrices de espín y al cuasimomento , y al potencial vectorial de un campo eléctrico de CA a través de la sustitución de Peierls . Son términos de orden inferior de la teoría de perturbación k·p de Luttinger-Kohn en potencias de . Los siguientes términos de esta expansión también producen términos que acoplan operadores de espín de la coordenada del electrón . De hecho, un producto vectorial es invariante con respecto a la inversión temporal. En cristales cúbicos, tiene una simetría de un vector y adquiere un significado de una contribución de espín-órbita al operador de coordenada. Para electrones en semiconductores con un estrecho espacio entre las bandas de conducción y huecos pesados, Yafet derivó la ecuación [13] [14] donde es una masa de electrón libre, y es un factor -renormalizado adecuadamente para la interacción espín-órbita. Este operador acopla el espín del electrón directamente al campo eléctrico a través de la energía de interacción .
La resonancia de espín dipolar eléctrico (EDSR) es el acoplamiento del espín del electrón con un campo eléctrico oscilante. De manera similar a la resonancia de espín del electrón (ESR) en la que los electrones pueden ser excitados con una onda electromagnética con la energía dada por el efecto Zeeman , en EDSR la resonancia puede lograrse si la frecuencia está relacionada con la división de la banda de energía dada por el acoplamiento espín-órbita en sólidos. Mientras que en ESR el acoplamiento se obtiene a través de la parte magnética de la onda EM con el momento magnético del electrón, la ESDR es el acoplamiento de la parte eléctrica con el espín y el movimiento de los electrones. Este mecanismo se ha propuesto para controlar el espín de los electrones en puntos cuánticos y otros sistemas mesoscópicos . [15]