Estas matrices reciben su nombre del físico Wolfgang Pauli . En mecánica cuántica , aparecen en la ecuación de Pauli , que tiene en cuenta la interacción del espín de una partícula con un campo electromagnético externo . También representan los estados de interacción de dos filtros de polarización para la polarización horizontal/vertical, la polarización de 45 grados (derecha/izquierda) y la polarización circular (derecha/izquierda).
Cada matriz de Pauli es hermítica y, junto con la matriz identidad I (a veces considerada como la matriz de Pauli cero σ 0 ), las matrices de Pauli forman una base para el espacio vectorial real de matrices hermíticas de 2 × 2. Esto significa que cualquier matriz hermítica de 2 × 2 se puede escribir de forma única como una combinación lineal de matrices de Pauli, con todos los coeficientes siendo números reales.
Los operadores hermíticos representan observables en mecánica cuántica, por lo que las matrices de Pauli abarcan el espacio de observables del complejo espacio de Hilbert bidimensional . En el contexto del trabajo de Pauli, σ k representa el observable correspondiente al espín a lo largo del k -ésimo eje de coordenadas en el espacio euclidiano tridimensional .
Las matrices de Pauli (después de la multiplicación por i para hacerlas antihermíticas ) también generan transformaciones en el sentido de las álgebras de Lie : las matrices iσ 1 , iσ 2 , iσ 3 forman una base para el álgebra de Lie real , que exponencia al grupo unitario especial SU(2) . [a] El álgebra generada por las tres matrices σ 1 , σ 2 , σ 3 es isomorfa al álgebra de Clifford de [1] y el álgebra asociativa (unital) generada por iσ 1 , iσ 2 , iσ 3 funciona idénticamente ( es isomorfa ) a la de los cuaterniones ( ).
Propiedades algebraicas
Las tres matrices de Pauli se pueden compactar en una sola expresión:
donde la solución de i 2 = −1 es la " unidad imaginaria ", y δ jk es el delta de Kronecker , que es igual a +1 si j = k y 0 en caso contrario. Esta expresión es útil para "seleccionar" numéricamente cualquiera de las matrices sustituyendo valores de j = 1, 2, 3, lo que a su vez es útil cuando se va a utilizar cualquiera de las matrices (pero ninguna en particular) en manipulaciones algebraicas.
de lo cual podemos deducir que cada matriz σ j tiene valores propios +1 y −1.
Con la inclusión de la matriz identidad I (a veces denotada σ 0 ), las matrices de Pauli forman una base ortogonal (en el sentido de Hilbert–Schmidt ) del espacio de Hilbert de matrices hermíticas de 2 × 2 sobre , y del espacio de Hilbert de todas las matrices complejas de 2 × 2 sobre .
Relaciones de conmutación y anticonmutación
Relaciones de conmutación
Las matrices de Pauli obedecen las siguientes relaciones de conmutación :
donde se define como y δ jk es el delta de Kronecker . I denota la matriz identidad 2 × 2 .
Estas relaciones de anticonmutación hacen que las matrices de Pauli sean los generadores de una representación del álgebra de Clifford para denotados
La construcción habitual de generadores utilizando el álgebra de Clifford recupera las relaciones de conmutación anteriores, hasta factores numéricos sin importancia.
A continuación se dan como ejemplos algunos conmutadores y anticonmutadores explícitos:
El vector de Pauli se define mediante [b]
donde , , y son una notación equivalente para las más familiares , , y .
El vector de Pauli proporciona un mecanismo de mapeo desde una base vectorial a una base matricial de Pauli [2] de la siguiente manera:
Más formalmente, esto define una función de al espacio vectorial de matrices hermíticas sin traza. Esta función codifica estructuras de como un espacio vectorial normado y como un álgebra de Lie (con el producto vectorial como su corchete de Lie) a través de funciones de matrices, lo que hace que la función sea un isomorfismo de las álgebras de Lie. Esto hace que las matrices de Pauli sean entrelazadas desde el punto de vista de la teoría de la representación.
Otra forma de ver el vector de Pauli es como un vector dual de matriz sin traza hermítica, es decir, un elemento de esa matriz se mapea
Relación de completitud
Cada componente de se puede recuperar de la matriz (ver relación de completitud a continuación).
Esto constituye una inversa del mapa , lo que hace manifiesto que el mapa es una biyección.
Determinante
La norma está dada por el determinante (hasta un signo menos)
Entonces, considerando la acción de conjugación de una matriz en este espacio de matrices,
encontramos y que es hermítico y sin traza. Entonces tiene sentido definir donde tiene la misma norma que y por lo tanto interpretar como una rotación del espacio tridimensional. De hecho, resulta que la restricción especial de implica que la rotación preserva la orientación. Esto permite la definición de una función dada por
donde Este mapa es la realización concreta de la doble cobertura de por y por lo tanto muestra que Los componentes de se pueden recuperar utilizando el proceso de rastreo anterior:
Producto cruzado
El producto vectorial viene dado por el conmutador matricial (hasta un factor de ).
De hecho, la existencia de una norma se sigue del hecho de que es un álgebra de Lie (véase la forma de Killing ).
Este producto vectorial se puede utilizar para demostrar la propiedad de preservación de la orientación del mapa anterior.
Valores propios y vectores propios
Los valores propios de son Esto se deduce inmediatamente de la ausencia de traza y del cálculo explícito del determinante.
De manera más abstracta, sin calcular el determinante, lo que requiere propiedades explícitas de las matrices de Pauli, esto se deduce de ya que esto se puede factorizar en Un resultado estándar en álgebra lineal (un mapa lineal que satisface una ecuación polinómica escrita en factores lineales distintos es diagonal) significa que esto implica es diagonal con posibles valores propios . La ausencia de traza de significa que tiene exactamente uno de cada valor propio.
Sus vectores propios normalizados son
Estas expresiones se vuelven singulares para . Se pueden rescatar dejando y tomando el límite , lo que produce los vectores propios correctos (0,1) y (1,0) de .
Alternativamente, se pueden utilizar coordenadas esféricas para obtener los vectores propios y .
Pauli 4-vector
El 4-vector de Pauli, utilizado en la teoría del espinor, se escribe con componentes
Esto define un mapa del espacio vectorial de matrices hermíticas,
que también codifica la métrica de Minkowski (con convención mayoritariamente negativa ) en su determinante:
Este 4-vector también tiene una relación de completitud. Es conveniente definir un segundo 4-vector de Pauli
y permiten subir y bajar utilizando el tensor métrico de Minkowski. La relación puede entonces escribirse
De manera similar al caso de 3 vectores de Pauli, podemos encontrar un grupo de matrices que actúa como isometrías en en este caso el grupo de matrices es y esto muestra De manera similar a lo anterior, esto se puede realizar explícitamente para con componentes
De hecho, la propiedad determinante se deduce abstractamente de las propiedades de traza de la matriz. Para las matrices, se cumple la siguiente identidad:
Es decir, los 'términos cruzados' pueden escribirse como trazas. Cuando se eligen diferentes, los términos cruzados se anulan. De esto se deduce, mostrando ahora la suma explícitamente, que como las matrices son esto es igual a
Relación con el producto escalar y el producto vectorial
Los vectores de Pauli asignan elegantemente estas relaciones de conmutación y anticonmutación a los productos vectoriales correspondientes. Al sumar el conmutador al anticonmutador se obtiene
de modo que,
Al contraer cada lado de la ecuación con componentes de dos 3 -vectores a p y b q (que conmutan con las matrices de Pauli, es decir, a p σ q = σ q a p ) para cada matriz σ q y componente vectorial a p (y lo mismo con b q ) se obtiene
Si i se identifica con el pseudoescalar σ x σ y σ z entonces el lado derecho se convierte en , que también es la definición del producto de dos vectores en álgebra geométrica.
Si definimos el operador de espín como J = es/2 σ , entonces J satisface la relación de conmutación:O equivalentemente, el vector de Pauli satisface:
Algunas relaciones de traza
Las siguientes trazas se pueden derivar utilizando las relaciones de conmutación y anticonmutación.
Si también se considera la matriz σ 0 = I , estas relaciones se convierten en
donde los índices griegos α , β , γ y μ asumen valores de {0, x , y , z } y la notación se utiliza para denotar la suma sobre la permutación cíclica de los índices incluidos.
Exponencial de un vector de Pauli
Para
se tiene, para potencias pares, 2 p , p = 0, 1, 2, 3, ...
que se puede demostrar primero para el caso p = 1 utilizando las relaciones de anticonmutación. Por conveniencia, el caso p = 0 se toma como 1 por convención.
mientras que el determinante de la exponencial en sí es solo 1 , lo que lo convierte en el elemento de grupo genérico de SU(2) .
Una versión más abstracta de la fórmula (2) para una matriz general de 2 × 2 se puede encontrar en el artículo sobre exponenciales matriciales . Una versión general de (2) para una función analítica (en a y − a ) se proporciona mediante la aplicación de la fórmula de Sylvester , [3]
La ley de composición de grupos deSU(2)
Una aplicación sencilla de la fórmula (2) proporciona una parametrización de la ley de composición del grupo SU(2) . [c] Se puede resolver directamente para c en
que especifica la multiplicación genérica de grupos, donde, evidentemente,
la ley esférica de los cosenos . Dado c , entonces,
En consecuencia, los parámetros de rotación compuestos en este elemento de grupo (una forma cerrada de la respectiva expansión BCH en este caso) simplemente ascienden a [4]
(Por supuesto, cuando es paralelo a , también lo es , y c = a + b .)
Acción adjunta
También es sencillo calcular la acción adjunta sobre el vector de Pauli, es decir, la rotación de cualquier ángulo a lo largo de cualquier eje :
Tomando el producto escalar de cualquier vector unitario con la fórmula anterior se genera la expresión de cualquier operador de cúbit individual bajo cualquier rotación. Por ejemplo, se puede demostrar que .
Relación de completitud
Una notación alternativa que se utiliza comúnmente para las matrices de Pauli es escribir el índice vectorial k en superíndice y los índices de la matriz como subíndices, de modo que el elemento en la fila α y la columna β de la k -ésima matriz de Pauli sea σ k αβ .
En esta notación, la relación de completitud para las matrices de Pauli se puede escribir
Prueba
El hecho de que las matrices de Pauli, junto con la matriz identidad I , formen una base ortogonal para el espacio de Hilbert de todas las matrices hermíticas complejas 2 × 2 significa que podemos expresar cualquier matriz hermítica M como
donde c es un número complejo y a es un vector complejo de 3 componentes. Es sencillo demostrar, utilizando las propiedades enumeradas anteriormente, que
donde " tr " denota la traza , y por lo tanto que
que puede reescribirse en términos de índices de matriz como
donde la suma sobre los índices repetidos está implícita γ y δ . Dado que esto es cierto para cualquier elección de la matriz M , la relación de completitud se deduce como se indicó anteriormente. QED
Como se señaló anteriormente, es común denotar la matriz unitaria 2 × 2 por σ 0 , por lo que σ 0 αβ = δ αβ . La relación de completitud se puede expresar alternativamente como
El hecho de que cualquier matriz hermítica compleja 2 × 2 pueda expresarse en términos de la matriz identidad y las matrices de Pauli también conduce a la representación de esfera de Bloch de la matriz de densidad de estados mixtos 2 × 2 ( matrices 2 × 2 semidefinidas positivas con traza unitaria). Esto puede verse expresando primero una matriz hermítica arbitraria como una combinación lineal real de { σ 0 , σ 1 , σ 2 , σ 3 } como se indicó anteriormente, y luego imponiendo las condiciones de semidefinida positiva y traza 1 .
Para un estado puro, en coordenadas polares, la matriz de densidad idempotente
actúa sobre el vector propio de estado con valor propio +1, por lo tanto actúa como un operador de proyección .
Por lo tanto, sus valores propios son [d] 1 o −1. Por lo tanto, puede utilizarse como término de interacción en un hamiltoniano, dividiendo los valores propios de energía de sus estados propios simétricos frente a los antisimétricos.
SU(2)
El grupo SU(2) es el grupo de Lie de matrices unitarias 2 × 2 con determinante unitario; su álgebra de Lie es el conjunto de todas las matrices antihermíticas 2 × 2 con traza 0. El cálculo directo, como el anterior, muestra que el álgebra de Lie es el álgebra real tridimensional abarcada por el conjunto { iσ k } . En notación compacta,
Como resultado, cada iσ j puede verse como un generador infinitesimal de SU(2). Los elementos de SU(2) son exponenciales de combinaciones lineales de estos tres generadores, y se multiplican como se indicó anteriormente al analizar el vector de Pauli. Aunque esto es suficiente para generar SU(2), no es una representación adecuada de su(2) , ya que los valores propios de Pauli se escalan de manera no convencional. La normalización convencional es λ = 1/2 , de modo que
El álgebra de Lie es isomorfa al álgebra de Lie , que corresponde al grupo de Lie SO(3) , el grupo de rotaciones en el espacio tridimensional. En otras palabras, se puede decir que las iσ j son una realización (y, de hecho, la realización de menor dimensión) de rotaciones infinitesimales en el espacio tridimensional. Sin embargo, aunque y son isomorfas como álgebras de Lie, SU(2) y SO(3) no son isomorfas como grupos de Lie. SU(2) es en realidad una doble cobertura de SO(3) , lo que significa que hay un homomorfismo de grupo dos a uno de SU(2) a SO(3) , véase la relación entre SO(3) y SU(2) .
Cuaterniones
El espacio lineal real de { I , iσ 1 , iσ 2 , iσ 3 } es isomorfo al álgebra real de cuaterniones , , representado por el espacio de los vectores base. El isomorfismo de a este conjunto está dado por el siguiente mapa (observe los signos invertidos para las matrices de Pauli):
Alternativamente, el isomorfismo se puede lograr mediante un mapa que utiliza las matrices de Pauli en orden inverso, [5]
Como el conjunto de versores U ⊂ forma un grupo isomorfo a SU(2) , U proporciona otra forma de describir SU(2) . El homomorfismo dos a uno de SU(2) a SO(3) puede darse en términos de las matrices de Pauli en esta formulación.
Física
Mecánica clásica
En mecánica clásica , las matrices de Pauli son útiles en el contexto de los parámetros de Cayley-Klein. [6] La matriz P correspondiente a la posición de un punto en el espacio se define en términos de la matriz vectorial de Pauli anterior,
En consecuencia, la matriz de transformación Q θ para rotaciones alrededor del eje x a través de un ángulo θ puede escribirse en términos de matrices de Pauli y la matriz unitaria como [6]
Se aplican expresiones similares para las rotaciones generales de vectores de Pauli, como se detalla anteriormente.
Una propiedad interesante de las partículas con espín 1 ⁄ 2 es que deben rotarse en un ángulo de 4 π para volver a su configuración original. Esto se debe a la correspondencia de dos a uno entre SU(2) y SO(3) mencionada anteriormente, y al hecho de que, aunque uno visualiza el espín arriba/abajo como el polo norte-sur en la 2-esfera S 2 , en realidad están representados por vectores ortogonales en el espacio de Hilbert complejo bidimensional .
Para una partícula con espín 1 ⁄ 2 , el operador de espín viene dado por J = es/2 σ , la representación fundamental de SU(2) . Al tomar los productos de Kronecker de esta representación consigo misma repetidamente, se pueden construir todas las representaciones irreducibles superiores. Es decir, los operadores de espín resultantes para sistemas de espín superiores en tres dimensiones espaciales, para j arbitrariamente grande , se pueden calcular utilizando este operador de espín y operadores de escalera . Se pueden encontrar en Grupo de rotación SO(3) § Una nota sobre álgebras de Lie . La fórmula análoga a la generalización anterior de la fórmula de Euler para matrices de Pauli, el elemento de grupo en términos de matrices de espín, es manejable, pero menos simple. [7]
En la mecánica cuántica relativista , los espinores en cuatro dimensiones son matrices de 4 × 1 (o 1 × 4). Por lo tanto, las matrices de Pauli o las matrices Sigma que operan sobre estos espinores tienen que ser matrices de 4 × 4. Se definen en términos de matrices de Pauli de 2 × 2 como
De esta definición se deduce que las matrices tienen las mismas propiedades algebraicas que las matrices σ k .
Sin embargo, el momento angular relativista no es un trivector, sino un tetratensor de segundo orden . Por lo tanto, debe reemplazarse por Σ μν , el generador de transformaciones de Lorentz en espinores . Por la antisimetría del momento angular, los Σ μν también son antisimétricos. Por lo tanto, solo hay seis matrices independientes.
Las tres primeras son las Las tres restantes, donde las matrices α k de Dirac se definen como
Las matrices de espín relativistas Σ μν se escriben en forma compacta en términos del conmutador de matrices gamma como
Información cuántica
En información cuántica , las puertas cuánticas de un solo cúbit son matrices unitarias de 2 × 2. Las matrices de Pauli son algunas de las operaciones de un solo cúbit más importantes. En ese contexto, la descomposición de Cartan dada anteriormente se denomina "descomposición Z-Y de una puerta de un solo cúbit". La elección de un par de Cartan diferente da como resultado una " descomposición X-Y de una puerta de un solo cúbit " similar .
^
Esto se ajusta a la convención en matemáticas para la matriz exponencial , iσ ⟼ exp( iσ ) . En la convención en física , σ ⟼ exp(− iσ ) , por lo tanto, en ella no es necesaria ninguna premultiplicación por i para llegar a SU(2) .
^
El vector de Pauli es un recurso formal. Puede considerarse como un elemento de , donde el espacio del producto tensorial está dotado de una aplicación inducida por el producto escalar en
^ La relación entre a, b, c, n, m, k derivada aquí en la representación 2 × 2 se cumple para todas las representaciones de SU(2) , siendo una identidad de grupo . Nótese que, en virtud de la normalización estándar de los generadores de ese grupo como la mitad de las matrices de Pauli, los parámetros a , b , c corresponden a la mitad de los ángulos de rotación del grupo de rotación. Es decir, la fórmula de Gibbs vinculada suma .
^
Explícitamente, en la convención de "matrices del espacio derecho en elementos de matrices del espacio izquierdo", es
Notas
^ Gull, SF; Lasenby, AN; Doran, CJL (enero de 1993). "Los números imaginarios no son reales: el álgebra geométrica del espacio-tiempo" (PDF) . Encontrado. Phys . 23 (9): 1175–1201. Bibcode :1993FoPh...23.1175G. doi :10.1007/BF01883676. S2CID 14670523 . Consultado el 5 de mayo de 2023 – a través de geometry.mrao.cam.ac.uk.
^ Gibbs, JW (1884). "4. Sobre el cálculo diferencial e integral de vectores". Elementos de análisis vectorial . New Haven, CT: Tuttle, Moorehouse & Taylor. pág. 67.En realidad, sin embargo, la fórmula se remonta a Olinde Rodrigues (1840), repleta de medio ángulo: Rodrigues, Olinde (1840). "Des lois géometriques qui regissent les déplacements d' un systéme solide dans l' espace, et de la variación des coordonnées provenant de ces déplacement considérées indépendant des cause qui peuvent les produire" (PDF) . J. Matemáticas. Pures Appl. 5 : 380–440.
^ Nakahara, Mikio (2003). Geometría, Topología y Física (2ª ed.). Prensa CRC. pag. XXII. ISBN978-0-7503-0606-5– a través de Google Books.
^ ab Goldstein, Herbert (1959). Mecánica clásica . Addison-Wesley. págs. 109-118.