En física , específicamente en mecánica estadística , un conjunto (también conjunto estadístico ) es una idealización que consiste en un gran número de copias virtuales (a veces infinitas) de un sistema , consideradas todas a la vez, cada una de las cuales representa un posible estado en el que podría estar el sistema real. En otras palabras, un conjunto estadístico es un conjunto de sistemas de partículas utilizados en mecánica estadística para describir un solo sistema. [1] El concepto de conjunto fue introducido por J. Willard Gibbs en 1902. [2]
Un conjunto termodinámico es una variedad específica de conjunto estadístico que, entre otras propiedades, está en equilibrio estadístico (definido a continuación), y se utiliza para derivar las propiedades de los sistemas termodinámicos a partir de las leyes de la mecánica clásica o cuántica. [3] [4]
El conjunto formaliza la noción de que un experimentador que repite un experimento una y otra vez bajo las mismas condiciones macroscópicas, pero incapaz de controlar los detalles microscópicos, puede esperar observar una variedad de resultados diferentes.
El tamaño teórico de los conjuntos en termodinámica, mecánica estadística y mecánica estadística cuántica puede ser muy grande, incluyendo todos los estados microscópicos posibles en los que podría encontrarse el sistema, de acuerdo con sus propiedades macroscópicas observadas . Para muchos casos físicos importantes, es posible calcular promedios directamente sobre todo el conjunto termodinámico, para obtener fórmulas explícitas para muchas de las magnitudes termodinámicas de interés, a menudo en términos de la función de partición apropiada .
El concepto de conjunto en equilibrio o estacionario es crucial para muchas aplicaciones de los conjuntos estadísticos. Aunque un sistema mecánico ciertamente evoluciona con el tiempo, el conjunto no necesariamente tiene que evolucionar. De hecho, el conjunto no evolucionará si contiene todas las fases pasadas y futuras del sistema. Un conjunto estadístico de este tipo, uno que no cambia con el tiempo, se llama estacionario y se puede decir que está en equilibrio estadístico . [2]
El estudio de la termodinámica se ocupa de sistemas que, a la percepción humana, parecen "estáticos" (a pesar del movimiento de sus partes internas) y que pueden describirse simplemente mediante un conjunto de variables observables macroscópicamente. Estos sistemas pueden describirse mediante conjuntos estadísticos que dependen de unos pocos parámetros observables y que están en equilibrio estadístico. Gibbs observó que las diferentes restricciones macroscópicas conducen a diferentes tipos de conjuntos, con características estadísticas particulares.
"Podemos imaginar un gran número de sistemas de la misma naturaleza, pero que difieren en las configuraciones y velocidades que tienen en un instante dado, y que difieren no sólo infinitesimalmente, sino que pueden ser de tal manera que abarquen toda combinación concebible de configuraciones y velocidades..." JW Gibbs (1903) [5]
Gibbs definió tres conjuntos termodinámicos importantes: [2]
Los cálculos que se pueden realizar utilizando cada uno de estos conjuntos se exploran con más detalle en sus respectivos artículos. También se pueden definir otros conjuntos termodinámicos, correspondientes a diferentes requisitos físicos, para los que a menudo se pueden derivar fórmulas análogas de manera similar. Por ejemplo, en el conjunto de reacción, solo se permite que se produzcan fluctuaciones en el número de partículas de acuerdo con la estequiometría de las reacciones químicas que están presentes en el sistema. [6]
En el límite termodinámico, todos los conjuntos deberían producir observables idénticos debido a las transformadas de Legendre ; las desviaciones de esta regla ocurren bajo condiciones en que las variables de estado no son convexas, como en las mediciones moleculares pequeñas. [7]
La expresión matemática precisa para un conjunto estadístico tiene una forma distinta dependiendo del tipo de mecánica en consideración (cuántica o clásica). En el caso clásico, el conjunto es una distribución de probabilidad sobre los microestados. En mecánica cuántica, esta noción, debida a von Neumann , es una forma de asignar una distribución de probabilidad sobre los resultados de cada conjunto completo de observables conmutativos . En mecánica clásica, el conjunto se escribe en cambio como una distribución de probabilidad en el espacio de fases ; los microestados son el resultado de la partición del espacio de fases en unidades de igual tamaño, aunque el tamaño de estas unidades puede elegirse de forma algo arbitraria.
Dejando de lado por el momento la cuestión de cómo se generan operacionalmente los conjuntos estadísticos , deberíamos poder realizar las dos operaciones siguientes en los conjuntos A , B del mismo sistema:
Por lo tanto, en determinadas condiciones, las clases de equivalencia de conjuntos estadísticos tienen la estructura de un conjunto convexo.
Un conjunto estadístico en mecánica cuántica (también conocido como estado mixto) se representa con mayor frecuencia mediante una matriz de densidad , denotada por . La matriz de densidad proporciona una herramienta totalmente general que puede incorporar tanto incertidumbres cuánticas (presentes incluso si el estado del sistema fuera completamente conocido) como incertidumbres clásicas (debidas a la falta de conocimiento) de manera unificada. Cualquier observable físico X en mecánica cuántica se puede escribir como un operador, . El valor esperado de este operador en el conjunto estadístico viene dado por la siguiente traza :
Esto se puede utilizar para evaluar promedios (operador ), varianzas (usando el operador ), covarianzas (usando el operador ), etc. La matriz de densidad siempre debe tener una traza de 1: (esta es esencialmente la condición de que las probabilidades deben sumar uno).
En general, el conjunto evoluciona con el tiempo según la ecuación de von Neumann .
Los conjuntos de equilibrio (aquellos que no evolucionan con el tiempo, ) pueden escribirse únicamente como una función de variables conservadas. Por ejemplo, el conjunto microcanónico y el conjunto canónico son estrictamente funciones de la energía total, que se mide mediante el operador de energía total (hamiltoniano). El conjunto gran canónico es además una función del número de partículas, medido mediante el operador de número total de partículas . Dichos conjuntos de equilibrio son una matriz diagonal en la base ortogonal de estados que diagonalizan simultáneamente cada variable conservada. En la notación bra-ket , la matriz de densidad es
donde | ψ i ⟩ , indexados por i , son los elementos de una base completa y ortogonal. (Nótese que en otras bases, la matriz de densidad no es necesariamente diagonal).
En la mecánica clásica, un conjunto se representa mediante una función de densidad de probabilidad definida sobre el espacio de fases del sistema . [2] Mientras que un sistema individual evoluciona según las ecuaciones de Hamilton , la función de densidad (el conjunto) evoluciona con el tiempo según la ecuación de Liouville .
En un sistema mecánico con un número definido de partes, el espacio de fases tiene n coordenadas generalizadas llamadas q 1 , ... q n , y n momentos canónicos asociados llamados p 1 , ... p n . El conjunto se representa entonces mediante una función de densidad de probabilidad conjunta ρ ( p 1 , ... p n , q 1 , ... q n ) .
Si se permite que el número de partes del sistema varíe entre los sistemas del conjunto (como en un gran conjunto donde el número de partículas es una cantidad aleatoria), entonces es una distribución de probabilidad sobre un espacio de fase extendido que incluye variables adicionales como números de partículas N 1 (primer tipo de partícula), N 2 (segundo tipo de partícula), y así sucesivamente hasta N s (el último tipo de partícula; s es el número de tipos diferentes de partículas que hay). El conjunto se representa entonces mediante una función de densidad de probabilidad conjunta ρ ( N 1 , ... N s , p 1 , ... p n , q 1 , ... q n ) . El número de coordenadas n varía con el número de partículas.
Cualquier magnitud mecánica X puede escribirse como una función de la fase del sistema. El valor esperado de cualquier magnitud de este tipo se obtiene mediante una integral sobre todo el espacio de fases de esta magnitud ponderada por ρ :
Se aplica la condición de normalización de probabilidad, que requiere
El espacio de fases es un espacio continuo que contiene un número infinito de estados físicos distintos dentro de cualquier región pequeña. Para conectar la densidad de probabilidad en el espacio de fases con una distribución de probabilidad sobre microestados, es necesario dividir de alguna manera el espacio de fases en bloques que se distribuyan representando los diferentes estados del sistema de una manera justa. Resulta que la forma correcta de hacer esto simplemente da como resultado bloques de igual tamaño del espacio de fases canónico, y por lo tanto un microestado en mecánica clásica es una región extendida en el espacio de fases de coordenadas canónicas que tiene un volumen particular. [nota 1] En particular, la función de densidad de probabilidad en el espacio de fases, ρ , está relacionada con la distribución de probabilidad sobre microestados, P por un factor
dónde
Dado que h se puede elegir de forma arbitraria, el tamaño teórico de un microestado también es arbitrario. Aun así, el valor de h influye en las compensaciones de magnitudes como la entropía y el potencial químico, por lo que es importante ser coherente con el valor de h al comparar diferentes sistemas.
Por lo general, el espacio de fases contiene duplicados del mismo estado físico en múltiples ubicaciones distintas. Esto es una consecuencia de la forma en que se codifica un estado físico en coordenadas matemáticas; la elección más simple del sistema de coordenadas a menudo permite codificar un estado de múltiples maneras. Un ejemplo de esto es un gas de partículas idénticas cuyo estado se escribe en términos de las posiciones y momentos individuales de las partículas: cuando se intercambian dos partículas, el punto resultante en el espacio de fases es diferente, y sin embargo corresponde a un estado físico idéntico del sistema. Es importante en mecánica estadística (una teoría sobre los estados físicos) reconocer que el espacio de fases es solo una construcción matemática y no contar ingenuamente en exceso los estados físicos reales al integrar sobre el espacio de fases. El recuento excesivo puede causar problemas graves:
En general, es difícil encontrar un sistema de coordenadas que codifique de forma única cada estado físico. Por lo tanto, suele ser necesario utilizar un sistema de coordenadas con varias copias de cada estado y, luego, reconocer y eliminar el exceso de recuento.
Una forma rudimentaria de eliminar el recuento excesivo sería definir manualmente una subregión del espacio de fases que incluya cada estado físico solo una vez y luego excluir todas las demás partes del espacio de fases. En un gas, por ejemplo, se podrían incluir solo aquellas fases donde las coordenadas x de las partículas estén ordenadas en orden ascendente. Si bien esto resolvería el problema, la integral resultante sobre el espacio de fases sería tediosa de realizar debido a su forma de límite inusual. (En este caso, el factor C introducido anteriormente se establecería en C = 1 , y la integral se restringiría a la subregión seleccionada del espacio de fases).
Una forma más sencilla de corregir el sobreconteo es integrar sobre todo el espacio de fases, pero reduciendo el peso de cada fase para compensar exactamente el sobreconteo. Esto se logra mediante el factor C introducido anteriormente, que es un número entero que representa de cuántas maneras se puede representar un estado físico en el espacio de fases. Su valor no varía con las coordenadas canónicas continuas [nota 4] , por lo que el sobreconteo se puede corregir simplemente integrando sobre el rango completo de coordenadas canónicas y luego dividiendo el resultado por el factor de sobreconteo. Sin embargo, C varía mucho con variables discretas, como el número de partículas, por lo que debe aplicarse antes de sumar sobre el número de partículas.
Como se mencionó anteriormente, el ejemplo clásico de este recuento excesivo es el de un sistema fluido que contiene varios tipos de partículas, donde dos partículas cualesquiera del mismo tipo son indistinguibles e intercambiables. Cuando el estado se escribe en términos de las posiciones y momentos individuales de las partículas, entonces el recuento excesivo relacionado con el intercambio de partículas idénticas se corrige utilizando [2].
Esto se conoce como "conteo de Boltzmann correcto".
La formulación de conjuntos estadísticos utilizada en física ha sido ampliamente adoptada en otros campos, en parte porque se ha reconocido que el conjunto canónico o medida de Gibbs sirve para maximizar la entropía de un sistema, sujeto a un conjunto de restricciones: este es el principio de máxima entropía . Este principio ahora se ha aplicado ampliamente a problemas en lingüística , robótica y similares.
Además, los conjuntos estadísticos en física a menudo se construyen sobre un principio de localidad : que todas las interacciones son solo entre átomos vecinos o moléculas cercanas. Así, por ejemplo, los modelos de red , como el modelo de Ising , modelan materiales ferromagnéticos por medio de interacciones de vecino más cercano entre espines. La formulación estadística del principio de localidad ahora se ve como una forma de la propiedad de Markov en sentido amplio; los vecinos más cercanos son ahora mantas de Markov . Por lo tanto, la noción general de un conjunto estadístico con interacciones de vecino más cercano conduce a campos aleatorios de Markov , que nuevamente encuentran una amplia aplicabilidad; por ejemplo, en redes de Hopfield .
En mecánica estadística , el promedio del conjunto se define como la media de una cantidad que es función del microestado de un sistema, de acuerdo con la distribución del sistema en sus microestados en este conjunto .
Dado que el promedio del conjunto depende del conjunto elegido, su expresión matemática varía de un conjunto a otro. Sin embargo, la media obtenida para una cantidad física dada no depende del conjunto elegido en el límite termodinámico . El conjunto gran canónico es un ejemplo de sistema abierto . [8]
Para un sistema clásico en equilibrio térmico con su entorno, el promedio del conjunto toma la forma de una integral sobre el espacio de fases del sistema:
dónde
El denominador de esta expresión se conoce como función de partición y se denota con la letra Z.
En mecánica estadística cuántica , para un sistema cuántico en equilibrio térmico con su entorno, el promedio ponderado toma la forma de una suma sobre estados de energía cuántica , en lugar de una integral continua: [ aclaración necesaria ]
La versión generalizada de la función de partición proporciona el marco completo para trabajar con promedios de conjuntos en termodinámica, teoría de la información , mecánica estadística y mecánica cuántica .
El conjunto microcanónico representa un sistema aislado en el que la energía ( E ), el volumen ( V ) y el número de partículas ( N ) son todos constantes. El conjunto canónico representa un sistema cerrado que puede intercambiar energía ( E ) con su entorno (normalmente un baño de calor), pero el volumen ( V ) y el número de partículas ( N ) son todos constantes. El conjunto gran canónico representa un sistema abierto que puede intercambiar energía ( E ) y partículas ( N ) con su entorno, pero el volumen ( V ) se mantiene constante.
En la discusión dada hasta ahora, si bien rigurosa, hemos dado por sentado que la noción de conjunto es válida a priori, como se hace comúnmente en el contexto físico. Lo que no se ha demostrado es que el conjunto en sí mismo (no los resultados consecuentes) es un objeto definido con precisión matemáticamente. Por ejemplo,
En esta sección intentaremos responder parcialmente a esta pregunta.
Supongamos que tenemos un procedimiento de preparación para un sistema en un laboratorio de física: por ejemplo, el procedimiento podría implicar un aparato físico y algunos protocolos para manipular el aparato. Como resultado de este procedimiento de preparación, se produce un sistema y se lo mantiene aislado durante un pequeño período de tiempo. Al repetir este procedimiento de preparación de laboratorio, obtenemos una secuencia de sistemas X 1 , X 2 , ..., X k , que en nuestra idealización matemática, suponemos que es una secuencia infinita de sistemas. Los sistemas son similares en el sentido de que todos se produjeron de la misma manera. Esta secuencia infinita es un conjunto.
En un entorno de laboratorio, cada uno de estos sistemas preparados podría utilizarse como entrada para un procedimiento de prueba posterior . Nuevamente, el procedimiento de prueba implica un aparato físico y algunos protocolos; como resultado del procedimiento de prueba obtenemos una respuesta de sí o no . Dado un procedimiento de prueba E aplicado a cada sistema preparado, obtenemos una secuencia de valores Meas ( E , X 1 ), Meas ( E , X 2 ), ..., Meas ( E , X k ). Cada uno de estos valores es un 0 (o no) o un 1 (sí).
Supongamos que existe el siguiente promedio de tiempo:
En el caso de los sistemas mecánicos cuánticos, una suposición importante que se hace en el enfoque de la lógica cuántica para la mecánica cuántica es la identificación de preguntas de respuesta sí o no en la red de subespacios cerrados de un espacio de Hilbert. Con algunas suposiciones técnicas adicionales, se puede inferir que los estados están dados por operadores de densidad S, de modo que:
Vemos que esto refleja la definición de estados cuánticos en general: un estado cuántico es un mapeo de los observables a sus valores esperados.