La modulación por código de pulsos ( PCM ) es un método utilizado para representar digitalmente señales analógicas . Es la forma estándar de audio digital en computadoras, discos compactos , telefonía digital y otras aplicaciones de audio digital. En una transmisión PCM , la amplitud de la señal analógica se muestrea a intervalos uniformes y cada muestra se cuantifica al valor más cercano dentro de un rango de pasos digitales. Se le atribuye su invención a Alec Reeves , Claude Shannon , Barney Oliver y John R. Pierce . [6] [7] [8]
La modulación por código de pulsos lineal ( LPCM ) es un tipo específico de PCM en el que los niveles de cuantificación son linealmente uniformes. [5] Esto contrasta con las codificaciones PCM en las que los niveles de cuantificación varían en función de la amplitud (como con el algoritmo de la ley A o el algoritmo de la ley μ ). Aunque PCM es un término más general, a menudo se utiliza para describir datos codificados como LPCM.
Una secuencia PCM tiene dos propiedades básicas que determinan la fidelidad de la secuencia a la señal analógica original: la frecuencia de muestreo , que es la cantidad de veces por segundo que se toman muestras, y la profundidad de bits , que determina la cantidad de valores digitales posibles que se pueden usar para representar cada muestra.
Las primeras comunicaciones eléctricas comenzaron a muestrear señales para multiplexar muestras de múltiples fuentes telegráficas y transmitirlas a través de un solo cable telegráfico. El inventor estadounidense Moses G. Farmer concibió la multiplexación por división de tiempo (TDM) telegráfica ya en 1853. El ingeniero eléctrico WM Miner, en 1903, utilizó un conmutador electromecánico para multiplexar por división de tiempo múltiples señales telegráficas; también aplicó esta tecnología a la telefonía . Obtuvo voz inteligible de canales muestreados a una frecuencia superior a 3500–4300 Hz; frecuencias inferiores resultaron insatisfactorias.
En 1920, el sistema de transmisión de imágenes por cable Bartlane utilizó la señalización telegráfica de caracteres perforados en cinta de papel para enviar muestras de imágenes cuantificadas a 5 niveles. [9] En 1926, Paul M. Rainey de Western Electric patentó una máquina de fax que transmitía su señal utilizando PCM de 5 bits, codificada por un convertidor analógico a digital opto-mecánico . [10] La máquina no entró en producción. [11]
El ingeniero británico Alec Reeves , que desconocía trabajos anteriores, concibió el uso de PCM para la comunicación de voz en 1937 mientras trabajaba para International Telephone and Telegraph en Francia. Describió la teoría y sus ventajas, pero no se produjo ninguna aplicación práctica. Reeves solicitó una patente francesa en 1938 y su patente estadounidense le fue concedida en 1943. [12] En ese momento, Reeves había comenzado a trabajar en el Telecommunications Research Establishment . [11]
La primera transmisión de voz mediante técnicas digitales, el equipo de cifrado SIGSALY , transmitió comunicaciones aliadas de alto nivel durante la Segunda Guerra Mundial . En 1943, los investigadores de Bell Labs que diseñaron el sistema SIGSALY se dieron cuenta del uso de la codificación binaria PCM, tal como ya había propuesto Reeves. En 1949, para el sistema DATAR de la Armada canadiense , Ferranti Canada construyó un sistema de radio PCM funcional que podía transmitir datos de radar digitalizados a largas distancias. [13]
A finales de los años 1940 y principios de los años 1950, el PCM utilizaba un tubo de codificación de rayos catódicos con un electrodo de placa que tenía perforaciones de codificación. [14] Al igual que en un osciloscopio , el haz se barría horizontalmente a la frecuencia de muestreo mientras que la desviación vertical estaba controlada por la señal analógica de entrada, lo que hacía que el haz pasara por partes más altas o más bajas de la placa perforada. La placa recogía o dejaba pasar el haz, lo que producía variaciones de corriente en el código binario, un bit a la vez. En lugar del binario natural, la rejilla del tubo posterior de Goodall estaba perforada para producir un código Gray sin fallos y producía todos los bits simultáneamente utilizando un haz en abanico en lugar de un haz de exploración. [15]
En los Estados Unidos, el Salón de la Fama de los Inventores Nacionales ha honrado a Bernard M. Oliver [16] y Claude Shannon [17] como los inventores de PCM, [18] como se describe en "Sistema de comunicación que emplea modulación por código de pulsos", patente estadounidense 2.801.281 presentada en 1946 y 1952, concedida en 1956. Otra patente con el mismo título fue presentada por John R. Pierce en 1945, y concedida en 1948: patente estadounidense 2.437.707 . Los tres publicaron "La filosofía de PCM" en 1948. [19]
El sistema de portadora T , introducido en 1961, utiliza dos líneas de transmisión de par trenzado para transportar 24 llamadas telefónicas PCM muestreadas a 8 kHz y una resolución de 8 bits. Este desarrollo mejoró la capacidad y la calidad de las llamadas en comparación con los esquemas de multiplexación por división de frecuencia anteriores .
En 1973, P. Cummiskey, Nikil Jayant y James L. Flanagan desarrollaron la modulación de código de pulso diferencial adaptativa (ADPCM) . [20]
En 1967, las instalaciones de investigación de NHK en Japón desarrollaron la primera grabadora PCM . [21] El dispositivo de 12 bits y 30 kHz utilizaba un compresor-expansor (similar a DBX Noise Reduction ) para ampliar el rango dinámico y almacenaba las señales en una grabadora de cinta de vídeo . En 1969, NHK amplió las capacidades del sistema a estéreo de 2 canales y resolución de 13 bits y 32 kHz. En enero de 1971, utilizando el sistema de grabación PCM de NHK, los ingenieros de Denon grabaron las primeras grabaciones digitales comerciales. [nota 1] [21]
En 1972, Denon presentó la primera grabadora digital de 8 canales, la DN-023R, que utilizaba una grabadora de cinta de vídeo de transmisión de carrete abierto de 4 cabezales para grabar audio PCM de 13 bits y 47,25 kHz. [nota 2] En 1977, Denon desarrolló el sistema de grabación PCM portátil, el DN-034R. Al igual que el DN-023R, grababa 8 canales a 47,25 kHz, pero utilizaba 14 bits "con énfasis , lo que lo hacía equivalente a 15,5 bits". [21]
En 1979 se grabó el primer álbum pop digital, Bop till You Drop , en formato PCM lineal de 50 kHz y 16 bits, utilizando una grabadora de cinta digital 3M. [22]
El disco compacto (CD) trajo la PCM a las aplicaciones de audio de consumo con su introducción en 1982. El CD utiliza una frecuencia de muestreo de 44.100 Hz y una resolución de 16 bits y almacena hasta 80 minutos de audio estéreo por disco.
El rápido desarrollo y la amplia adopción de la telefonía digital PCM fue posible gracias a la tecnología de circuitos de condensadores conmutados (SC) de semiconductores de óxido de metal (MOS) , desarrollada a principios de la década de 1970. [23] Esto condujo al desarrollo de chips de filtro de códec PCM a fines de la década de 1970. [23] [24] El chip de filtro de códec PCM CMOS (MOS complementario) de compuerta de silicio , desarrollado por David A. Hodges y WC Black en 1980, [23] ha sido desde entonces el estándar de la industria para la telefonía digital. [23] [24] En la década de 1990, las redes de telecomunicaciones como la red telefónica pública conmutada (PSTN) se habían digitalizado en gran medida con filtros códec PCM CMOS de integración a muy gran escala (VLSI), ampliamente utilizados en sistemas de conmutación electrónica para centrales telefónicas , módems de usuario y una amplia gama de aplicaciones de transmisión digital como la red digital de servicios integrados (ISDN), teléfonos inalámbricos y teléfonos celulares . [24]
PCM es el método de codificación que se utiliza normalmente para audio digital sin comprimir. [nota 3]
En el diagrama, se muestrea y cuantifica una onda sinusoidal (curva roja) para PCM. La onda sinusoidal se muestrea a intervalos regulares, que se muestran como líneas verticales. Para cada muestra, se elige uno de los valores disponibles (en el eje y). El proceso PCM se implementa comúnmente en un solo circuito integrado llamado convertidor analógico a digital (ADC). Esto produce una representación completamente discreta de la señal de entrada (puntos azules) que se puede codificar fácilmente como datos digitales para almacenamiento o manipulación. También se pueden multiplexar varios flujos PCM en un flujo de datos agregado más grande , generalmente para la transmisión de múltiples flujos a través de un solo enlace físico. Una técnica se llama multiplexación por división de tiempo (TDM) y se usa ampliamente, en particular en el sistema telefónico público moderno.
Los componentes electrónicos que intervienen en la producción de una señal analógica precisa a partir de datos discretos son similares a los que se utilizan para generar la señal digital. Estos dispositivos son convertidores de digital a analógico (DAC). Producen un voltaje o una corriente (según el tipo) que representa el valor presentado en sus entradas digitales. Esta salida generalmente se filtra y amplifica para su uso.
Para recuperar la señal original a partir de los datos muestreados, un demodulador puede aplicar el procedimiento de modulación en sentido inverso. Después de cada período de muestreo, el demodulador lee el siguiente valor y realiza la transición de la señal de salida al nuevo valor. Como resultado de estas transiciones, la señal retiene una cantidad significativa de energía de alta frecuencia debido a los efectos de imagen. Para eliminar estas frecuencias no deseadas, el demodulador pasa la señal a través de un filtro de reconstrucción que suprime la energía fuera del rango de frecuencia esperado (mayor que la frecuencia de Nyquist ). [nota 4]
Las profundidades de muestra comunes para LPCM son 8, 16, 20 o 24 bits por muestra . [1] [2] [3] [32]
LPCM codifica un único canal de sonido. La compatibilidad con audio multicanal depende del formato de archivo y de la sincronización de múltiples transmisiones LPCM. [5] [33] Si bien dos canales (estéreo) es el formato más común, los sistemas pueden admitir hasta 8 canales de audio (sonido envolvente 7.1) [2] [3] o más.
Las frecuencias de muestreo más comunes son 48 kHz, como las que se utilizan en los vídeos en formato DVD , o 44,1 kHz, como las que se utilizan en los CD. En algunos equipos se pueden utilizar frecuencias de muestreo de 96 kHz o 192 kHz, pero se ha debatido sobre sus ventajas. [34]
El teorema de muestreo de Nyquist-Shannon muestra que los dispositivos PCM pueden funcionar sin introducir distorsiones dentro de sus bandas de frecuencia diseñadas si proporcionan una frecuencia de muestreo al menos el doble de la frecuencia más alta contenida en la señal de entrada. Por ejemplo, en telefonía , la banda de frecuencia de voz utilizable varía de aproximadamente 300 Hz a 3400 Hz. [35] Por lo tanto, para una reconstrucción efectiva de la señal de voz, las aplicaciones de telefonía suelen utilizar una frecuencia de muestreo de 8000 Hz, que es más del doble de la frecuencia de voz más alta utilizable.
De todos modos, existen fuentes potenciales de deterioro implícitas en cualquier sistema PCM:
Algunas formas de PCM combinan el procesamiento de señales con la codificación. Las versiones anteriores de estos sistemas aplicaban el procesamiento en el dominio analógico como parte del proceso de conversión de analógico a digital; las implementaciones más nuevas lo hacen en el dominio digital. Estas técnicas simples han quedado obsoletas en gran medida debido a las técnicas modernas de compresión de audio basadas en transformadas , como la codificación por transformada de coseno discreta modificada (MDCT).
En telefonía, una señal de audio estándar para una sola llamada telefónica se codifica como 8000 muestras por segundo , de 8 bits cada una, lo que da como resultado una señal digital de 64 kbit/s conocida como DS0 . La codificación de compresión de señal predeterminada en un DS0 es PCM de ley μ (ley mu) (Norteamérica y Japón) o PCM de ley A (Europa y la mayor parte del resto del mundo). Se trata de sistemas de compresión logarítmica en los que un número de muestra PCM lineal de 12 o 13 bits se asigna a un valor de 8 bits. Este sistema se describe en el estándar internacional G.711 .
Cuando los costos de los circuitos son altos y la pérdida de calidad de voz es aceptable, a veces tiene sentido comprimir aún más la señal de voz. Se utiliza un algoritmo ADPCM para mapear una serie de muestras PCM de ley μ o ley A de 8 bits en una serie de muestras ADPCM de 4 bits. De esta manera, se duplica la capacidad de la línea. La técnica se detalla en el estándar G.726 .
Se han desarrollado formatos de codificación de audio y códecs de audio para lograr una mayor compresión. Algunas de estas técnicas se han estandarizado y patentado. Las técnicas de compresión avanzadas, como la transformada de coseno discreta modificada (MDCT) y la codificación predictiva lineal (LPC), se utilizan ahora ampliamente en teléfonos móviles , voz sobre IP (VoIP) y transmisión de medios .
El PCM puede ser con retorno a cero (RZ) o sin retorno a cero (NRZ). Para que un sistema NRZ se sincronice utilizando información en banda, no debe haber secuencias largas de símbolos idénticos, como unos o ceros. Para los sistemas PCM binarios, la densidad de símbolos 1 se denomina densidad de unos . [36]
La densidad de unos suele controlarse mediante técnicas de precodificación, como la codificación limitada por longitud de ejecución , en la que el código PCM se expande hasta convertirse en un código ligeramente más largo con un límite garantizado en la densidad de unos antes de la modulación en el canal. En otros casos, se añaden bits de trama adicionales al flujo, lo que garantiza al menos transiciones de símbolos ocasionales.
Otra técnica utilizada para controlar la densidad de unos es el uso de un descifrador de datos, que tenderá a convertir el flujo de datos en un flujo que parece pseudoaleatorio , pero donde los datos pueden recuperarse exactamente mediante un descifrador complementario. En este caso, todavía es posible que haya largas series de ceros o unos en la salida, pero se considera que es lo suficientemente improbable como para permitir una sincronización confiable.
En otros casos, el valor de CC a largo plazo de la señal modulada es importante, ya que la acumulación de una polarización de CC tenderá a mover los circuitos de comunicaciones fuera de su rango operativo. En este caso, se toman medidas especiales para llevar un registro de la polarización de CC acumulada y para modificar los códigos, si es necesario, para que la polarización de CC siempre tienda a cero.
Muchos de estos códigos son códigos bipolares , en los que los pulsos pueden ser positivos, negativos o estar ausentes. En el código de inversión de marca alternada típico , los pulsos distintos de cero alternan entre ser positivos y negativos. Estas reglas pueden violarse para generar símbolos especiales que se utilizan para enmarcar u otros fines especiales.
La palabra pulso en el término modulación por código de pulsos se refiere a los pulsos que se encuentran en la línea de transmisión. Esto quizás sea una consecuencia natural de que esta técnica haya evolucionado junto con dos métodos analógicos, la modulación por ancho de pulso y la modulación por posición de pulso , en los que la información que se va a codificar se representa mediante pulsos de señal discretos de ancho o posición variables, respectivamente. [ cita requerida ] En este sentido, la PCM se parece poco a estas otras formas de codificación de señales, excepto que todas se pueden usar en multiplexación por división de tiempo y los números de los códigos PCM se representan como pulsos eléctricos.
{{cite journal}}
: Requiere citar revista |journal=
( ayuda ){{cite journal}}
: Requiere citar revista |journal=
( ayuda ){{cite journal}}
: Requiere citar revista |journal=
( ayuda ){{cite book}}
: |work=
ignorado ( ayuda ){{cite book}}
: |work=
ignorado ( ayuda )El álbum Bop Till You Drop de Ry Cooder fue el primer álbum pop grabado digitalmente.
{{cite journal}}
: Requiere citar revista |journal=
( ayuda ){{cite journal}}
: CS1 maint: multiple names: authors list (link)