La modulación de código de pulso ( PCM ) es un método utilizado para representar digitalmente señales analógicas . Es la forma estándar de audio digital en computadoras, discos compactos , telefonía digital y otras aplicaciones de audio digital. En un flujo PCM , la amplitud de la señal analógica se muestrea a intervalos uniformes y cada muestra se cuantifica al valor más cercano dentro de un rango de pasos digitales.
La modulación lineal de código de pulso ( LPCM ) es un tipo específico de PCM en el que los niveles de cuantificación son linealmente uniformes. [5] Esto contrasta con las codificaciones PCM en las que los niveles de cuantificación varían en función de la amplitud (como ocurre con el algoritmo de ley A o el algoritmo de ley μ ). Aunque PCM es un término más general, a menudo se utiliza para describir datos codificados como LPCM.
Un flujo PCM tiene dos propiedades básicas que determinan la fidelidad del flujo a la señal analógica original: la frecuencia de muestreo , que es el número de veces por segundo que se toman muestras; y la profundidad de bits , que determina el número de valores digitales posibles que se pueden utilizar para representar cada muestra.
Las primeras comunicaciones eléctricas comenzaron a muestrear señales para multiplexar muestras de múltiples fuentes telegráficas y transmitirlas a través de un solo cable telegráfico. El inventor estadounidense Moses G. Farmer concibió la multiplexación por división de tiempo (TDM) del telégrafo ya en 1853. El ingeniero eléctrico WM Miner, en 1903, utilizó un conmutador electromecánico para multiplexar por división de tiempo múltiples señales telegráficas; también aplicó esta tecnología a la telefonía . Obtuvo voz inteligible de canales muestreados a una frecuencia superior a 3500-4300 Hz; los tipos más bajos resultaron insatisfactorios.
En 1920, el sistema de transmisión de imágenes por cable Bartlane utilizaba señalización telegráfica de caracteres perforados en cinta de papel para enviar muestras de imágenes cuantificadas a 5 niveles. [6] En 1926, Paul M. Rainey de Western Electric patentó una máquina de facsímil que transmitía su señal utilizando PCM de 5 bits, codificada por un convertidor optomecánico de analógico a digital . [7] La máquina no entró en producción. [8]
El ingeniero británico Alec Reeves , desconociendo trabajos anteriores, concibió el uso de PCM para la comunicación de voz en 1937 mientras trabajaba para International Telephone and Telegraph en Francia. Describió la teoría y sus ventajas, pero no resultó en ninguna aplicación práctica. Reeves solicitó una patente francesa en 1938 y su patente estadounidense fue concedida en 1943. [9] Para entonces, Reeves había comenzado a trabajar en el Telecommunications Research Establishment . [8]
La primera transmisión de voz mediante técnicas digitales, el equipo de cifrado SIGSALY , transmitió comunicaciones aliadas de alto nivel durante la Segunda Guerra Mundial . En 1943, los investigadores de los Laboratorios Bell que diseñaron el sistema SIGSALY se dieron cuenta del uso de la codificación binaria PCM, como ya lo había propuesto Reeves. En 1949, para el sistema DATAR de la Armada canadiense, Ferranti Canada construyó un sistema de radio PCM funcional que podía transmitir datos de radar digitalizados a largas distancias. [10]
A finales de la década de 1940 y principios de la de 1950, la PCM utilizaba un tubo codificador de rayos catódicos con un electrodo de placa que tenía perforaciones codificadoras. [11] Como en un osciloscopio , el haz se barría horizontalmente a la velocidad de muestreo mientras que la desviación vertical era controlada por la señal analógica de entrada, lo que hacía que el haz pasara a través de porciones superiores o inferiores de la placa perforada. La placa recogió o pasó el haz, produciendo variaciones actuales en el código binario, un bit a la vez. En lugar de binario natural, la rejilla del tubo posterior de Goodall fue perforada para producir un código Gray sin fallas y produjo todos los bits simultáneamente usando un haz de ventilador en lugar de un haz de escaneo. [12]
En los Estados Unidos, el Salón de la Fama de los Inventores Nacionales ha honrado a Bernard M. Oliver [13] y Claude Shannon [14] como los inventores del PCM, [15] como se describe en "Communication System Employing Pulse Code Modulation", patente estadounidense 2.801.281. presentada en 1946 y 1952, concedida en 1956. John R. Pierce presentó otra patente con el mismo título en 1945 y se emitió en 1948: patente estadounidense 2.437.707 . Los tres publicaron "La Filosofía del PCM" en 1948. [16]
El sistema T-carrier , introducido en 1961, utiliza dos líneas de transmisión de par trenzado para transportar 24 llamadas telefónicas PCM muestreadas a 8 kHz y una resolución de 8 bits. Este desarrollo mejoró la capacidad y la calidad de las llamadas en comparación con los esquemas anteriores de multiplexación por división de frecuencia .
En 1973, P. Cummiskey, Nikil Jayant y James L. Flanagan desarrollaron la modulación diferencial adaptativa de código de pulso (ADPCM) . [17]
En 1967, las instalaciones de investigación de NHK en Japón desarrollaron la primera grabadora PCM . [18] El dispositivo de 30 kHz y 12 bits utilizaba un compresor (similar a DBX Noise Reduction ) para ampliar el rango dinámico y almacenaba las señales en una grabadora de vídeo . En 1969, NHK amplió las capacidades del sistema a estéreo de 2 canales y resolución de 32 kHz y 13 bits. En enero de 1971, utilizando el sistema de grabación PCM de NHK, los ingenieros de Denon grabaron las primeras grabaciones digitales comerciales. [nota 1] [18]
En 1972, Denon presentó la primera grabadora digital de 8 canales, la DN-023R, que utilizaba una grabadora de vídeo de transmisión de carrete abierto de 4 cabezales para grabar en audio PCM de 13 bits y 47,25 kHz. [nota 2] En 1977, Denon desarrolló el sistema de grabación PCM portátil, el DN-034R. Al igual que el DN-023R, grababa 8 canales a 47,25 kHz, pero utilizaba 14 bits "con énfasis , lo que equivale a 15,5 bits". [18]
En 1979 se grabó el primer álbum pop digital, Bop Until You Drop . Se grabó en PCM lineal de 16 bits y 50 kHz utilizando una grabadora digital 3M. [19]
El disco compacto (CD) llevó el PCM a las aplicaciones de audio de consumo con su introducción en 1982. El CD utiliza una frecuencia de muestreo de 44.100 Hz y una resolución de 16 bits y almacena hasta 80 minutos de audio estéreo por disco.
El rápido desarrollo y la amplia adopción de la telefonía digital PCM fueron posibles gracias a la tecnología de circuitos de condensadores conmutados (SC ) semiconductores de óxido metálico (MOS), desarrollada a principios de la década de 1970. [20] Esto llevó al desarrollo de chips de filtro de códec PCM a finales de la década de 1970. [20] [21] El chip de filtro códec PCM CMOS (MOS complementario) de puerta de silicio , desarrollado por David A. Hodges y WC Black en 1980, [20] ha sido desde entonces el estándar de la industria para la telefonía digital. [20] [21] En la década de 1990, las redes de telecomunicaciones , como la red telefónica pública conmutada (PSTN), se habían digitalizado en gran medida con filtros códec PCM CMOS de integración a muy gran escala (VLSI), ampliamente utilizados en sistemas de conmutación electrónica para telefonía. centrales , módems de usuario final y una amplia gama de aplicaciones de transmisión digital , como la red digital de servicios integrados (RDSI), teléfonos inalámbricos y teléfonos móviles . [21]
PCM es el método de codificación que se utiliza normalmente para audio digital sin comprimir. [nota 3]
En el diagrama, se muestrea y cuantifica una onda sinusoidal (curva roja) para PCM. La onda sinusoidal se muestrea a intervalos regulares, que se muestran como líneas verticales. Para cada muestra, se elige uno de los valores disponibles (en el eje y). El proceso PCM se implementa comúnmente en un único circuito integrado llamado convertidor analógico a digital (ADC). Esto produce una representación totalmente discreta de la señal de entrada (puntos azules) que se puede codificar fácilmente como datos digitales para su almacenamiento o manipulación. Varios flujos PCM también podrían multiplexarse en un flujo de datos agregado más grande , generalmente para la transmisión de múltiples flujos a través de un único enlace físico. Una técnica se llama multiplexación por división de tiempo (TDM) y se utiliza ampliamente, especialmente en el sistema telefónico público moderno.
La electrónica involucrada en la producción de una señal analógica precisa a partir de datos discretos es similar a la utilizada para generar la señal digital. Estos dispositivos son convertidores de digital a analógico (DAC). Producen un voltaje o corriente (según el tipo) que representa el valor presentado en sus entradas digitales. Esta salida generalmente se filtraría y amplificaría para su uso.
Para recuperar la señal original de los datos muestreados, un demodulador puede aplicar el procedimiento de modulación a la inversa. Después de cada período de muestreo, el demodulador lee el siguiente valor y realiza la transición de la señal de salida al nuevo valor. Como resultado de estas transiciones, la señal retiene una cantidad significativa de energía de alta frecuencia debido a los efectos de imagen. Para eliminar estas frecuencias indeseables, el demodulador pasa la señal a través de un filtro de reconstrucción que suprime la energía fuera del rango de frecuencia esperado (mayor que la frecuencia de Nyquist ). [nota 4]
Las profundidades de muestra comunes para LPCM son 8, 16, 20 o 24 bits por muestra . [1] [2] [3] [29]
LPCM codifica un único canal de sonido. La compatibilidad con audio multicanal depende del formato del archivo y se basa en la sincronización de múltiples transmisiones LPCM. [5] [30] Si bien dos canales (estéreo) es el formato más común, los sistemas pueden admitir hasta 8 canales de audio (envolvente 7.1) [2] [3] o más.
Las frecuencias de muestreo comunes son 48 kHz , como las que se usan con videos en formato DVD , o 44,1 kHz, como las que se usan en CD. En algunos equipos se pueden utilizar frecuencias de muestreo de 96 kHz o 192 kHz, pero se han debatido sus beneficios. [31]
El teorema de muestreo de Nyquist-Shannon muestra que los dispositivos PCM pueden funcionar sin introducir distorsiones dentro de sus bandas de frecuencia diseñadas si proporcionan una frecuencia de muestreo al menos dos veces mayor que la frecuencia más alta contenida en la señal de entrada. Por ejemplo, en telefonía , la banda de frecuencia de voz utilizable oscila entre aproximadamente 300 Hz y 3400 Hz. [32] Para una reconstrucción eficaz de la señal de voz, las aplicaciones de telefonía suelen utilizar una frecuencia de muestreo de 8000 Hz, que es más del doble de la frecuencia de voz más alta utilizable.
De todos modos, existen fuentes potenciales de deterioro implícitas en cualquier sistema PCM:
Algunas formas de PCM combinan el procesamiento de señales con la codificación. Las versiones anteriores de estos sistemas aplicaban el procesamiento en el dominio analógico como parte del proceso de analógico a digital; Las implementaciones más nuevas lo hacen en el dominio digital. Estas técnicas simples han quedado obsoletas en gran medida debido a las técnicas modernas de compresión de audio basadas en transformaciones , como la codificación por transformada de coseno discreta modificada (MDCT).
En telefonía, una señal de audio estándar para una sola llamada telefónica se codifica en 8.000 muestras por segundo , de 8 bits cada una, lo que da una señal digital de 64 kbit/s conocida como DS0 . La codificación de compresión de señal predeterminada en un DS0 es PCM de ley μ (ley mu) (Norteamérica y Japón) o PCM de ley A (Europa y la mayor parte del resto del mundo). Estos son sistemas de compresión logarítmica en los que un número de muestra PCM lineal de 12 o 13 bits se asigna a un valor de 8 bits. Este sistema está descrito por el estándar internacional G.711 .
Cuando los costos del circuito son altos y la pérdida de calidad de la voz es aceptable, a veces tiene sentido comprimir aún más la señal de voz. Se utiliza un algoritmo ADPCM para mapear una serie de muestras PCM de ley μ o ley A de 8 bits en una serie de muestras ADPCM de 4 bits. De esta forma se duplica la capacidad de la línea. La técnica se detalla en el estándar G.726 .
Se han desarrollado formatos de codificación de audio y códecs de audio para lograr una mayor compresión. Algunas de estas técnicas han sido estandarizadas y patentadas. Las técnicas de compresión avanzadas, como la transformada de coseno discreta modificada (MDCT) y la codificación predictiva lineal (LPC), se utilizan ahora ampliamente en teléfonos móviles , voz sobre IP (VoIP) y medios de streaming .
PCM puede ser con retorno a cero (RZ) o sin retorno a cero (NRZ). Para que un sistema NRZ se sincronice utilizando información dentro de banda, no debe haber largas secuencias de símbolos idénticos, como unos o ceros. Para los sistemas PCM binarios, la densidad de los símbolos 1 se llama densidad de unos . [33]
La densidad de unos a menudo se controla mediante técnicas de precodificación, como la codificación de longitud de ejecución limitada , donde el código PCM se expande a un código ligeramente más largo con un límite garantizado en la densidad de unos antes de la modulación en el canal. En otros casos, se agregan bits de trama adicionales al flujo, lo que garantiza al menos transiciones de símbolos ocasionales.
Otra técnica utilizada para controlar la densidad es el uso de un codificador de datos, que tenderá a convertir el flujo de datos en un flujo que parece pseudoaleatorio , pero donde los datos pueden recuperarse exactamente mediante un decodificador complementario. En este caso, todavía son posibles ejecuciones largas de ceros o unos en la salida, pero se consideran lo suficientemente improbables como para permitir una sincronización confiable.
En otros casos, el valor de CC a largo plazo de la señal modulada es importante, ya que la creación de una polarización de CC tenderá a mover los circuitos de comunicaciones fuera de su rango operativo. En este caso, se toman medidas especiales para mantener un recuento de la polarización de CC acumulada y modificar los códigos si es necesario para que la polarización de CC siempre tienda a cero.
Muchos de estos códigos son códigos bipolares , donde los pulsos pueden ser positivos, negativos o ausentes. En el típico código de inversión de marcas alternativas , los pulsos distintos de cero alternan entre positivos y negativos. Estas reglas pueden violarse para generar símbolos especiales utilizados para enmarcar u otros fines especiales.
La palabra pulso en el término modulación de código de pulso se refiere a los pulsos que se encuentran en la línea de transmisión. Esto quizás sea una consecuencia natural de que esta técnica haya evolucionado junto con dos métodos analógicos, la modulación por ancho de pulso y la modulación por posición de pulso , en los que la información a codificar está representada por pulsos de señal discreta de diferente ancho o posición, respectivamente. [ cita necesaria ] A este respecto, PCM se parece poco a estas otras formas de codificación de señales, excepto que todas pueden usarse en multiplexación por división de tiempo y los números de los códigos PCM se representan como pulsos eléctricos.
{{cite journal}}
: Citar diario requiere |journal=
( ayuda ){{cite journal}}
: Citar diario requiere |journal=
( ayuda ){{cite journal}}
: Citar diario requiere |journal=
( ayuda ){{cite book}}
: |work=
ignorado ( ayuda ){{cite book}}
: |work=
ignorado ( ayuda )El álbum Ry Cooder Bop Till You Drop fue el primer álbum pop grabado digitalmente.
{{cite journal}}
: Citar diario requiere |journal=
( ayuda ){{cite journal}}
: Mantenimiento CS1: varios nombres: lista de autores ( enlace )