stringtranslate.com

Modulación de código de pulso

La modulación de código de pulso ( PCM ) es un método utilizado para representar digitalmente señales analógicas muestreadas . Es la forma estándar de audio digital en computadoras, discos compactos , telefonía digital y otras aplicaciones de audio digital. En un flujo PCM , la amplitud de la señal analógica se muestrea a intervalos uniformes y cada muestra se cuantifica al valor más cercano dentro de un rango de pasos digitales.

La modulación lineal de código de pulso ( LPCM ) es un tipo específico de PCM en el que los niveles de cuantificación son linealmente uniformes. [5] Esto contrasta con las codificaciones PCM en las que los niveles de cuantificación varían en función de la amplitud (como ocurre con el algoritmo de ley A o el algoritmo de ley μ ). Aunque PCM es un término más general, a menudo se utiliza para describir datos codificados como LPCM.

Un flujo PCM tiene dos propiedades básicas que determinan la fidelidad del flujo a la señal analógica original: la frecuencia de muestreo , que es el número de veces por segundo que se toman muestras; y la profundidad de bits , que determina el número de valores digitales posibles que se pueden utilizar para representar cada muestra.

Historia

Las primeras comunicaciones eléctricas comenzaron a muestrear señales para multiplexar muestras de múltiples fuentes telegráficas y transmitirlas a través de un solo cable telegráfico. El inventor estadounidense Moses G. Farmer concibió la multiplexación por división de tiempo (TDM) del telégrafo ya en 1853. El ingeniero eléctrico WM Miner, en 1903, utilizó un conmutador electromecánico para multiplexar por división de tiempo múltiples señales telegráficas; también aplicó esta tecnología a la telefonía . Obtuvo voz inteligible de canales muestreados a una frecuencia superior a 3500-4300 Hz; los tipos más bajos resultaron insatisfactorios.

En 1920, el sistema de transmisión de imágenes por cable Bartlane utilizaba señalización telegráfica de caracteres perforados en cinta de papel para enviar muestras de imágenes cuantificadas a 5 niveles. [6] En 1926, Paul M. Rainey de Western Electric patentó una máquina de facsímil que transmitía su señal utilizando PCM de 5 bits, codificada por un convertidor optomecánico de analógico a digital . [7] La ​​máquina no entró en producción. [8]

El ingeniero británico Alec Reeves , desconociendo trabajos anteriores, concibió el uso de PCM para la comunicación de voz en 1937 mientras trabajaba para International Telephone and Telegraph en Francia. Describió la teoría y sus ventajas, pero no resultó en ninguna aplicación práctica. Reeves solicitó una patente francesa en 1938 y su patente estadounidense fue concedida en 1943. [9] Para entonces, Reeves había comenzado a trabajar en el Establecimiento de Investigación de Telecomunicaciones . [8]

La primera transmisión de voz mediante técnicas digitales, el equipo de cifrado SIGSALY , transmitió comunicaciones aliadas de alto nivel durante la Segunda Guerra Mundial . En 1943, los investigadores de los Laboratorios Bell que diseñaron el sistema SIGSALY se dieron cuenta del uso de la codificación binaria PCM, como ya lo había propuesto Reeves. En 1949, para el sistema DATAR de la Armada canadiense, Ferranti Canadá construyó un sistema de radio PCM funcional que podía transmitir datos de radar digitalizados a largas distancias. [10]

A finales de la década de 1940 y principios de la de 1950, la PCM utilizaba un tubo codificador de rayos catódicos con un electrodo de placa que tenía perforaciones codificadoras. [11] Como en un osciloscopio , el haz se barría horizontalmente a la velocidad de muestreo mientras que la desviación vertical era controlada por la señal analógica de entrada, lo que hacía que el haz pasara a través de porciones superiores o inferiores de la placa perforada. La placa recogió o pasó el haz, produciendo variaciones actuales en el código binario, un bit a la vez. En lugar de binario natural, la rejilla del tubo posterior de Goodall fue perforada para producir un código Gray sin fallas y produjo todos los bits simultáneamente usando un haz de ventilador en lugar de un haz de escaneo. [12]

En los Estados Unidos, el Salón de la Fama de los Inventores Nacionales ha honrado a Bernard M. Oliver [13] y Claude Shannon [14] como los inventores del PCM, [15] como se describe en "Communication System Employing Pulse Code Modulation", patente estadounidense 2.801.281. presentada en 1946 y 1952, concedida en 1956. John R. Pierce presentó otra patente con el mismo título en 1945 y se emitió en 1948: patente estadounidense 2.437.707 . Los tres publicaron "La Filosofía del PCM" en 1948. [16]

El sistema T-carrier , introducido en 1961, utiliza dos líneas de transmisión de par trenzado para transportar 24 llamadas telefónicas PCM muestreadas a 8 kHz y una resolución de 8 bits. Este desarrollo mejoró la capacidad y la calidad de las llamadas en comparación con los esquemas anteriores de multiplexación por división de frecuencia .

En 1973, P. Cummiskey, Nikil Jayant y James L. Flanagan desarrollaron la modulación diferencial adaptativa de código de pulso (ADPCM) . [17]

Grabaciones de audio digitales

En 1967, las instalaciones de investigación de NHK en Japón desarrollaron la primera grabadora PCM . [18] El dispositivo de 30 kHz y 12 bits utilizaba un compresor (similar a DBX Noise Reduction ) para ampliar el rango dinámico y almacenaba las señales en una grabadora de vídeo . En 1969, NHK amplió las capacidades del sistema a estéreo de 2 canales y resolución de 32 kHz y 13 bits. En enero de 1971, utilizando el sistema de grabación PCM de NHK, los ingenieros de Denon grabaron las primeras grabaciones digitales comerciales. [nota 1] [18]

En 1972, Denon presentó la primera grabadora digital de 8 canales, la DN-023R, que utilizaba una grabadora de vídeo de transmisión de carrete abierto de 4 cabezales para grabar en audio PCM de 13 bits y 47,25 kHz. [nota 2] En 1977, Denon desarrolló el sistema de grabación PCM portátil, el DN-034R. Al igual que el DN-023R, grababa 8 canales a 47,25 kHz, pero utilizaba 14 bits "con énfasis , lo que equivale a 15,5 bits". [18]

En 1979 se grabó el primer álbum de pop digital, Bop Until You Drop . Se grabó en PCM lineal de 16 bits y 50 kHz utilizando una grabadora digital 3M. [19]

El disco compacto (CD) llevó PCM a las aplicaciones de audio de consumo con su introducción en 1982. El CD utiliza una frecuencia de muestreo de 44.100 Hz y una resolución de 16 bits y almacena hasta 80 minutos de audio estéreo por disco.

Telefonía digital

El rápido desarrollo y la amplia adopción de la telefonía digital PCM fueron posibles gracias a la tecnología de circuitos de condensadores conmutados (SC) semiconductores de óxido metálico (MOS ), desarrollada a principios de la década de 1970. [20] Esto llevó al desarrollo de chips de filtro de códec PCM a finales de la década de 1970. [20] [21] El chip de filtro códec PCM CMOS (MOS complementario) de puerta de silicio , desarrollado por David A. Hodges y WC Black en 1980, [20] ha sido desde entonces el estándar de la industria para la telefonía digital. [20] [21] En la década de 1990, las redes de telecomunicaciones , como la red telefónica pública conmutada (PSTN), se habían digitalizado en gran medida con filtros códec PCM CMOS de integración a muy gran escala (VLSI), ampliamente utilizados en sistemas de conmutación electrónica para telefonía. centrales , módems de usuario final y una amplia gama de aplicaciones de transmisión digital , como la red digital de servicios integrados (RDSI), teléfonos inalámbricos y teléfonos móviles . [21]

Implementaciones

PCM es el método de codificación que se utiliza normalmente para audio digital sin comprimir. [nota 3]

Modulación

Muestreo y cuantificación de una señal (rojo) para LPCM de 4 bits en un dominio de tiempo a una frecuencia específica.

En el diagrama, se muestrea y cuantifica una onda sinusoidal (curva roja) para PCM. La onda sinusoidal se muestrea a intervalos regulares, que se muestran como líneas verticales. Para cada muestra, se elige uno de los valores disponibles (en el eje y). El proceso PCM se implementa comúnmente en un único circuito integrado llamado convertidor analógico a digital (ADC). Esto produce una representación totalmente discreta de la señal de entrada (puntos azules) que se puede codificar fácilmente como datos digitales para su almacenamiento o manipulación. Varios flujos PCM también podrían multiplexarse ​​en un flujo de datos agregado más grande , generalmente para la transmisión de múltiples flujos a través de un único enlace físico. Una técnica se llama multiplexación por división de tiempo (TDM) y se utiliza ampliamente, especialmente en el sistema telefónico público moderno.

Demodulación

La electrónica involucrada en la producción de una señal analógica precisa a partir de datos discretos es similar a la utilizada para generar la señal digital. Estos dispositivos son convertidores de digital a analógico (DAC). Producen un voltaje o corriente (según el tipo) que representa el valor presentado en sus entradas digitales. Esta salida generalmente se filtraría y amplificaría para su uso.

Para recuperar la señal original de los datos muestreados, un demodulador puede aplicar el procedimiento de modulación a la inversa. Después de cada período de muestreo, el demodulador lee el siguiente valor y realiza la transición de la señal de salida al nuevo valor. Como resultado de estas transiciones, la señal retiene una cantidad significativa de energía de alta frecuencia debido a los efectos de imagen. Para eliminar estas frecuencias indeseables, el demodulador pasa la señal a través de un filtro de reconstrucción que suprime la energía fuera del rango de frecuencia esperado (mayor que la frecuencia de Nyquist ). [nota 4]

Precisión y tasas de muestreo estándar

Las profundidades de muestra comunes para LPCM son 8, 16, 20 o 24 bits por muestra . [1] [2] [3] [29]

LPCM codifica un único canal de sonido. La compatibilidad con audio multicanal depende del formato del archivo y se basa en la sincronización de múltiples transmisiones LPCM. [5] [30] Si bien dos canales (estéreo) es el formato más común, los sistemas pueden admitir hasta 8 canales de audio (envolvente 7.1) [2] [3] o más.

Las frecuencias de muestreo comunes son 48 kHz , como las que se usan con videos en formato DVD , o 44,1 kHz, como las que se usan en CD. En algunos equipos se pueden utilizar frecuencias de muestreo de 96 kHz o 192 kHz, pero se han debatido sus beneficios. [31]

Limitaciones

El teorema de muestreo de Nyquist-Shannon muestra que los dispositivos PCM pueden funcionar sin introducir distorsiones dentro de sus bandas de frecuencia diseñadas si proporcionan una frecuencia de muestreo al menos dos veces mayor que la frecuencia más alta contenida en la señal de entrada. Por ejemplo, en telefonía , la banda de frecuencia de voz utilizable oscila entre aproximadamente 300  Hz y 3400 Hz. [32] Para una reconstrucción eficaz de la señal de voz, las aplicaciones de telefonía suelen utilizar una frecuencia de muestreo de 8000 Hz, que es más del doble de la frecuencia de voz más alta utilizable.

De todos modos, existen fuentes potenciales de deterioro implícitas en cualquier sistema PCM:

Procesamiento y codificación

Algunas formas de PCM combinan el procesamiento de señales con la codificación. Las versiones anteriores de estos sistemas aplicaban el procesamiento en el dominio analógico como parte del proceso de analógico a digital; Las implementaciones más nuevas lo hacen en el dominio digital. Estas técnicas simples han quedado obsoletas en gran medida debido a las técnicas modernas de compresión de audio basadas en transformaciones , como la codificación por transformada de coseno discreta modificada (MDCT).

En telefonía, una señal de audio estándar para una sola llamada telefónica se codifica en 8.000 muestras por segundo , de 8 bits cada una, dando una señal digital de 64 kbit/s conocida como DS0 . La codificación de compresión de señal predeterminada en un DS0 es PCM de ley μ (ley mu) (Norteamérica y Japón) o PCM de ley A (Europa y la mayor parte del resto del mundo). Estos son sistemas de compresión logarítmica en los que un número de muestra PCM lineal de 12 o 13 bits se asigna a un valor de 8 bits. Este sistema está descrito por el estándar internacional G.711 .

Cuando los costos del circuito son altos y la pérdida de calidad de la voz es aceptable, a veces tiene sentido comprimir aún más la señal de voz. Se utiliza un algoritmo ADPCM para mapear una serie de muestras PCM de ley μ o ley A de 8 bits en una serie de muestras ADPCM de 4 bits. De esta forma se duplica la capacidad de la línea. La técnica se detalla en el estándar G.726 .

Se han desarrollado formatos de codificación de audio y códecs de audio para lograr una mayor compresión. Algunas de estas técnicas han sido estandarizadas y patentadas. Las técnicas de compresión avanzadas, como la transformada de coseno discreta modificada (MDCT) y la codificación predictiva lineal (LPC), se utilizan ahora ampliamente en teléfonos móviles , voz sobre IP (VoIP) y medios de streaming .

Codificación para transmisión en serie.

PCM puede ser con retorno a cero (RZ) o sin retorno a cero (NRZ). Para que un sistema NRZ se sincronice utilizando información dentro de banda, no debe haber largas secuencias de símbolos idénticos, como unos o ceros. Para los sistemas PCM binarios, la densidad de los símbolos 1 se llama densidad de unos . [33]

La densidad de unos a menudo se controla mediante técnicas de precodificación, como la codificación de longitud de ejecución limitada , donde el código PCM se expande a un código ligeramente más largo con un límite garantizado en la densidad de unos antes de la modulación en el canal. En otros casos, se agregan bits de trama adicionales al flujo, lo que garantiza al menos transiciones de símbolos ocasionales.

Otra técnica utilizada para controlar la densidad es el uso de un codificador de datos, que tenderá a convertir el flujo de datos en un flujo que parece pseudoaleatorio , pero donde los datos pueden recuperarse exactamente mediante un decodificador complementario. En este caso, todavía son posibles ejecuciones largas de ceros o unos en la salida, pero se consideran lo suficientemente improbables como para permitir una sincronización confiable.

En otros casos, el valor de CC a largo plazo de la señal modulada es importante, ya que la creación de una polarización de CC tenderá a mover los circuitos de comunicaciones fuera de su rango operativo. En este caso, se toman medidas especiales para mantener un recuento de la polarización de CC acumulada y modificar los códigos si es necesario para que la polarización de CC siempre tienda a cero.

Muchos de estos códigos son códigos bipolares , donde los pulsos pueden ser positivos, negativos o ausentes. En el típico código de inversión de marcas alternativas , los pulsos distintos de cero alternan entre positivos y negativos. Estas reglas pueden violarse para generar símbolos especiales utilizados para enmarcar u otros fines especiales.

Nomenclatura

La palabra pulso en el término modulación de código de pulso se refiere a los pulsos que se encuentran en la línea de transmisión. Esto quizás sea una consecuencia natural de que esta técnica haya evolucionado junto con dos métodos analógicos, la modulación por ancho de pulso y la modulación por posición de pulso , en los que la información a codificar está representada por pulsos de señal discreta de diferente ancho o posición, respectivamente. [ cita necesaria ] A este respecto, PCM se parece poco a estas otras formas de codificación de señales, excepto que todas pueden usarse en multiplexación por división de tiempo y los números de los códigos PCM se representan como pulsos eléctricos.

Ver también

Notas explicatorias

  1. Entre las primeras grabaciones estuvo Uzu: The World Of Stomu Yamash'ta 2 de Stomu Yamashta .
  2. ^ La primera grabación con este nuevo sistema se realizó en Tokio del 24 al 26 de abril de 1972.
  3. ^ Existen otros métodos, como la modulación de densidad de pulso, que también se utiliza en Super Audio CD .
  4. ^ Algunos sistemas utilizan filtrado digital para eliminar parte del alias, convirtiendo la señal de digital a analógica a una frecuencia de muestreo más alta, de modo que el filtro antialiasing analógico sea mucho más simple. En algunos sistemas, no se realiza ningún filtrado explícito; Como es imposible que cualquier sistema reproduzca una señal con un ancho de banda infinito, las pérdidas inherentes al sistema compensan los artefactos, o el sistema simplemente no requiere mucha precisión.
  5. ^ El error de cuantificación oscila entre - q /2 y q /2. En el caso ideal (con un ADC completamente lineal y nivel de señal >> q ), se distribuye uniformemente en este intervalo, con media cero y varianza de q 2/12 .
  6. ^ Una ligera diferencia entre las frecuencias de reloj de codificación y decodificación no suele ser una preocupación importante; un pequeño error constante no se nota. Sin embargo , el error del reloj se convierte en un problema importante si el reloj contiene una fluctuación significativa .

Referencias

  1. ^ abc Alvestrand, Harald Tveit; Salsman, James (mayo de 1999). "RFC 2586: tipo de contenido MIME Audio/L16". La sociedad de Internet. doi : 10.17487/RFC2586 . Consultado el 16 de marzo de 2010 . {{cite journal}}: Citar diario requiere |journal=( ayuda )
  2. ^ abc Casner, S. (marzo de 2007). "RFC 4856 - Registro de tipo de medio de formatos de carga útil en el perfil RTP para conferencias de audio y vídeo - Registro de tipo de medio audio/L8". El Fideicomiso IETF. doi : 10.17487/RFC4856 . Consultado el 16 de marzo de 2010 . {{cite journal}}: Citar diario requiere |journal=( ayuda )
  3. ^ abcd Bormann, C.; Casner, S.; Kobayashi, K.; Ogawa, A. (enero de 2002). "RFC 3190: formato de carga útil RTP para audio DAT de 12 bits y audio muestreado lineal de 20 y 24 bits". La sociedad de Internet. doi : 10.17487/RFC3190 . Consultado el 16 de marzo de 2010 . {{cite journal}}: Citar diario requiere |journal=( ayuda )
  4. ^ "Tipos de medios de audio". Autoridad de asignación de números de Internet . Consultado el 16 de marzo de 2010 .
  5. ^ abcd "Audio modulado por código de pulso lineal (LPCM)". Biblioteca del Congreso . 19 de abril de 2022 . Consultado el 5 de septiembre de 2022 .
  6. ^ "El sistema de transmisión Bartlane". DigicamHistory.com. Archivado desde el original el 10 de febrero de 2010 . Consultado el 7 de enero de 2010 .
  7. ^ Patente estadounidense número 1.608.527; ver también pág. 8, Manual de conversión de datos , Walter Allan Kester, ed., Newnes, 2005, ISBN 0-7506-7841-0
  8. ^ ab John Vardalas (junio de 2013), Modulación de código de pulso: todo comenzó hace 75 años con Alec Reeves, IEEE
  9. ^ Estados Unidos 2272070 
  10. ^ Portero, Arthur (2004). "Tantas colinas que escalar ". Grupo de Publicaciones Beckham. ISBN 9780931761188.[ página necesaria ]
  11. ^ Sears, RW (enero de 1948). Tubo de desviación de haz de electrones para modulación de código de pulso. vol. 27. Laboratorios Bell . págs. 44–57 . Consultado el 14 de mayo de 2017 . {{cite book}}: |work=ignorado ( ayuda )
  12. ^ Goodall, WM (enero de 1951). Televisión por modulación de código de pulsos. vol. 30. Laboratorios Bell . págs. 33–49 . Consultado el 14 de mayo de 2017 . {{cite book}}: |work=ignorado ( ayuda )
  13. ^ "Bernard Oliver". Salón de la Fama Nacional de los Inventores . Archivado desde el original el 5 de diciembre de 2010 . Consultado el 6 de febrero de 2011 .
  14. ^ "Claude Shannon". Salón de la Fama Nacional de los Inventores . Archivado desde el original el 6 de diciembre de 2010 . Consultado el 6 de febrero de 2011 .
  15. ^ "El Salón Nacional de la Fama de los Inventores anuncia la promoción de inventores de 2004". Blog de ciencia . 11 de febrero de 2004 . Consultado el 6 de febrero de 2011 .
  16. ^ BM Oliver; JR Pierce y CE Shannon (noviembre de 1948). "La Filosofía del PCM". Actas del IRE . 36 (11): 1324-1331. doi :10.1109/JRPROC.1948.231941. ISSN  0096-8390. S2CID  51663786.
  17. ^ P. Cummiskey, NS Jayant y JL Flanagan, "Cuantización adaptativa en codificación PCM diferencial de la voz", Bell Syst. Tecnología. J., vol. 52, págs. 1105-1118, septiembre de 1973.
  18. ^ abc Thomas bien (2008). "El amanecer de la grabación digital comercial" (PDF) . Revista ARSC . 39 (1): 1–17.
  19. ^ Roger Nichols. "No puedo seguir el ritmo de todos los formatos II". Archivado desde el original el 20 de octubre de 2002. El álbum Ry Cooder Bop Till You Drop fue el primer álbum pop grabado digitalmente.
  20. ^ abcd Allstot, David J. (2016). "Filtros de condensadores conmutados" (PDF) . En Maloberti, Franco; Davies, Anthony C. (eds.). Una breve historia de los circuitos y sistemas: de las redes ecológicas, móviles y generalizadas a la informática de big data . Sociedad de Sistemas y Circuitos IEEE . págs. 105-110. ISBN 9788793609860. Archivado desde el original (PDF) el 30 de septiembre de 2021 . Consultado el 29 de noviembre de 2019 .
  21. ^ abc Floyd, Michael D.; Hillman, Garth D. (8 de octubre de 2018) [primera publicación. 2000]. "Filtros de códec de modulación de código de pulso". El manual de comunicaciones (2ª ed.). Prensa CRC . págs. 26–1, 26–2, 26–3. ISBN 9781420041163.
  22. ^ Cambron, G. Keith (17 de octubre de 2012). Redes globales: ingeniería, operaciones y diseño . John Wiley e hijos. pag. 345.
  23. ^ Blu-ray Disc Association (marzo de 2005), Informe técnico Formato de disco Blu-ray: especificaciones de formato de aplicación audiovisual 2.B para BD-ROM (PDF) , consultado el 26 de julio de 2009
  24. ^ "Notas técnicas de DVD (DVD vídeo -" Libro B ") - Especificaciones de datos de audio". 21 de julio de 1996 . Consultado el 16 de marzo de 2010 .
  25. ^ Jim Taylor. "Preguntas frecuentes (y respuestas) sobre DVD: detalles de audio de DVD-Video" . Consultado el 20 de marzo de 2010 .
  26. ^ "Cómo funciona DV". Archivado desde el original el 6 de diciembre de 2007 . Consultado el 21 de marzo de 2010 .
  27. ^ "Sitio web de información AVCHD: descripción general de las especificaciones del formato AVCHD" . Consultado el 21 de marzo de 2010 .
  28. ^ EBU (julio de 2009), EBU Tech 3306 - MBWF / RF64: un formato de archivo extendido para audio (PDF) , archivado desde el original (PDF) el 22 de noviembre de 2009 , recuperado 19 de enero 2010
  29. ^ Mostafa, Mohamed; Kumar, Rajesh (mayo de 2001). "RFC 3108 - Convenciones para el uso del Protocolo de descripción de sesión (SDP) para conexiones portadoras ATM". doi : 10.17487/RFC3108 . Consultado el 16 de marzo de 2010 . {{cite journal}}: Citar diario requiere |journal=( ayuda )
  30. ^ "PCM, audio modulado por código de pulso". Biblioteca del Congreso. 6 de abril de 2022 . Consultado el 5 de septiembre de 2022 .
  31. ^ Christopher, Montgometría. "Descargas de música 24/192 y por qué no tienen sentido". Chris "Monty" Montgomery. Archivado desde el original el 6 de septiembre de 2014 . Consultado el 16 de marzo de 2013 .
  32. ^ https://www.its.bldrdoc.gov/fs-1037/dir-039/_5829.htm [ verificación fallida ]
  33. ^ Stallings, William, Técnicas de señalización digital, diciembre de 1984, vol. 22, No. 12, Revista de Comunicaciones IEEE

Otras lecturas

enlaces externos