stringtranslate.com

Modulación por código de pulsos

La modulación por código de pulsos ( PCM ) es un método utilizado para representar digitalmente señales analógicas . Es la forma estándar de audio digital en computadoras, discos compactos , telefonía digital y otras aplicaciones de audio digital. En una transmisión PCM , la amplitud de la señal analógica se muestrea a intervalos uniformes y cada muestra se cuantifica al valor más cercano dentro de un rango de pasos digitales. Se le atribuye su invención a Alec Reeves , Claude Shannon , Barney Oliver y John R. Pierce . [6] [7] [8]

La modulación por código de pulsos lineal ( LPCM ) es un tipo específico de PCM en el que los niveles de cuantificación son linealmente uniformes. [5] Esto contrasta con las codificaciones PCM en las que los niveles de cuantificación varían en función de la amplitud (como con el algoritmo de la ley A o el algoritmo de la ley μ ). Aunque PCM es un término más general, a menudo se utiliza para describir datos codificados como LPCM.

Una secuencia PCM tiene dos propiedades básicas que determinan la fidelidad de la secuencia a la señal analógica original: la frecuencia de muestreo , que es la cantidad de veces por segundo que se toman muestras, y la profundidad de bits , que determina la cantidad de valores digitales posibles que se pueden usar para representar cada muestra.

Historia

Las primeras comunicaciones eléctricas comenzaron a muestrear señales para multiplexar muestras de múltiples fuentes telegráficas y transmitirlas a través de un solo cable telegráfico. El inventor estadounidense Moses G. Farmer concibió la multiplexación por división de tiempo (TDM) telegráfica ya en 1853. El ingeniero eléctrico WM Miner, en 1903, utilizó un conmutador electromecánico para multiplexar por división de tiempo múltiples señales telegráficas; también aplicó esta tecnología a la telefonía . Obtuvo voz inteligible de canales muestreados a una frecuencia superior a 3500–4300 Hz; frecuencias inferiores resultaron insatisfactorias.

En 1920, el sistema de transmisión de imágenes por cable Bartlane utilizó la señalización telegráfica de caracteres perforados en cinta de papel para enviar muestras de imágenes cuantificadas a 5 niveles. [9] En 1926, Paul M. Rainey de Western Electric patentó una máquina de fax que transmitía su señal utilizando PCM de 5 bits, codificada por un convertidor analógico a digital opto-mecánico . [10] La máquina no entró en producción. [11]

El ingeniero británico Alec Reeves , que desconocía trabajos anteriores, concibió el uso de PCM para la comunicación de voz en 1937 mientras trabajaba para International Telephone and Telegraph en Francia. Describió la teoría y sus ventajas, pero no se produjo ninguna aplicación práctica. Reeves solicitó una patente francesa en 1938 y su patente estadounidense le fue concedida en 1943. [12] En ese momento, Reeves había comenzado a trabajar en el Telecommunications Research Establishment . [11]

La primera transmisión de voz mediante técnicas digitales, el equipo de cifrado SIGSALY , transmitió comunicaciones aliadas de alto nivel durante la Segunda Guerra Mundial . En 1943, los investigadores de Bell Labs que diseñaron el sistema SIGSALY se dieron cuenta del uso de la codificación binaria PCM, tal como ya había propuesto Reeves. En 1949, para el sistema DATAR de la Armada canadiense , Ferranti Canada construyó un sistema de radio PCM funcional que podía transmitir datos de radar digitalizados a largas distancias. [13]

A finales de los años 1940 y principios de los años 1950, el PCM utilizaba un tubo de codificación de rayos catódicos con un electrodo de placa que tenía perforaciones de codificación. [14] Al igual que en un osciloscopio , el haz se barría horizontalmente a la frecuencia de muestreo mientras que la desviación vertical estaba controlada por la señal analógica de entrada, lo que hacía que el haz pasara por partes más altas o más bajas de la placa perforada. La placa recogía o dejaba pasar el haz, lo que producía variaciones de corriente en el código binario, un bit a la vez. En lugar del binario natural, la rejilla del tubo posterior de Goodall estaba perforada para producir un código Gray sin fallos y producía todos los bits simultáneamente utilizando un haz en abanico en lugar de un haz de exploración. [15]

En los Estados Unidos, el Salón de la Fama de los Inventores Nacionales ha honrado a Bernard M. Oliver [16] y Claude Shannon [17] como los inventores de PCM, [18] como se describe en "Sistema de comunicación que emplea modulación por código de pulsos", patente estadounidense 2.801.281 presentada en 1946 y 1952, concedida en 1956. Otra patente con el mismo título fue presentada por John R. Pierce en 1945, y concedida en 1948: patente estadounidense 2.437.707 . Los tres publicaron "La filosofía de PCM" en 1948. [19]

El sistema de portadora T , introducido en 1961, utiliza dos líneas de transmisión de par trenzado para transportar 24 llamadas telefónicas PCM muestreadas a 8 kHz y una resolución de 8 bits. Este desarrollo mejoró la capacidad y la calidad de las llamadas en comparación con los esquemas de multiplexación por división de frecuencia anteriores .

En 1973, P. Cummiskey, Nikil Jayant y James L. Flanagan desarrollaron la modulación de código de pulso diferencial adaptativa (ADPCM) . [20]

Grabaciones de audio digitales

En 1967, las instalaciones de investigación de NHK en Japón desarrollaron la primera grabadora PCM . [21] El dispositivo de 12 bits y 30 kHz utilizaba un compresor-expansor (similar a DBX Noise Reduction ) para ampliar el rango dinámico y almacenaba las señales en una grabadora de cinta de vídeo . En 1969, NHK amplió las capacidades del sistema a estéreo de 2 canales y resolución de 13 bits y 32 kHz. En enero de 1971, utilizando el sistema de grabación PCM de NHK, los ingenieros de Denon grabaron las primeras grabaciones digitales comerciales. [nota 1] [21]

En 1972, Denon presentó la primera grabadora digital de 8 canales, la DN-023R, que utilizaba una grabadora de cinta de vídeo de transmisión de carrete abierto de 4 cabezales para grabar audio PCM de 13 bits y 47,25 kHz. [nota 2] En 1977, Denon desarrolló el sistema de grabación PCM portátil, el DN-034R. Al igual que el DN-023R, grababa 8 canales a 47,25 kHz, pero utilizaba 14 bits "con énfasis , lo que lo hacía equivalente a 15,5 bits". [21]

En 1979 se grabó el primer álbum pop digital, Bop till You Drop , en formato PCM lineal de 50 kHz y 16 bits, utilizando una grabadora de cinta digital 3M. [22]

El disco compacto (CD) trajo la PCM a las aplicaciones de audio de consumo con su introducción en 1982. El CD utiliza una frecuencia de muestreo de 44.100 Hz y una resolución de 16 bits y almacena hasta 80 minutos de audio estéreo por disco.

Telefonía digital

El rápido desarrollo y la amplia adopción de la telefonía digital PCM fue posible gracias a la tecnología de circuitos de condensadores conmutados (SC) de semiconductores de óxido de metal (MOS) , desarrollada a principios de la década de 1970. [23] Esto condujo al desarrollo de chips de filtro de códec PCM a fines de la década de 1970. [23] [24] El chip de filtro de códec PCM CMOS (MOS complementario) de compuerta de silicio , desarrollado por David A. Hodges y WC Black en 1980, [23] ha sido desde entonces el estándar de la industria para la telefonía digital. [23] [24] En la década de 1990, las redes de telecomunicaciones como la red telefónica pública conmutada (PSTN) se habían digitalizado en gran medida con filtros códec PCM CMOS de integración a muy gran escala (VLSI), ampliamente utilizados en sistemas de conmutación electrónica para centrales telefónicas , módems de usuario y una amplia gama de aplicaciones de transmisión digital como la red digital de servicios integrados (ISDN), teléfonos inalámbricos y teléfonos celulares . [24]

Implementaciones

PCM es el método de codificación que se utiliza normalmente para audio digital sin comprimir. [nota 3]

Modulación

Muestreo y cuantificación de una señal (roja) para LPCM de 4 bits en un dominio de tiempo a una frecuencia específica

En el diagrama, se muestrea y cuantifica una onda sinusoidal (curva roja) para PCM. La onda sinusoidal se muestrea a intervalos regulares, que se muestran como líneas verticales. Para cada muestra, se elige uno de los valores disponibles (en el eje y). El proceso PCM se implementa comúnmente en un solo circuito integrado llamado convertidor analógico a digital (ADC). Esto produce una representación completamente discreta de la señal de entrada (puntos azules) que se puede codificar fácilmente como datos digitales para almacenamiento o manipulación. También se pueden multiplexar varios flujos PCM en un flujo de datos agregado más grande , generalmente para la transmisión de múltiples flujos a través de un solo enlace físico. Una técnica se llama multiplexación por división de tiempo (TDM) y se usa ampliamente, en particular en el sistema telefónico público moderno.

Desmodulación

Los componentes electrónicos que intervienen en la producción de una señal analógica precisa a partir de datos discretos son similares a los que se utilizan para generar la señal digital. Estos dispositivos son convertidores de digital a analógico (DAC). Producen un voltaje o una corriente (según el tipo) que representa el valor presentado en sus entradas digitales. Esta salida generalmente se filtra y amplifica para su uso.

Para recuperar la señal original a partir de los datos muestreados, un demodulador puede aplicar el procedimiento de modulación en sentido inverso. Después de cada período de muestreo, el demodulador lee el siguiente valor y realiza la transición de la señal de salida al nuevo valor. Como resultado de estas transiciones, la señal retiene una cantidad significativa de energía de alta frecuencia debido a los efectos de imagen. Para eliminar estas frecuencias no deseadas, el demodulador pasa la señal a través de un filtro de reconstrucción que suprime la energía fuera del rango de frecuencia esperado (mayor que la frecuencia de Nyquist ). [nota 4]

Precisión y tasas de muestreo estándar

Las profundidades de muestra comunes para LPCM son 8, 16, 20 o 24 bits por muestra . [1] [2] [3] [32]

LPCM codifica un único canal de sonido. La compatibilidad con audio multicanal depende del formato de archivo y de la sincronización de múltiples transmisiones LPCM. [5] [33] Si bien dos canales (estéreo) es el formato más común, los sistemas pueden admitir hasta 8 canales de audio (sonido envolvente 7.1) [2] [3] o más.

Las frecuencias de muestreo más comunes son 48 kHz, como las que se utilizan en los vídeos en formato DVD , o 44,1 kHz, como las que se utilizan en los CD. En algunos equipos se pueden utilizar frecuencias de muestreo de 96 kHz o 192 kHz, pero se ha debatido sobre sus ventajas. [34]

Limitaciones

El teorema de muestreo de Nyquist-Shannon muestra que los dispositivos PCM pueden funcionar sin introducir distorsiones dentro de sus bandas de frecuencia diseñadas si proporcionan una frecuencia de muestreo al menos el doble de la frecuencia más alta contenida en la señal de entrada. Por ejemplo, en telefonía , la banda de frecuencia de voz utilizable varía de aproximadamente 300  Hz a 3400 Hz. [35] Por lo tanto, para una reconstrucción efectiva de la señal de voz, las aplicaciones de telefonía suelen utilizar una frecuencia de muestreo de 8000 Hz, que es más del doble de la frecuencia de voz más alta utilizable.

De todos modos, existen fuentes potenciales de deterioro implícitas en cualquier sistema PCM:

Procesamiento y codificación

Algunas formas de PCM combinan el procesamiento de señales con la codificación. Las versiones anteriores de estos sistemas aplicaban el procesamiento en el dominio analógico como parte del proceso de conversión de analógico a digital; las implementaciones más nuevas lo hacen en el dominio digital. Estas técnicas simples han quedado obsoletas en gran medida debido a las técnicas modernas de compresión de audio basadas en transformadas , como la codificación por transformada de coseno discreta modificada (MDCT).

En telefonía, una señal de audio estándar para una sola llamada telefónica se codifica como 8000 muestras por segundo , de 8 bits cada una, lo que da como resultado una señal digital de 64 kbit/s conocida como DS0 . La codificación de compresión de señal predeterminada en un DS0 es PCM de ley μ (ley mu) (Norteamérica y Japón) o PCM de ley A (Europa y la mayor parte del resto del mundo). Se trata de sistemas de compresión logarítmica en los que un número de muestra PCM lineal de 12 o 13 bits se asigna a un valor de 8 bits. Este sistema se describe en el estándar internacional G.711 .

Cuando los costos de los circuitos son altos y la pérdida de calidad de voz es aceptable, a veces tiene sentido comprimir aún más la señal de voz. Se utiliza un algoritmo ADPCM para mapear una serie de muestras PCM de ley μ o ley A de 8 bits en una serie de muestras ADPCM de 4 bits. De esta manera, se duplica la capacidad de la línea. La técnica se detalla en el estándar G.726 .

Se han desarrollado formatos de codificación de audio y códecs de audio para lograr una mayor compresión. Algunas de estas técnicas se han estandarizado y patentado. Las técnicas de compresión avanzadas, como la transformada de coseno discreta modificada (MDCT) y la codificación predictiva lineal (LPC), se utilizan ahora ampliamente en teléfonos móviles , voz sobre IP (VoIP) y transmisión de medios .

Codificación para transmisión en serie

El PCM puede ser con retorno a cero (RZ) o sin retorno a cero (NRZ). Para que un sistema NRZ se sincronice utilizando información en banda, no debe haber secuencias largas de símbolos idénticos, como unos o ceros. Para los sistemas PCM binarios, la densidad de símbolos 1 se denomina densidad de unos . [36]

La densidad de unos suele controlarse mediante técnicas de precodificación, como la codificación limitada por longitud de ejecución , en la que el código PCM se expande hasta convertirse en un código ligeramente más largo con un límite garantizado en la densidad de unos antes de la modulación en el canal. En otros casos, se añaden bits de trama adicionales al flujo, lo que garantiza al menos transiciones de símbolos ocasionales.

Otra técnica utilizada para controlar la densidad de unos es el uso de un descifrador de datos, que tenderá a convertir el flujo de datos en un flujo que parece pseudoaleatorio , pero donde los datos pueden recuperarse exactamente mediante un descifrador complementario. En este caso, todavía es posible que haya largas series de ceros o unos en la salida, pero se considera que es lo suficientemente improbable como para permitir una sincronización confiable.

En otros casos, el valor de CC a largo plazo de la señal modulada es importante, ya que la acumulación de una polarización de CC tenderá a mover los circuitos de comunicaciones fuera de su rango operativo. En este caso, se toman medidas especiales para llevar un registro de la polarización de CC acumulada y para modificar los códigos, si es necesario, para que la polarización de CC siempre tienda a cero.

Muchos de estos códigos son códigos bipolares , en los que los pulsos pueden ser positivos, negativos o estar ausentes. En el código de inversión de marca alternada típico , los pulsos distintos de cero alternan entre ser positivos y negativos. Estas reglas pueden violarse para generar símbolos especiales que se utilizan para enmarcar u otros fines especiales.

Nomenclatura

La palabra pulso en el término modulación por código de pulsos se refiere a los pulsos que se encuentran en la línea de transmisión. Esto quizás sea una consecuencia natural de que esta técnica haya evolucionado junto con dos métodos analógicos, la modulación por ancho de pulso y la modulación por posición de pulso , en los que la información que se va a codificar se representa mediante pulsos de señal discretos de ancho o posición variables, respectivamente. [ cita requerida ] En este sentido, la PCM se parece poco a estas otras formas de codificación de señales, excepto que todas se pueden usar en multiplexación por división de tiempo y los números de los códigos PCM se representan como pulsos eléctricos.

Véase también

Notas explicativas

  1. ^ Entre las primeras grabaciones se encontraba Uzu: The World Of Stomu Yamash'ta 2 de Stomu Yamashta .
  2. ^ La primera grabación con este nuevo sistema se realizó en Tokio entre el 24 y el 26 de abril de 1972.
  3. ^ Existen otros métodos, como la modulación de densidad de pulsos, utilizada también en Super Audio CD .
  4. ^ Algunos sistemas utilizan el filtrado digital para eliminar parte del aliasing, convirtiendo la señal de digital a analógica a una frecuencia de muestreo más alta, de modo que el filtro anti-aliasing analógico es mucho más simple. En algunos sistemas, no se realiza ningún filtrado explícito; como es imposible para cualquier sistema reproducir una señal con un ancho de banda infinito, las pérdidas inherentes en el sistema compensan los artefactos, o el sistema simplemente no requiere mucha precisión.
  5. ^ El error de cuantificación oscila entre - q /2 y q /2. En el caso ideal (con un ADC completamente lineal y un nivel de señal >> q ) se distribuye uniformemente en este intervalo, con media cero y varianza de q 2 /12.
  6. ^ Una ligera diferencia entre las frecuencias de reloj de codificación y decodificación no suele ser un problema importante; un pequeño error constante no se nota. Sin embargo, el error de reloj se convierte en un problema importante si el reloj contiene una fluctuación significativa .

Referencias

  1. ^ abc Alvestrand, Harald Tveit; Salsman, James (mayo de 1999). «RFC 2586 – El tipo de contenido MIME Audio/L16». The Internet Society. doi :10.17487/RFC2586 . Consultado el 16 de marzo de 2010 . {{cite journal}}: Requiere citar revista |journal=( ayuda )
  2. ^ abc Casner, S. (marzo de 2007). "RFC 4856 – Registro del tipo de medio de formatos de carga útil en el perfil RTP para conferencias de audio y video – Registro del tipo de medio audio/L8". The IETF Trust. doi :10.17487/RFC4856 . Consultado el 16 de marzo de 2010 . {{cite journal}}: Requiere citar revista |journal=( ayuda )
  3. ^ abcd Bormann, C.; Casner, S.; Kobayashi, K.; Ogawa, A. (enero de 2002). "RFC 3190 – Formato de carga útil RTP para audio DAT de 12 bits y audio muestreado lineal de 20 y 24 bits". The Internet Society. doi : 10.17487/RFC3190 . Consultado el 16 de marzo de 2010 . {{cite journal}}: Requiere citar revista |journal=( ayuda )
  4. ^ "Tipos de medios de audio". Autoridad de Números Asignados de Internet . Consultado el 16 de marzo de 2010 .
  5. ^ abcd «Audio modulado por código de pulso lineal (LPCM)». Biblioteca del Congreso . 19 de abril de 2022. Consultado el 5 de septiembre de 2022 .
  6. ^ Noll, A. Michael (1997). Highway of Dreams: A Critical View Along the Information Superhighway. Telecomunicaciones (edición revisada). Mahwah, NJ: Erlbaum. p. 50. ISBN 978-0-8058-2557-2.
  7. ^ Leibson, Steven (7 de septiembre de 2021). "Una breve historia del DSP de un solo chip, parte I". EEJournal . Consultado el 19 de septiembre de 2024 .
  8. ^ Barrett, G. Douglas (2023). Experimentando lo humano: arte, música y el poshumanismo contemporáneo. Chicago Londres: The University of Chicago Press . p. 102. ISBN 978-0-226-82340-9.
  9. ^ "El sistema de transmisión Bartlane". DigicamHistory.com. Archivado desde el original el 10 de febrero de 2010. Consultado el 7 de enero de 2010 .
  10. ^ Número de patente de EE. UU. 1.608.527; consulte también la pág. 8, Manual de conversión de datos , Walter Allan Kester, ed., Newnes, 2005, ISBN 0-7506-7841-0
  11. ^ por John Vardalas (junio de 2013), Modulación por código de pulsos: todo comenzó hace 75 años con Alec Reeves, IEEE
  12. ^ Estados Unidos 2272070 
  13. ^ Porter, Arthur (2004). Tantas colinas por escalar . Beckham Publications Group. ISBN 9780931761188.[ página necesaria ]
  14. ^ Sears, RW (enero de 1948). Tubo de deflexión de haz de electrones para modulación por código de pulsos. Vol. 27. Bell Labs . pp. 44–57 . Consultado el 14 de mayo de 2017 . {{cite book}}: |work=ignorado ( ayuda )
  15. ^ Goodall, WM (enero de 1951). Televisión por modulación por pulsos codificados. Vol. 30. Bell Labs . pp. 33–49 . Consultado el 14 de mayo de 2017 . {{cite book}}: |work=ignorado ( ayuda )
  16. ^ "Bernard Oliver". Salón Nacional de la Fama de los Inventores . Archivado desde el original el 5 de diciembre de 2010. Consultado el 6 de febrero de 2011 .
  17. ^ "Claude Shannon". Salón Nacional de la Fama de los Inventores . Archivado desde el original el 6 de diciembre de 2010. Consultado el 6 de febrero de 2011 .
  18. ^ "El Salón de la Fama de los Inventores Nacionales anuncia la clase de inventores de 2004". Blog de ciencia . 11 de febrero de 2004 . Consultado el 6 de febrero de 2011 .
  19. ^ BM Oliver; JR Pierce y CE Shannon (noviembre de 1948). "La filosofía de la PCM". Actas del IRE . 36 (11): 1324–1331. doi :10.1109/JRPROC.1948.231941. ISSN  0096-8390. S2CID  51663786.
  20. ^ P. Cummiskey, NS Jayant y JL Flanagan, "Cuantización adaptativa en la codificación PCM diferencial del habla", Bell Syst. Tech. J., vol. 52, págs. 1105–1118, septiembre de 1973.
  21. ^ abc Thomas Fine (2008). "El amanecer de la grabación digital comercial" (PDF) . Revista ARSC . 39 (1): 1–17.
  22. ^ Roger Nichols. "I Can't Keep Up With All The Formats II". Archivado desde el original el 20 de octubre de 2002. El álbum Bop Till You Drop de Ry Cooder fue el primer álbum pop grabado digitalmente.
  23. ^ abcd Allstot, David J. (2016). "Filtros de condensadores conmutados" (PDF) . En Maloberti, Franco; Davies, Anthony C. (eds.). Una breve historia de circuitos y sistemas: desde las redes ecológicas, móviles y generalizadas hasta la computación de grandes datos . Sociedad de circuitos y sistemas IEEE . págs. 105–110. ISBN 9788793609860Archivado desde el original (PDF) el 30 de septiembre de 2021 . Consultado el 29 de noviembre de 2019 .
  24. ^ abc Floyd, Michael D.; Hillman, Garth D. (8 de octubre de 2018) [1.ª publicación, 2000]. "Filtros de códecs de modulación por pulsos". The Communications Handbook (2.ª edición). CRC Press . págs. 26–1, 26–2, 26–3. ISBN 9781420041163.
  25. ^ Cambron, G. Keith (17 de octubre de 2012). Redes globales: ingeniería, operaciones y diseño . John Wiley & Sons. pág. 345.
  26. ^ Blu-ray Disc Association (marzo de 2005), Libro blanco Formato de disco Blu-ray: Especificaciones del formato de aplicación audiovisual 2.B para BD-ROM (PDF) , consultado el 26 de julio de 2009
  27. ^ "Notas técnicas de DVD (DVD Video – "Libro B") – Especificaciones de datos de audio". 21 de julio de 1996. Consultado el 16 de marzo de 2010 .
  28. ^ Jim Taylor. "Preguntas frecuentes (y respuestas) sobre DVD: detalles de audio de DVD-Video" . Consultado el 20 de marzo de 2010 .
  29. ^ "Cómo funciona el DV". Archivado desde el original el 6 de diciembre de 2007. Consultado el 21 de marzo de 2010 .
  30. ^ "Sitio web de información sobre AVCHD: descripción general de las especificaciones del formato AVCHD" . Consultado el 21 de marzo de 2010 .
  31. ^ EBU (julio de 2009), EBU Tech 3306 – MBWF/RF64: Un formato de archivo extendido para audio (PDF) , archivado desde el original (PDF) el 22 de noviembre de 2009 , consultado el 19 de enero de 2010
  32. ^ Mostafa, Mohamed; Kumar, Rajesh (mayo de 2001). "RFC 3108 – Convenciones para el uso del Protocolo de descripción de sesión (SDP) para conexiones de portador ATM". doi :10.17487/RFC3108 . Consultado el 16 de marzo de 2010 . {{cite journal}}: Requiere citar revista |journal=( ayuda )
  33. ^ "PCM, Pulse Code Modulated Audio". Biblioteca del Congreso. 6 de abril de 2022. Consultado el 5 de septiembre de 2022 .
  34. ^ Christopher, Montgometry. "24/192 Descargas de música y por qué no tienen sentido". Chris "Monty" Montgomery. Archivado desde el original el 6 de septiembre de 2014. Consultado el 16 de marzo de 2013 .
  35. ^ https://www.its.bldrdoc.gov/fs-1037/dir-039/_5829.htm [ verificación fallida ]
  36. ^ Stallings, William, Técnicas de señalización digital, diciembre de 1984, vol. 22, n.º 12, IEEE Communications Magazine

Lectura adicional

Enlaces externos