La codificación de transformación es un tipo de compresión de datos para datos "naturales", como señales de audio o imágenes fotográficas . La transformación normalmente no tiene pérdidas (es perfectamente reversible) por sí sola, pero se utiliza para permitir una cuantificación mejor (más específica) , lo que da como resultado una copia de menor calidad de la entrada original ( compresión con pérdidas ).
En la codificación de transformación, se utiliza el conocimiento de la aplicación para elegir la información que se descartará, lo que reduce su ancho de banda . La información restante se puede comprimir a través de una variedad de métodos. Cuando se decodifica la salida, el resultado puede no ser idéntico a la entrada original, pero se espera que sea lo suficientemente parecido para el propósito de la aplicación.
Uno de los sistemas de codificación por transformada más exitosos no suele mencionarse como tal; el ejemplo es la televisión en color NTSC . Después de una extensa serie de estudios en la década de 1950, Alda Bedford demostró que el ojo humano tiene alta resolución solo para el blanco y negro, algo menos para los colores de "rango medio" como los amarillos y los verdes, y mucho menos para los colores del extremo del espectro, los rojos y los azules.
El uso de este conocimiento permitió a RCA desarrollar un sistema en el que descartaron la mayor parte de la señal azul después de que sale de la cámara, conservando la mayor parte del verde y solo algo del rojo; esto es el submuestreo de croma en el espacio de color YIQ .
El resultado es una señal con un contenido considerablemente menor, que encajaría en las señales en blanco y negro de 6 MHz existentes como una señal diferencial modulada en fase. El televisor promedio muestra el equivalente a 350 píxeles en una línea, pero la señal de televisión contiene suficiente información para sólo unos 50 píxeles de azul y quizás 150 de rojo. Esto no es evidente para el espectador en la mayoría de los casos, ya que el ojo hace poco uso de la información "faltante" de todos modos.
Los sistemas PAL y SECAM utilizan métodos casi idénticos o muy similares para transmitir el color. En cualquier caso, ambos sistemas utilizan submuestreo.
El término se utiliza mucho más comúnmente en medios digitales y procesamiento de señales digitales . La técnica de codificación de transformada más utilizada a este respecto es la transformada de coseno discreta (DCT), [1] [2] propuesta por Nasir Ahmed en 1972, [3] [4] y presentada por Ahmed con T. Natarajan y KR Rao en 1974. [5] Esta DCT, en el contexto de la familia de transformadas de coseno discretas, es la DCT-II. Es la base del estándar común de compresión de imágenes JPEG , [6] que examina pequeños bloques de la imagen y los transforma al dominio de la frecuencia para una cuantificación más eficiente (con pérdida) y compresión de datos . En la codificación de vídeo , los estándares H.26x y MPEG modifican esta técnica de compresión de imágenes DCT a través de fotogramas en una imagen en movimiento utilizando compensación de movimiento , reduciendo aún más el tamaño en comparación con una serie de JPEG.
En la codificación de audio , la compresión de audio MPEG analiza los datos transformados según un modelo psicoacústico que describe la sensibilidad del oído humano a partes de la señal, similar al modelo de TV. MP3 utiliza un algoritmo de codificación híbrido, que combina la transformada de coseno discreta modificada (MDCT) y la transformada rápida de Fourier (FFT). [7] Fue reemplazado por Advanced Audio Coding (AAC), que utiliza un algoritmo MDCT puro para mejorar significativamente la eficiencia de compresión. [8]
El proceso básico de digitalización de una señal analógica es un tipo de codificación de transformación que utiliza el muestreo en uno o más dominios como su transformación.