En el procesamiento de señales , el muestreo es la reducción de una señal de tiempo continuo a una señal de tiempo discreto . Un ejemplo común es la conversión de una onda de sonido en una secuencia de "muestras". Una muestra es un valor de la señal en un punto en el tiempo y/o el espacio; esta definición difiere del uso del término en estadística , que se refiere a un conjunto de dichos valores. [A]
Un muestreador es un subsistema u operación que extrae muestras de una señal continua . Un muestreador ideal teórico produce muestras equivalentes al valor instantáneo de la señal continua en los puntos deseados.
La señal original se puede reconstruir a partir de una secuencia de muestras, hasta el límite de Nyquist , pasando la secuencia de muestras a través de un filtro de reconstrucción .
Se pueden muestrear funciones de espacio, tiempo o cualquier otra dimensión, y lo mismo ocurre en dos o más dimensiones.
Para funciones que varían con el tiempo, sea una función continua (o "señal") a muestrear, y sea que el muestreo se realice midiendo el valor de la función continua cada segundos, lo que se denomina intervalo de muestreo o período de muestreo . [1] [2] Entonces la función muestreada está dada por la secuencia:
La frecuencia de muestreo o tasa de muestreo , , es el número promedio de muestras obtenidas en un segundo, por lo tanto , con la unidad muestras por segundo , a veces denominada hercio , por ejemplo 48 kHz son 48.000 muestras por segundo .
La reconstrucción de una función continua a partir de muestras se realiza mediante algoritmos de interpolación. La fórmula de interpolación de Whittaker-Shannon es matemáticamente equivalente a un filtro de paso bajo ideal cuya entrada es una secuencia de funciones delta de Dirac que se modulan (multiplican) por los valores de la muestra. Cuando el intervalo de tiempo entre muestras adyacentes es una constante , la secuencia de funciones delta se denomina peine de Dirac . Matemáticamente, el peine de Dirac modulado es equivalente al producto de la función peine por . Esa abstracción matemática a veces se denomina muestreo por impulsos . [3]
La mayoría de las señales muestreadas no se almacenan y reconstruyen simplemente. La fidelidad de una reconstrucción teórica es una medida común de la eficacia del muestreo. Esa fidelidad se reduce cuando contiene componentes de frecuencia cuya longitud de ciclo (periodo) es inferior a 2 intervalos de muestra (véase Aliasing ). El límite de frecuencia correspondiente, en ciclos por segundo ( hertz ), es ciclo/muestra × muestras/segundo = , conocida como la frecuencia de Nyquist del muestreador. Por lo tanto, suele ser la salida de un filtro de paso bajo , conocido funcionalmente como filtro anti-aliasing . Sin un filtro anti-aliasing, las frecuencias superiores a la frecuencia de Nyquist influirán en las muestras de una forma que será malinterpretada por el proceso de interpolación. [4]
En la práctica, la señal continua se muestrea mediante un convertidor analógico a digital (ADC), un dispositivo con varias limitaciones físicas. Esto da como resultado desviaciones de la reconstrucción teóricamente perfecta, denominadas colectivamente como distorsión .
Pueden ocurrir varios tipos de distorsión, entre ellos:
Aunque el uso del sobremuestreo puede eliminar por completo el error de apertura y el aliasing al desplazarlos fuera de la banda de paso, esta técnica no se puede utilizar en la práctica por encima de unos pocos GHz y puede resultar prohibitivamente cara a frecuencias mucho más bajas. Además, aunque el sobremuestreo puede reducir el error de cuantificación y la no linealidad, no puede eliminarlos por completo. En consecuencia, los ADC prácticos en frecuencias de audio normalmente no presentan aliasing, error de apertura y no están limitados por el error de cuantificación. En cambio, predomina el ruido analógico. En frecuencias de RF y microondas donde el sobremuestreo es poco práctico y los filtros son caros, el error de apertura, el error de cuantificación y el aliasing pueden ser limitaciones significativas.
El jitter, el ruido y la cuantificación se suelen analizar modelándolos como errores aleatorios añadidos a los valores de muestra. Los efectos de integración y retención de orden cero se pueden analizar como una forma de filtrado de paso bajo . Las no linealidades de los convertidores analógico-digitales (ADC) o analógico-digitales (DAC) se analizan reemplazando la función lineal ideal por una función no lineal propuesta .
El audio digital utiliza modulación por código de pulsos (PCM) y señales digitales para la reproducción de sonido. Esto incluye la conversión de analógico a digital (ADC), la conversión de digital a analógico (DAC), el almacenamiento y la transmisión. En efecto, el sistema al que comúnmente se hace referencia como digital es, de hecho, un análogo discreto en tiempo y nivel de un análogo eléctrico anterior. Si bien los sistemas modernos pueden ser bastante sutiles en sus métodos, la principal utilidad de un sistema digital es la capacidad de almacenar, recuperar y transmitir señales sin ninguna pérdida de calidad.
Cuando es necesario capturar audio que cubra todo el rango de 20 a 20 000 Hz de la audición humana [6], como cuando se graba música o muchos tipos de eventos acústicos, las formas de onda de audio se muestrean típicamente a 44,1 kHz ( CD ), 48 kHz, 88,2 kHz o 96 kHz. [7] El requisito de aproximadamente el doble de frecuencia es una consecuencia del teorema de Nyquist . Las frecuencias de muestreo superiores a aproximadamente 50 kHz a 60 kHz no pueden proporcionar más información utilizable para los oyentes humanos. Los primeros fabricantes de equipos de audio profesionales eligieron frecuencias de muestreo en la región de 40 a 50 kHz por este motivo.
Ha habido una tendencia en la industria hacia frecuencias de muestreo mucho más allá de los requisitos básicos: como 96 kHz e incluso 192 kHz [8] Aunque las frecuencias ultrasónicas son inaudibles para los humanos, la grabación y mezcla a frecuencias de muestreo más altas es eficaz para eliminar la distorsión que puede ser causada por el aliasing de retroceso . Por el contrario, los sonidos ultrasónicos pueden interactuar con y modular la parte audible del espectro de frecuencia ( distorsión de intermodulación ), degradando la fidelidad. [9] Una ventaja de las frecuencias de muestreo más altas es que pueden relajar los requisitos de diseño de filtro de paso bajo para ADC y DAC , pero con los modernos convertidores delta-sigma de sobremuestreo esta ventaja es menos importante.
La Audio Engineering Society recomienda una frecuencia de muestreo de 48 kHz para la mayoría de las aplicaciones, pero reconoce 44,1 kHz para CD y otros usos de consumo, 32 kHz para aplicaciones relacionadas con la transmisión y 96 kHz para un mayor ancho de banda o un filtrado anti-aliasing relajado . [10] Tanto Lavry Engineering como J. Robert Stuart afirman que la frecuencia de muestreo ideal sería de unos 60 kHz, pero como no es una frecuencia estándar, recomiendan 88,2 o 96 kHz para fines de grabación. [11] [12] [13] [14]
Una lista más completa de frecuencias de muestreo de audio comunes es:
El audio se graba típicamente a una profundidad de 8, 16 y 24 bits, lo que produce una relación señal-ruido de cuantificación (SQNR) máxima teórica para una onda sinusoidal pura de, aproximadamente, 49,93 dB , 98,09 dB y 122,17 dB. [22] El audio con calidad de CD utiliza muestras de 16 bits. El ruido térmico limita la cantidad real de bits que se pueden usar en la cuantificación. Pocos sistemas analógicos tienen relaciones señal-ruido (SNR) que superen los 120 dB. Sin embargo, las operaciones de procesamiento de señales digitales pueden tener un rango dinámico muy alto, por lo que es común realizar operaciones de mezcla y masterización con una precisión de 32 bits y luego convertir a 16 o 24 bits para su distribución.
Las señales de voz, es decir, las señales destinadas a transmitir únicamente el habla humana , normalmente se pueden muestrear a una velocidad mucho menor. Para la mayoría de los fonemas , casi toda la energía está contenida en el rango de 100 Hz a 4 kHz, lo que permite una velocidad de muestreo de 8 kHz. Esta es la velocidad de muestreo utilizada por casi todos los sistemas de telefonía , que utilizan las especificaciones de muestreo y cuantificación G.711 . [ cita requerida ]
La televisión de definición estándar (SDTV) utiliza 720 por 480 píxeles ( NTSC de EE. UU. de 525 líneas) o 720 por 576 píxeles ( PAL del Reino Unido de 625 líneas) para el área de imagen visible.
La televisión de alta definición (HDTV) utiliza 720p (progresivo), 1080i (entrelazado) y 1080p (progresivo, también conocido como Full-HD).
En el vídeo digital , la frecuencia de muestreo temporal se define como la frecuencia de cuadros (o más bien, la frecuencia de campo ) en lugar del reloj de píxeles teórico. La frecuencia de muestreo de la imagen es la tasa de repetición del período de integración del sensor. Dado que el período de integración puede ser significativamente más corto que el tiempo entre repeticiones, la frecuencia de muestreo puede ser diferente de la inversa del tiempo de muestreo:
Los convertidores de video digital a analógico operan en el rango de megahercios (desde ~3 MHz para escaladores de video compuesto de baja calidad en las primeras consolas de juegos, hasta 250 MHz o más para la salida VGA de mayor resolución).
Cuando el vídeo analógico se convierte en vídeo digital , se produce un proceso de muestreo diferente, esta vez en la frecuencia de píxeles, correspondiente a una frecuencia de muestreo espacial a lo largo de las líneas de exploración . Una frecuencia de muestreo de píxeles común es:
El muestreo espacial en la otra dirección está determinado por el espaciado de las líneas de escaneo en la trama . Las velocidades de muestreo y las resoluciones en ambas direcciones espaciales se pueden medir en unidades de líneas por altura de imagen.
El aliasing espacial de los componentes de vídeo de luminancia o croma de alta frecuencia se muestra como un patrón muaré .
El proceso de renderización de volumen toma muestras de una cuadrícula 3D de vóxeles para producir representaciones 3D de datos en rodajas (tomográficos). Se supone que la cuadrícula 3D representa una región continua del espacio 3D. La renderización de volumen es común en imágenes médicas; la tomografía computarizada con rayos X (TC/CAT), la resonancia magnética (IRM) y la tomografía por emisión de positrones (PET) son algunos ejemplos. También se utiliza para la tomografía sísmica y otras aplicaciones.
Cuando una señal de paso de banda se muestrea más lentamente que su tasa de Nyquist , las muestras son indistinguibles de las muestras de un alias de baja frecuencia de la señal de alta frecuencia. Esto se hace a menudo a propósito de tal manera que el alias de frecuencia más baja satisface el criterio de Nyquist , porque la señal de paso de banda todavía está representada de manera única y es recuperable. Este submuestreo también se conoce como muestreo de paso de banda , muestreo armónico , muestreo de FI y conversión directa de FI a digital. [23]
El sobremuestreo se utiliza en la mayoría de los convertidores analógico-digitales modernos para reducir la distorsión introducida por los convertidores digitales-analógicos prácticos , como una retención de orden cero en lugar de idealizaciones como la fórmula de interpolación de Whittaker-Shannon . [24]
El muestreo complejo (o muestreo I/Q ) es el muestreo simultáneo de dos formas de onda diferentes, pero relacionadas, lo que da como resultado pares de muestras que posteriormente se tratan como números complejos . [C] Cuando una forma de onda, , es la transformada de Hilbert de la otra forma de onda, , la función de valor complejo, , se denomina señal analítica , cuya transformada de Fourier es cero para todos los valores negativos de frecuencia. En ese caso, la tasa de Nyquist para una forma de onda sin frecuencias ≥ B se puede reducir a solo B (muestras complejas/seg), en lugar de (muestras reales/seg). [D] De manera más aparente, la forma de onda de banda base equivalente , , también tiene una tasa de Nyquist de , porque todo su contenido de frecuencia distinto de cero se desplaza al intervalo .
Aunque las muestras de valor complejo se pueden obtener como se describió anteriormente, también se crean manipulando muestras de una forma de onda de valor real. Por ejemplo, la forma de onda de banda base equivalente se puede crear sin calcular explícitamente , procesando la secuencia de producto, , [E] a través de un filtro de paso bajo digital cuya frecuencia de corte es . [F] Calcular solo cada dos muestras de la secuencia de salida reduce la frecuencia de muestreo proporcional a la frecuencia de Nyquist reducida. El resultado es la mitad de muestras de valor complejo que el número original de muestras reales. No se pierde información y se puede recuperar la forma de onda original, si es necesario.
En muchos casos, podemos oír el sonido de frecuencias de muestreo más altas no porque sean más transparentes, sino porque lo son menos. En realidad, pueden introducir una distorsión no deseada en el espectro audible.
60 KHz estaría más cerca del ideal, dadas las normas existentes, 88,2 KHz y 96 KHz son las frecuencias de muestreo más cercanas a la óptima.
intentando adaptarme a todos los oídos y hay informes de pocas personas que realmente pueden escuchar ligeramente por encima de los 20 KHz. Creo que 48 KHz es un compromiso bastante bueno, pero 88,2 o 96 KHz ofrecen un margen adicional.
hay una serie de buenos diseñadores y personas que se preocupan por el oído que consideran que la frecuencia de muestreo de 60-70 KHz es la frecuencia óptima para el oído. Es lo suficientemente rápida para incluir lo que podemos escuchar, pero lo suficientemente lenta para hacerlo con bastante precisión.
Tanto el análisis psicoacústico como la experiencia nos indican que el canal rectangular mínimo necesario para garantizar la transparencia utiliza PCM lineal con muestras de 18,2 bits a 58 kHz. ... existen argumentos sólidos para mantener las relaciones de números enteros con las frecuencias de muestreo existentes, lo que sugiere que se deberían adoptar 88,2 kHz o 96 kHz.
Para la mayoría de los discos, una frecuencia de muestreo de 22050 en estéreo es adecuada. Es probable que una excepción sean las grabaciones realizadas en la segunda mitad del siglo, que pueden necesitar una frecuencia de muestreo de 44100.
Frecuencias de muestreo admitidas: internamente 32, 44,1, 48, 64, 88,2, 96, 176,4, 192 kHz.
Frecuencias de muestreo admitidas: 44,1 kHz, 48 kHz, 64 kHz, 88,2 kHz, 96 kHz, 176,4 kHz, 192 kHz
Frecuencias de muestreo habituales: 64 000 Hz
[Captura de pantalla de Cubase]