La interfaz digital en serie ( SDI ) es una familia de interfaces de vídeo digital estandarizadas por primera vez por la SMPTE (Sociedad de Ingenieros de Cine y Televisión) en 1989. [1] [2] Por ejemplo, ITU-R BT.656 y SMPTE 259M definen interfaces de vídeo digital utilizadas para vídeo de calidad de transmisión . Una norma relacionada, conocida como interfaz digital en serie de alta definición (HD-SDI), está estandarizada en SMPTE 292M ; esta proporciona una velocidad de datos nominal de 1,485 Gbit/s. [3]
Se han introducido estándares SDI adicionales para soportar resoluciones de video crecientes ( HD , UHD y más allá), velocidades de cuadro , video estereoscópico (3D) , [4] [5] y profundidad de color . [6] HD-SDI de enlace dual consiste en un par de enlaces SMPTE 292M, estandarizados por SMPTE 372M en 1998; [2] esto proporciona una interfaz nominal de 2.970 Gbit/s utilizada en aplicaciones (como cine digital o HDTV 1080P) que requieren mayor fidelidad y resolución de la que puede proporcionar la HDTV estándar. 3G-SDI (estandarizado en SMPTE 424M ) consiste en un solo enlace serial de 2.970 Gbit/s que permite reemplazar HD-SDI de enlace dual. Los estándares 6G-SDI y 12G-SDI se publicaron el 19 de marzo de 2015. [7] [8]
Estas normas se utilizan para la transmisión de señales de vídeo digital sin comprimir ni cifrar (que incluyen opcionalmente audio integrado y código de tiempo) en instalaciones de televisión; también se pueden utilizar para datos empaquetados. SDI se utiliza para conectar entre sí diferentes equipos, como grabadoras, monitores, PC y mezcladores de vídeo. Las variantes coaxiales de la especificación varían en longitud, pero normalmente son inferiores a 300 metros (980 pies). Las variantes de fibra óptica de la especificación, como 297M, permiten la transmisión a larga distancia limitada únicamente por la longitud máxima de la fibra o los repetidores. SDI y HD-SDI suelen estar disponibles únicamente en equipos de vídeo profesionales porque varios acuerdos de licencia restringen el uso de interfaces digitales sin cifrar, como SDI, prohibiendo su uso en equipos de consumo. Varias cámaras DSLR con capacidad para vídeo profesional y vídeo HD y todas las cámaras de consumo con capacidad para vídeo sin comprimir utilizan la interfaz HDMI , a menudo denominada HDMI limpio . Existen varios kits de modificación para reproductores de DVD y otros dispositivos existentes, que permiten al usuario añadir una interfaz digital en serie a estos dispositivos. [ cita requerida ]
Los distintos estándares de interfaz digital en serie utilizan (uno o más) cables coaxiales con conectores BNC , con una impedancia nominal de 75 ohmios . Este es el mismo tipo de cable que se utiliza en las configuraciones de vídeo analógico, lo que potencialmente facilita las actualizaciones (aunque pueden ser necesarios cables de mayor calidad para transmisiones largas a velocidades de bits más altas). La amplitud de señal especificada en la fuente es de 800 mV (±10%) pico a pico; se pueden medir voltajes mucho más bajos en el receptor debido a la atenuación . Utilizando la ecualización en el receptor, es posible enviar SDI a 270 Mbit/s a lo largo de 300 metros (980 pies) sin utilizar repetidores, pero se prefieren longitudes más cortas. Las velocidades de bits HD tienen una longitud de transmisión máxima más corta, normalmente de 100 metros (330 pies). [9] [10]
Se transmiten señales de componentes digitales sin comprimir . Los datos se codifican en formato NRZI y se utiliza un registro de desplazamiento de retroalimentación lineal para codificar los datos y reducir la probabilidad de que aparezcan largas cadenas de ceros o unos en la interfaz. La interfaz se sincroniza y sincroniza automáticamente. El encuadre se realiza mediante la detección de un patrón de sincronización especial , que aparece en la señal digital serial (sin codificar) como una secuencia de diez unos seguidos de veinte ceros (veinte unos seguidos de cuarenta ceros en HD); este patrón de bits no es legal en ningún otro lugar dentro de la carga útil de datos.
En la señal de vídeo digital en serie se utilizan varias velocidades de bits:
La norma SMPTE 297-2006 define un sistema de fibra óptica para transmitir señales digitales en serie. Está destinado a transmitir señales SMPTE ST 259 (de 143 a 360 Mbit/s), señales SMPTE ST 344 (540 Mbit/s), señales SMPTE ST 292-1/-2 (1,485 Gbit/s y 1,485/1,001 Gbit/s) y señales SMPTE ST 424 (2,970 Gbit/s y 2,970/1,001 Gbit/s). Además de la especificación óptica, la norma ST 297 también exige pruebas de seguridad láser y que todas las interfaces ópticas estén etiquetadas para indicar el cumplimiento de la seguridad, la aplicación y la interoperabilidad. [14]
La Rec. UIT-R 601 define una interfaz digital paralela de 8 bits ; esta está obsoleta (sin embargo, muchas cláusulas de las distintas normas contemplan la posibilidad de una interfaz de 8 bits).
En las aplicaciones SD y ED, el formato de datos en serie se define con un ancho de 10 bits, mientras que en las aplicaciones HD, tiene un ancho de 20 bits, dividido en dos flujos de datos paralelos de 10 bits (conocidos como Y y C ). El flujo de datos SD se organiza de la siguiente manera:
Mientras que los flujos de datos HD se organizan de la siguiente manera:
Para todas las interfaces digitales en serie (excluidas las codificaciones compuestas obsoletas), la codificación de color nativa es el formato 4:2:2 YCbCr . El canal de luminancia (Y) se codifica con el ancho de banda completo (13,5 MHz en SD de 270 Mbit/s, ~75 MHz en HD), y los dos canales de crominancia (Cb y Cr) se submuestrean horizontalmente y se codifican con la mitad del ancho de banda (6,75 MHz o 37,5 MHz). Las muestras Y, Cr y Cb se coubican (se adquieren en el mismo momento), y la muestra Y' se adquiere en el momento intermedio entre dos muestras Y adyacentes.
En lo anterior, Y se refiere a muestras de luminancia y C a muestras de crominancia . Cr y Cb se refieren además a los canales de "diferencia de color" rojo y azul; consulte Vídeo por componentes para obtener más información. Esta sección solo analiza la codificación de color nativa de SDI; otras codificaciones de color son posibles si se trata la interfaz como un canal de datos genérico de 10 bits. A continuación se analiza el uso de otras codificaciones de colorimetría y la conversión hacia y desde el espacio de color RGB .
La carga útil de video (así como la carga útil de datos auxiliares) puede utilizar cualquier palabra de 10 bits en el rango de 4 a 1019 (004 16 a 3FB 16 ) inclusive; los valores 0–3 y 1020–1023 (3FC 16 –3FF 16 ) están reservados y no pueden aparecer en ninguna parte de la carga útil. Estas palabras reservadas tienen dos propósitos; se utilizan tanto para paquetes de sincronización como para encabezados de datos auxiliares.
Un paquete de sincronización (conocido comúnmente como señal de referencia de tiempo o TRS ) se produce inmediatamente antes de la primera muestra activa en cada línea, e inmediatamente después de la última muestra activa (y antes del inicio de la región de borrado horizontal ). El paquete de sincronización consta de cuatro palabras de 10 bits, las primeras tres palabras son siempre las mismas: 0x3FF, 0, 0; la cuarta consta de 3 bits de bandera, junto con un código de corrección de errores. Como resultado, hay 8 paquetes de sincronización diferentes posibles.
En las interfaces HD-SDI y de enlace dual, los paquetes de sincronización deben producirse simultáneamente en los flujos de datos Y y C. (Se permite cierto retraso entre los dos cables en una interfaz de enlace dual; se espera que el equipo que admite enlace dual almacene en búfer el enlace principal para permitir que el otro enlace se ponga al día). En las interfaces SD-SDI y de definición mejorada, solo hay un flujo de datos y, por lo tanto, solo un paquete de sincronización a la vez. Aparte del problema de cuántos paquetes aparecen, su formato es el mismo en todas las versiones de la interfaz serial-digital.
Los bits de bandera que se encuentran en la cuarta palabra (comúnmente conocida como la palabra XYZ ) se conocen como H, F y V. El bit H indica el comienzo del espacio en blanco horizontal; y los bits de sincronización que preceden inmediatamente a la región de espacio en blanco horizontal deben tener H establecido en uno. Dichos paquetes se conocen comúnmente como paquetes de fin de video activo o EAV . Del mismo modo, el paquete que aparece inmediatamente antes del comienzo del video activo tiene H establecido en 0; este es el paquete de inicio de video activo o SAV .
De la misma manera, el bit V se utiliza para indicar el inicio de la región de borrado vertical; un paquete EAV con V=1 indica que la siguiente línea (se considera que las líneas comienzan en EAV) es parte del intervalo vertical , un paquete EAV con V=0 indica que la siguiente línea es parte de la imagen activa.
El bit F se utiliza en formatos de trama entrelazada y segmentada para indicar si la línea proviene del primer o del segundo campo (o segmento). En formatos de escaneo progresivo , el bit F siempre se establece en cero.
En la interfaz digital serial de alta definición (y en HD de doble enlace), se proporcionan palabras de verificación adicionales para aumentar la robustez de la interfaz. En estos formatos, las cuatro muestras que siguen inmediatamente a los paquetes EAV (pero no a los paquetes SAV) contienen un campo de verificación de redundancia cíclica y un indicador de conteo de líneas. El campo CRC proporciona un CRC de la línea anterior (los CRC se calculan de forma independiente para los flujos Y y C) y se pueden utilizar para detectar errores de bits en la interfaz. El campo de conteo de líneas indica el número de línea de la línea actual.
En las interfaces SD y ED no se proporcionan el CRC ni los recuentos de líneas. En su lugar, se puede utilizar opcionalmente un paquete de datos auxiliar especial, conocido como paquete EDH, para proporcionar una comprobación del CRC de los datos.
A cada muestra dentro de un flujo de datos determinado se le asigna una línea y un número de muestra únicos. En todos los formatos, a la primera muestra inmediatamente después del paquete SAV se le asigna el número de muestra 0; la siguiente muestra es la muestra 1; hasta la palabra XYZ en el siguiente paquete SAV. En las interfaces SD, donde solo hay un flujo de datos, la muestra 0 es una muestra Cb; la primera muestra es una muestra Y, la segunda muestra es una muestra Cr y la tercera muestra es la muestra Y'; el patrón se repite a partir de allí. En las interfaces HD, cada flujo de datos tiene su propia numeración de muestra, por lo que la muestra 0 del flujo de datos Y es la muestra Y, la siguiente muestra es la muestra Y', etc. De la misma manera, la primera muestra en el flujo de datos C es Cb, seguida de Cr, seguida nuevamente de Cb.
Las líneas se numeran secuencialmente, comenzando desde 1, hasta el número de líneas por cuadro del formato indicado (normalmente 525, 625, 750 o 1125 ( Sony HDVS )). La determinación de la línea 1 es algo arbitraria; sin embargo, está especificada de forma inequívoca por los estándares pertinentes. En los sistemas de 525 líneas, la primera línea en blanco vertical es la línea 1, mientras que en otros sistemas entrelazados (625 y 1125 líneas), la primera línea después de que el bit F pase a cero es la línea 1.
Tenga en cuenta que se considera que las líneas comienzan en EAV, mientras que la muestra cero es la muestra que sigue a SAV. Esto produce el resultado un tanto confuso de que la primera muestra en una línea dada de video 1080i es la muestra número 1920 (la primera muestra EAV en ese formato) y la línea termina en la siguiente muestra 1919 (la última muestra activa en ese formato). Tenga en cuenta que este comportamiento difiere un poco de las interfaces de video analógicas, donde se considera que la transición de línea ocurre en el pulso de sincronización, que ocurre aproximadamente a la mitad de la región de borrado horizontal.
La numeración de los enlaces es un problema solo en las interfaces de múltiples enlaces. Al primer enlace (el enlace principal ) se le asigna un número de enlace de 1, y a los enlaces subsiguientes se les asignan números de enlace crecientes; por lo tanto, el segundo enlace ( secundario ) en un sistema de enlace doble es el enlace 2. El número de enlace de una interfaz determinada se indica mediante un paquete VPID ubicado en el espacio de datos auxiliares verticales.
Tenga en cuenta que la disposición de los datos en el enlace dual está diseñada de modo que el enlace primario pueda ser alimentado a una interfaz de enlace único y aún así producir video utilizable (aunque algo degradado). El enlace secundario generalmente contiene elementos como LSB adicionales (en formatos de 12 bits), muestras no cosificadas en video muestreado 4:4:4 (para que el enlace primario siga siendo válido 4:2:2) y canales alfa o de datos. Si el segundo enlace de una configuración de enlace dual 1080P está ausente, el primer enlace aún contiene una señal 1080i válida.
En el caso de video 1080p60, 59.94 o 50 Hz a través de un enlace dual, cada enlace contiene una señal 1080i válida a la misma frecuencia de campo. El primer enlace contiene las líneas 1.ª, 3.ª y 5.ª de los campos impares y las líneas 2.ª, 4.ª, 6.ª, etc. de los campos pares, y el segundo enlace contiene las líneas pares de los campos impares y las líneas impares de los campos pares. Cuando se combinan los dos enlaces, el resultado es una imagen de escaneo progresivo a la frecuencia de cuadro más alta.
Al igual que SMPTE 259M , SMPTE 292M es compatible con el estándar SMPTE 291M para datos auxiliares. Los datos auxiliares se proporcionan como un transporte estandarizado para la carga útil que no es de video dentro de una señal digital en serie; se utilizan para cosas como audio integrado , subtítulos , código de tiempo y otros tipos de metadatos . Los datos auxiliares se indican mediante un paquete de 3 palabras que consta de 0, 3FF, 3FF (lo opuesto al encabezado del paquete de sincronización), seguido de un código de identificación de dos palabras, una palabra de recuento de datos (que indica 0–255 palabras de carga útil), la carga útil real y una suma de comprobación de una palabra. Además de su uso en el encabezado, los códigos prohibidos para la carga útil de video también están prohibidos para la carga útil de datos auxiliares.
Las aplicaciones específicas de datos auxiliares incluyen audio integrado, EDH, VPID y SDTI.
En aplicaciones de enlace dual, los datos auxiliares se encuentran principalmente en el enlace principal; el enlace secundario se debe utilizar para datos auxiliares solo si no hay espacio en el enlace principal. Una excepción a esta regla es el paquete VPID; ambos enlaces deben tener presente un paquete VPID válido.
Tanto la interfaz serie HD como la SD proporcionan 16 canales de audio integrado. Las dos interfaces utilizan diferentes métodos de encapsulación de audio: SD utiliza el estándar SMPTE 272M, mientras que HD utiliza el estándar SMPTE 299M. En cualquier caso, una señal SDI puede contener hasta dieciséis canales de audio (8 pares) integrados de 48 kHz y 24 bits junto con el vídeo. Normalmente, se almacena audio PCM de 48 kHz y 24 bits (20 bits en SD, pero ampliable a 24 bits) , de una manera directamente compatible con la interfaz de audio digital AES3 . Estos se colocan en los períodos de supresión (horizontales), cuando la señal SDI no lleva nada útil, ya que el receptor genera sus propias señales de supresión a partir del TRS.
En aplicaciones de enlace dual, están disponibles 32 canales de audio, ya que cada enlace puede transportar 16 canales.
SMPTE ST 299-2:2010 amplía la interfaz SDI 3G para poder transmitir 32 canales de audio (16 pares) en un solo enlace.
Como la interfaz de definición estándar no incluye suma de comprobación, CRC ni ninguna otra comprobación de integridad de datos , se puede colocar opcionalmente un paquete EDH ( detección y manejo de errores ) en el intervalo vertical de la señal de vídeo. Este paquete incluye valores CRC tanto para la imagen activa como para todo el campo (excluidas aquellas líneas en las que puede producirse una conmutación y que no deberían contener datos útiles); el equipo puede calcular su propio CRC y compararlo con el CRC recibido para detectar errores.
Normalmente, EDH solo se utiliza con la interfaz de definición estándar; la presencia de palabras CRC en la interfaz HD hace que los paquetes EDH sean innecesarios.
Los paquetes VPID (o identificador de carga útil de video) se utilizan cada vez más para describir el formato de video. En las primeras versiones de la interfaz digital serial, siempre era posible determinar de manera única el formato de video contando la cantidad de líneas y muestras entre las transiciones H y V en el TRS. Con la introducción de las interfaces de enlace dual y los estándares de trama segmentada, esto ya no es posible; por lo tanto, el estándar VPID (definido por SMPTE 352M) proporciona una manera de identificar de manera única e inequívoca el formato de la carga útil de video.
La parte activa de la señal de vídeo se define como aquellas muestras que siguen a un paquete SAV y preceden al siguiente paquete EAV; en donde los paquetes EAV y SAV correspondientes tienen el bit V establecido en cero. Es en la parte activa donde se almacena la información de imagen real.
En la interfaz digital en serie son posibles varias codificaciones de color. El caso predeterminado (y más común) son datos de vídeo muestreados linealmente de 10 bits codificados como YCbCr 4:2:2 . (YCbCr es una representación digital del espacio de color YPbPr ). Las muestras de vídeo se almacenan como se describió anteriormente. Las palabras de datos corresponden a los niveles de señal de los respectivos componentes de vídeo, de la siguiente manera:
Tenga en cuenta que la escala de los canales de luminancia y crominancia no es idéntica. El mínimo y el máximo de estos rangos representan los límites de señal preferidos, aunque la carga útil de video puede aventurarse fuera de estos rangos (siempre que las palabras de código reservadas de 0 a 3 y 1020 a 1023 nunca se utilicen para la carga útil de video). Además, la señal analógica correspondiente puede tener excursiones más allá de este rango.
Como YPbPr (y YCbCr) se derivan del espacio de color RGB , se necesita un método de conversión. Existen tres colorimetrías que se utilizan normalmente con el vídeo digital:
Las interfaces de enlace dual y 3 Gbit/s también admiten otras codificaciones de color además de 4:2:2 YCbCr, a saber:
Si se utiliza una codificación RGB, los tres primarios se codifican de la misma manera que el canal Y; un valor de 64 (40 hexadecimal) corresponde a 0 mV y 940 (3AC hexadecimal) corresponde a 700 mV.
Las aplicaciones de 12 bits se escalan de manera similar a sus contrapartes de 10 bits; los dos bits adicionales se consideran LSB .
Para las partes de las regiones de borrado verticales y horizontales que no se utilizan para datos auxiliares, se recomienda que a las muestras de luminancia se les asigne la palabra de código 64 (40 hexadecimal) y a las muestras de croma se les asigne la palabra de código 512 (200 hexadecimal); ambas corresponden a 0 mV. Se permite codificar información de intervalo vertical analógica (como código de tiempo de intervalo vertical o señales de prueba de intervalo vertical) sin interrumpir la interfaz, pero dicho uso no es estándar (y los datos auxiliares son el medio preferido para transmitir metadatos). Sin embargo, no se recomienda la conversión de señales de sincronización y ráfaga analógicas a digitales, y tampoco es necesaria en la interfaz digital.
Los diferentes formatos de imagen tienen diferentes requisitos para el borrado digital, por ejemplo, todos los formatos HD denominados de 1080 líneas tienen 1080 líneas activas, pero 1125 líneas en total, y el resto es borrado vertical. [1]
Las distintas versiones de la interfaz digital en serie admiten numerosos formatos de vídeo:
Además de la interfaz digital serial regular que se describe aquí, existen otras interfaces similares que son parecidas a una interfaz digital serial o están contenidas dentro de ella.
Existe una especificación ampliada denominada SDTI ( Interfaz de transporte de datos en serie ), que permite transportar secuencias de vídeo comprimidas (es decir, DV , MPEG y otras) a través de una línea SDI. Esto permite múltiples secuencias de vídeo en un cable o una transmisión de vídeo más rápida que en tiempo real (2x, 4x,...). Un estándar relacionado, conocido como HD-SDTI, proporciona una capacidad similar a través de una interfaz SMPTE 292M.
La interfaz SDTI está especificada en SMPTE 305M. La interfaz HD-SDTI está especificada en SMPTE 348M.
La especificación de la interfaz serial asíncrona (ASI) describe cómo transportar un flujo de transporte MPEG (MPEG-TS), que contiene múltiples flujos de video MPEG, a través de un cable coaxial de cobre de 75 ohmios o fibra óptica multimodo. ASI es una forma popular de transportar programas de transmisión desde el estudio hasta el equipo de transmisión final antes de que lleguen a los espectadores sentados en sus hogares.
El estándar ASI es parte del estándar de transmisión de video digital (DVB).
El estándar SMPTE 349M: Transporte de formatos de imagen de origen alternativos a través de SMPTE 292M , especifica un medio para encapsular formatos de video no estándar y de menor tasa de bits dentro de una interfaz HD-SDI. Este estándar permite, por ejemplo, que varias señales de video de definición estándar independientes se multiplexen en una interfaz HD-SDI y se transmitan por un cable. Este estándar no solo ajusta la sincronización EAV y SAV para cumplir con los requisitos de los formatos de menor tasa de bits; en cambio, proporciona un medio por el cual un formato SDI completo (incluidas las palabras de sincronización, los datos auxiliares y la carga útil de video) se puede encapsular y transmitir como carga útil de datos ordinarios dentro de una transmisión de 292M.
La interfaz HDMI es una interfaz de audio/vídeo compacta para transferir datos de vídeo sin comprimir y datos de audio digital comprimidos/sin comprimir desde un dispositivo compatible con HDMI a un monitor de ordenador , un proyector de vídeo , un televisor digital o un dispositivo de audio digital compatible . Se utiliza principalmente en el ámbito del consumo, pero cada vez se utiliza más en dispositivos profesionales, incluidos los de vídeo sin comprimir, a menudo denominados HDMI limpios .
El estándar G.703 es otra interfaz digital de alta velocidad, diseñada originalmente para telefonía.
El estándar HDcctv incorpora la adaptación de SDI para aplicaciones de videovigilancia, que no debe confundirse con TDI, un formato similar pero diferente para cámaras de videovigilancia.
El estándar CoaXPress es otra interfaz digital de alta velocidad, diseñada originalmente para interfaces de cámaras industriales. Las velocidades de datos de CoaXPress llegan hasta 12,5 Gbit/s a través de un solo cable coaxial. El estándar también incluye un canal de enlace ascendente de 41 Mbit/s y alimentación a través de cable coaxial.