El formato de archivo multimedia base ISO ( ISOBMFF ) es un formato de archivo contenedor que define una estructura general para archivos que contienen datos multimedia basados en el tiempo, como video y audio. [3] [4] Está estandarizado en ISO / IEC 14496-12, también conocido como MPEG-4 Parte 12, y anteriormente también se publicó como ISO/IEC 15444-12, también conocido como JPEG 2000 Parte 12.
Está diseñado como un formato flexible y extensible que facilita el intercambio, la gestión, la edición y la presentación de los medios. La presentación puede ser local o a través de una red u otro mecanismo de transmisión de flujo. El formato de archivo está diseñado para ser independiente de cualquier protocolo de red en particular, al tiempo que permite su compatibilidad en general. [4]
El formato se ha vuelto muy utilizado para el almacenamiento de archivos multimedia y como base para varios otros formatos de archivos multimedia (por ejemplo, los formatos contenedores MP4 y 3GP ), y su uso generalizado fue reconocido con un Premio Emmy de Tecnología e Ingeniería presentado el 4 de noviembre de 2021 por la Academia Nacional de Artes y Ciencias de la Televisión . [5] [6] [7]
El formato de archivo multimedia base ISO se basa directamente en el formato contenedor QuickTime de Apple . [8] [9] [10] [11] [12] Fue desarrollado por MPEG (en ISO/IEC JTC 1/SC 29 , originalmente Working Group 11 MPEG, actualmente Working Group 3 MPEG Systems). La primera especificación de formato de archivo MP4 se creó sobre la base de la especificación de formato QuickTime publicada en 2001. [13] El formato de archivo MP4 conocido como "versión 1" se publicó en 2001 como ISO/IEC 14496-1:2001, como revisión de MPEG-4 Parte 1: Sistemas. [14] [15] [16] En 2003, la primera versión del formato de archivo MP4 fue revisada y reemplazada por MPEG-4 Parte 14: formato de archivo MP4 (ISO/IEC 14496-14:2003), comúnmente conocido como formato de archivo MPEG-4 "versión 2". [17]
El formato de archivo MP4 se generalizó en el formato de archivo multimedia básico ISO (ISO/IEC 14496-12:2004 o ISO/IEC 15444-12:2004), que define una estructura general para archivos multimedia basados en el tiempo. Se utiliza como base para otros formatos de archivo de la familia, como MP4, 3GP y Motion JPEG 2000. [ 8]
Históricamente, el texto también se publicó como ISO/IEC 15444-12 (JPEG 2000 Parte 12), aunque la versión JPEG 2000 del estándar se retiró en enero de 2017 porque era redundante con la publicación MPEG-4. [18] [19]
El formato de archivo multimedia básico ISO está diseñado como un formato de archivo extensible. En el sitio web oficial de la autoridad de registro, www.mp4ra.org, se publica una lista de todas las extensiones registradas para el formato de archivo multimedia básico ISO. [34] La autoridad de registro de los puntos de código (valores de identificador) en los archivos de la "Familia MP4" es Apple Inc., y se la menciona en el Anexo D (informativo) de MPEG-4 Parte 12. [9] Los diseñadores de códecs deben registrar los códigos que inventan, pero el registro no es obligatorio [35] y algunos de los puntos de código inventados y utilizados no están registrados. [36] Cuando alguien crea una nueva especificación derivada del formato de archivo multimedia básico ISO, todas las especificaciones existentes deben usarse como ejemplos y como fuente de definiciones y tecnología. Si una especificación existente ya cubre cómo se almacena un tipo de medio en particular en el formato de archivo (por ejemplo, audio o video MPEG-4 en MP4), se debe usar esa definición y no se debe inventar una nueva. [9]
MPEG ha estandarizado una serie de especificaciones que extienden el formato de archivo multimedia base ISO: El formato de archivo MP4 (ISO/IEC 14496-14) definió algunas extensiones sobre el formato de archivo multimedia base ISO para soportar códecs visuales/audio MPEG-4 y varias características de los sistemas MPEG-4 tales como descriptores de objetos y descripciones de escenas. El estándar MPEG-4 Parte 3 (MPEG-4 Audio) también definió el almacenamiento de algunos formatos de compresión de audio. El almacenamiento de audio MPEG-1/2 ( MP3 , MP2 , MP1 ) en el formato de archivo multimedia base ISO fue definido en ISO/IEC 14496-3:2001/Amd 3:2005. [37] El formato de archivo Advanced Video Coding (AVC) (ISO/IEC 14496-15) definió soporte para compresión de video H.264/MPEG-4 AVC . [38] El formato de archivo de imagen de alta eficiencia (HEIF) es un formato contenedor de imágenes que utiliza como base el formato de archivo multimedia básico ISO. Si bien HEIF se puede utilizar con cualquier formato de compresión de imágenes, incluye específicamente compatibilidad con imágenes intracodificadas HEVC y secuencias de imágenes codificadas HEVC, aprovechando la predicción entre imágenes.
Algunas de las extensiones estándar MPEG mencionadas anteriormente son utilizadas por otros formatos basados en el formato de archivo multimedia base ISO (por ejemplo, 3GP). [33] La especificación del formato de archivo 3GPP (.3gp) también definió extensiones para soportar video H.263 , audio AMR-NB , AMR-WB , AMR-WB+ y texto temporizado 3GPP en archivos basados en el formato de archivo multimedia base ISO. [39] El formato de archivo 3GPP2 (.3g2) definió extensiones para el uso de formatos de compresión de voz EVRC , SMV o 13K ( QCELP ). [33] La especificación JPEG 2000 (ISO/IEC 15444-3) definió el uso de compresión de video Motion JPEG 2000 y audio sin comprimir ( PCM ) en el formato de archivo multimedia base ISO (.mj2). El "Formato de archivo DVB" (.dvb) definido por el Proyecto DVB permitió el almacenamiento de servicios DVB en el formato de archivo multimedia base ISO. Permite el almacenamiento de audio, vídeo y otros contenidos de tres formas principales: encapsulados en un flujo de transporte MPEG , almacenados como una pista de sugerencia de recepción; encapsulados en un flujo RTP , almacenados como una pista de sugerencia de recepción o almacenados directamente como pistas multimedia. [40] [41] El formato de archivo MPEG-21 (.m21, .mp21) definió el almacenamiento de un elemento digital MPEG-21 en el formato de archivo multimedia base ISO, con algunos o todos sus datos auxiliares (como películas, imágenes u otros datos no XML) dentro del mismo archivo. [42] [43] La especificación OMA DRM Content Format (.dcf) de Open Mobile Alliance definió el formato de contenido para objetos multimedia cifrados protegidos por DRM y metadatos asociados. [44] [45] También existen otras extensiones, como la especificación ISMA ISMACryp para audio y vídeo cifrados/protegidos, [46] [47] la especificación de compresión de audio G.719 , [48] la compresión de audio AC3 y E-AC-3 , [49] la compresión de audio DTS , [50] la compresión de vídeo Dirac , [51] [52] la especificación de compresión de vídeo VC-1 y otras, que se nombran en el sitio web de la autoridad de registro MP4. [34]
Existen algunas extensiones del formato de archivo multimedia base ISO que no fueron registradas por la autoridad de registro MP4. Adobe Systems introdujo el formato de archivo F4V para Flash Video en 2007 y afirmó que se basa en el formato de archivo multimedia base ISO. El formato de archivo F4V no fue registrado por la autoridad de registro MP4, pero la especificación técnica F4V está disponible públicamente. Este formato puede contener compresión de vídeo H.264 y compresión de audio MP3 o AAC. Además, el formato de archivo F4V puede contener datos correspondientes al formato de mensaje ActionScript y fotogramas fijos de datos de vídeo utilizando formatos de imagen GIF , JPEG y PNG. [36] [53] [54] Microsoft Corporation anunció en 2009 un formato de archivo basado en el formato de archivo multimedia base ISO llamado ISMV (formato Smooth Streaming), también conocido como formato de archivo interoperable protegido (PIFF). Como se anunció, este formato puede, por ejemplo, contener formatos de compresión VC-1, WMA , H.264 y AAC. [55] Microsoft publicó una especificación de formato de archivo interoperable protegido (PIFF) en 2010. Definió otro uso de sistemas de cifrado múltiple y DRM en un único contenedor de archivos. [56] [57] La marca PIFF fue registrada por la autoridad de registro de MP4 en 2010. Algunas extensiones utilizadas por este formato (por ejemplo, para compatibilidad con WMA) no fueron registradas. El uso del formato de compresión WMA en el formato de archivo multimedia base ISO no fue documentado públicamente. [58]
El formato de archivo multimedia básico ISO incluye información sobre tiempos, estructura y medios para secuencias temporizadas de datos multimedia, como presentaciones audiovisuales. La estructura del archivo está orientada a objetos. Un archivo se puede descomponer en objetos básicos de forma muy sencilla, y la estructura de los objetos se deduce de su tipo.
Los archivos que cumplen con el formato de archivo multimedia básico ISO se forman como una serie de objetos, llamados "cajas". Todos los datos están contenidos en las cajas y no hay otros datos dentro del archivo. Esto incluye cualquier firma inicial requerida por el formato de archivo específico. La "caja" es un bloque de construcción orientado a objetos definido por un identificador de tipo único y una longitud. Se lo llamó "átomo" en algunas especificaciones (por ejemplo, la primera definición del formato de archivo MP4). [3]
Una presentación (secuencia de movimiento) puede estar contenida en varios archivos. Toda la información de tiempo y encuadre (posición y tamaño) debe estar en el archivo de medios base ISO, y los archivos auxiliares pueden utilizar básicamente cualquier formato. [3]
Para identificar las especificaciones a las que cumple un archivo basado en el formato de archivo multimedia base ISO, se utilizan "marcas" como identificadores en el formato de archivo. Estas se establecen en un cuadro denominado cuadro de tipo de archivo ("ftyp"), que debe colocarse al principio del archivo. Es algo análogo al llamado código fourcc , utilizado con un propósito similar para los medios integrados en el formato contenedor AVI . [59] Una marca puede indicar el tipo de codificación utilizada, cómo se almacenan los datos de cada codificación, las restricciones y extensiones que se aplican al archivo, la compatibilidad o el uso previsto del archivo. Las marcas son códigos imprimibles de cuatro caracteres. Un cuadro de tipo de archivo contiene dos tipos de marcas. Una es "major_brand", que identifica la especificación del mejor uso para el archivo. Le sigue "minor_version", un entero informativo de 4 bytes para la versión secundaria de la marca principal. El segundo tipo de marca es "compatible_brands", que identifica múltiples especificaciones a las que cumple el archivo. Todos los archivos deben contener un cuadro de tipo de archivo, pero por razones de compatibilidad con una versión anterior de la especificación, los archivos pueden ser conformes con el formato de archivo multimedia base ISO/IEC y no contener un cuadro de tipo de archivo. En ese caso, deben leerse como si contuvieran un ftyp con una marca principal y compatible "mp41" (MP4 v1 – ISO 14496-1, Capítulo 13). [3] Algunas marcas en uso (ftyps) no están registradas y se pueden encontrar en algunas páginas web. [36]
Un archivo multimedia estructurado según el formato de archivo multimedia de base ISO/IEC puede ser compatible con más de una especificación concreta, por lo que no siempre es posible hablar de un único "tipo" o "marca" para el archivo. En este sentido, la utilidad del tipo Multipurpose Internet Mail Extension y de la extensión de nombre de archivo es algo reducida. A pesar de ello, cuando se escribe una especificación derivada, se utilizará una nueva extensión de archivo, un nuevo tipo MIME y un nuevo tipo de archivo Macintosh. [3]
El formato de archivo de medios de base ISO/IEC admite la transmisión de datos de medios a través de una red, así como la reproducción local. Un archivo que admite la transmisión incluye información sobre las unidades de datos que se van a transmitir (cómo servir los datos de transmisión elementales en el archivo a través de protocolos de transmisión). Esta información se coloca en pistas adicionales del archivo llamadas pistas de "pistas". Se pueden incluir pistas de "pistas" independientes para diferentes protocolos dentro del mismo archivo. Los medios se reproducirán a través de todos esos protocolos sin hacer copias o versiones adicionales de los datos de medios. Los medios existentes se pueden hacer fácilmente reproducibles para otros protocolos específicos mediante la adición de pistas de pistas adecuadas. Los datos de medios en sí no necesitan reformatearse de ninguna manera. Las transmisiones enviadas por los servidores bajo la dirección de las pistas de pistas no necesitan contener rastros de información específica del archivo. Cuando la presentación se reproduce localmente (no se transmite), las pistas de pistas pueden ignorarse. Las pistas de pistas pueden crearse mediante una herramienta de creación o pueden agregarse a un archivo existente (presentación) mediante una herramienta de sugerencias. [3] En los medios creados para descarga progresiva, el cuadro moov , que contiene el índice de fotogramas, debe preceder al cuadro mdat de datos de la película . [60]
{{cite web}}
: CS1 maint: nombres numéricos: lista de autores ( enlace ){{cite web}}
: CS1 maint: nombres numéricos: lista de autores ( enlace ){{cite web}}
: CS1 maint: nombres numéricos: lista de autores ( enlace ){{cite web}}
: CS1 maint: nombres numéricos: lista de autores ( enlace )