Photo CD es un sistema diseñado por Kodak para digitalizar y guardar fotografías en un CD. Lanzado en 1991, [1] los discos fueron diseñados para contener cerca de 100 imágenes de alta calidad, impresiones escaneadas y diapositivas utilizando una codificación patentada especial. Los Photo CD están definidos en el Libro Beige y también cumplen con las especificaciones CD-ROM XA y CD-i Bridge . Fueron pensados para reproducirse en reproductores de CD-i , reproductores de Photo CD ( por ejemplo, PowerCD de Apple ) y cualquier computadora con un software adecuado ( por ejemplo, SilverFast DC o HDR de LaserSoft Imaging ).
El sistema no logró ganar un uso masivo entre los consumidores debido en parte a su naturaleza patentada, la rápida disminución de los precios de los escáneres y la falta de unidades de CD-ROM en la mayoría de las computadoras personales domésticas de la época. Además, Photo CD dependía de televisores basados en CRT para uso doméstico. Sin embargo, estos estaban diseñados para imágenes en movimiento. Su parpadeo típico se convirtió en un problema al ver fotografías fijas. El sistema Photo CD ganó un nivel razonable de aceptación entre los fotógrafos profesionales debido al bajo costo de los escaneos de película de alta calidad. Antes de Photo CD, los profesionales que deseaban digitalizar sus imágenes de película se veían obligados a pagar tarifas mucho más altas para obtener escaneos de tambor de sus negativos de película y transparencias . Tanto JPEG [2] como JPEG 2000 [3] admiten el espacio de color PhotoYCC como se describe a continuación, que se utiliza en archivos pcd.
El disco maestro Kodak Pro Photo CD contiene 25 imágenes con una resolución máxima de 6144 x 4096 píxeles (seis resoluciones por archivo, Base/16 a Base 64). Este tipo es adecuado para películas de 120, 4x5, pero también para películas de tamaño pequeño, si se requiere la máxima resolución.
Aparte del formato Photo CD, existe el formato "Portfolio CD" patentado por Kodak , que combina el audio del CD Red Book y el PCD Beige Book con menús interactivos y puntos de acceso en imágenes PCD. Algunos reproductores de CD de audio y fotografía independientes de Philips podían reproducir CD Portfolio y la aplicación de reproducción de Windows estaba disponible de forma gratuita. El CD Portfolio de Kodak no está definido en ningún Rainbow Book en particular.
El sistema Photo CD fue anunciado por Kodak en 1990. [4] Photo CD estaba dirigido a una amplia gama de necesidades fotográficas, que abarcaban desde cámaras compactas de consumo hasta profesionales de gama alta que utilizaban películas de gran formato de 4x5. Los primeros productos Photo CD, incluidos escáneres para laboratorios de procesamiento y reproductores Photo CD para consumidores, estuvieron disponibles en 1992. [4] Se esperaba que el proyecto fuera un negocio de 600 millones de dólares en 1997 con 100 millones de dólares en ganancias operativas. [5] Kodak entró en una serie de asociaciones para hacer crecer el uso de Photo CD. Esto incluía, por ejemplo, un acuerdo con LL Bean en 1992 por el cual el catálogo se distribuiría en formato Photo CD, [6] y un acuerdo con Silicon Graphics en 1993 para que todas las estaciones de trabajo de procesamiento de imágenes de Silicon Graphics fueran capaces de aceptar discos ópticos Kodak Photo CD. [7] Estas medidas, junto con el costo relativamente bajo de 3 dólares por imagen y la conveniencia, hicieron que Photo CD fuera la solución de imágenes digitales preferida por muchos fotógrafos a mediados y fines de los años 1990. [8]
En 2000, había más de 140 laboratorios de procesamiento de Photo CD activos en los EE. UU., y muchos más fuera de los EE. UU. [8] Sin embargo, a fines de la década de 1990, Photo CD estaba siendo eclipsado por formatos alternativos, principalmente basados en el formato JPEG estándar de la industria . [9] En el segmento de consumo, el esquema de compresión relativamente ineficiente del formato Photo CD significaba que los archivos de Photo CD eran significativamente más grandes que los archivos JPEG de calidad similar y, por lo tanto, menos convenientes para la transmisión a través de Internet, etc. Por ejemplo, una imagen de Photo CD 16Base de 5,5 Mb se puede codificar como una imagen JPEG de 2,1 Mb con una calidad del 80 %, visualmente indistinguible del original. [10] Cuando se diseñó el formato Photo CD a principios de la década de 1990, un objetivo de diseño era permitir la reproducción a bajo costo en dispositivos de TV. En ese momento, la tecnología disponible impedía los esquemas de compresión bidimensionales como JPEG, pero hacia fines de los años 1990, los avances en la tecnología de microprocesadores habían llevado la compresión JPEG/PNG al alcance incluso de los productos electrónicos de consumo de muy bajo costo.
En los segmentos de profesionales y aficionados avanzados, Photo CD había sido eclipsado por escáneres de escritorio de bajo costo como los de Nikon y Minolta en el rango medio, y por escáneres de tambor en el extremo más alto. [11] Si bien la resolución de píxeles de Photo CD todavía era comparable o mejor que las alternativas, Photo CD adolecía de otras desventajas. En primer lugar, el espacio de color de Photo CD, diseñado para la visualización en televisión, es menor que el que se puede lograr incluso con un escáner de escritorio de bajo costo. En segundo lugar, la reproducción de color de las imágenes de Photo CD cambió con el tiempo y con diferentes versiones de escáner; los escáneres 4050 tenían una reproducción de color diferente a las versiones anteriores. [12] [13] En tercer lugar, el rango dinámico de los escaneos era menor que el de los escáneres de escritorio. Las pruebas en ese momento indicaron que la clasificación dmax (una medida de la densidad máxima obtenible) de Photo CD era de 2,8-3,0, mientras que los escáneres de escritorio comúnmente disponibles alcanzaban 4,2, [14] una diferencia sustancial. Como resultado de esto y de los problemas de Photo CD con la reproducción del color, en 2004 el segmento profesional de la comunidad de usuarios en general se había vuelto en contra de Photo CD. [11]
En el segmento minorista, si bien Photo CD fue inicialmente relativamente popular entre los consumidores, fue en gran medida un fracaso económico para los laboratorios de procesamiento. En el momento de su introducción, Kodak afirmó que los costos de procesamiento para los laboratorios serían cercanos a $1 por imagen, [8] lo que permitiría al laboratorio vender de manera rentable la marca de $3 por imagen. Sin embargo, esta promesa nunca se cumplió, lo que a menudo resultó en que el proceso de escaneo se acelerara, con la consiguiente caída en la calidad. [12] Como resultado de la pérdida de participación de mercado de Photo CD y las sustanciales pérdidas corporativas, parcialmente atribuidas por la gerencia de Kodak a su negocio de escaneo, [15] Kodak abandonó el formato durante el período 2001-2004. En 2004, los escáneres Kodak 4050 Photo CD se ofrecían de forma gratuita a cualquiera que pagara por su eliminación por más de un laboratorio de procesamiento. [16] Este abandono generó una controversia considerable tanto en ese momento como posteriormente, ya que Kodak nunca publicó las especificaciones técnicas del formato Photo CD. El Photo CD sigue siendo un ejemplo a menudo citado de un “formato huérfano” y de los peligros de los formatos de imagen propietarios dentro de los círculos fotográficos. [17] [18] [19]
A pesar de que Kodak no publicó las especificaciones para el formato Photo CD, se ha realizado ingeniería inversa, lo que permite convertir imágenes a formatos más modernos. El trabajo de ingeniería inversa original fue realizado por Hadmut Danisch de la Universidad de Karlsruhe , quien descifró el formato estudiando volcados hexadecimales de archivos Photo CD y, posteriormente, escribió hpcdtoppm, que convierte imágenes de Photo CD al formato PPM, a principios de la década de 1990. [20] [21] A principios de la década de 1990, hpcdtoppm se distribuyó ampliamente como parte de varias distribuciones de Linux, pero desde entonces ha sido abandonado casi por completo debido a las preocupaciones sobre las condiciones de licencia restrictivas de hpcdtoppm [22] [23] [24] y la falta de gestión del color. Sin embargo, el trabajo de ingeniería inversa de Hadmut Danisch se ha utilizado para crear varias otras implementaciones de código abierto de decodificadores de Photo CD como ImageMagick. [25] En 2009, pcdtojpeg se creó bajo la licencia de código abierto GPL . El autor también reconoce que se basa en el trabajo de ingeniería inversa de Hadmut Danisch; pcdtojpeg permite decodificar metadatos de Photo CD, tiene gestión de color y puede decodificar todas las variantes conocidas de archivos de Photo CD. [26] Actualmente, hpcdtoppm y pcdtojpeg juntos forman el núcleo de información disponible en el dominio público sobre los detalles técnicos del formato de Photo CD.
Las imágenes de CD de fotos se almacenan como una jerarquía de componentes que van desde Base/16 a 64Base y que se relacionan con las distintas resoluciones de imagen que se pueden reconstruir. [27] La imagen Base, que tiene una resolución de luma de 512 líneas por 768 píxeles, se utiliza normalmente para los sistemas de TV. Las imágenes de mayor resolución se utilizan normalmente para la creación de imágenes fotográficas. Las imágenes Base y de menor resolución se utilizan normalmente para índices de archivos y miniaturas. Los componentes utilizados para crear las resoluciones Base/16 a 16Base se almacenan en un único archivo llamado Image Pac. Las imágenes Base, Base/4 y Base/16 se almacenan sin comprimir para permitir una fácil extracción para su visualización. Las imágenes 4Base y 16Base se almacenan comprimidas y como deltas (imágenes incrementales) de la resolución inferior a ellas. Tenga en cuenta que todas las resoluciones hasta la resolución máxima de un archivo (en realidad, un Image Pac) están presentes simultáneamente. Por ejemplo, un archivo 16Base contiene una imagen Base/16, Base/4, Base y 4Base, además de los componentes 16Base. El sexto componente, 64Base, se almacena en archivos separados en el Photo CD como parte de la extensión IMAGE PAC (IPE). Esto solo existe en los discos Photo CD Pro Master.
Las imágenes PCD utilizan una codificación PhotoYCC transformada en gamma. [27] [28] Bajo este esquema, para codificar imágenes escaneadas en un archivo Photo CD, el primer paso es preformatear los datos RGB a través de una transformación no lineal (la OETF Rec. 709 invertida para convertirse en una función impar , igual que la xvYCC posterior [29] ):
En la documentación de Kodak, α = 1,099, β = 0,018. Sin embargo, los valores estándar completos (1,099296826809442, 0,018053968510807) proporcionan continuidad matemática. [30]
Como resultado de esta función, los colores que están fuera de la gama definida por los primarios CCIR 709 [a] se codifican con valores negativos. [27] Los valores RGB lineales van de -0,20 a 2,00, mientras que los RGB no lineales van de -0,43357 a 1,402278. [ cita requerida ] El blanco de referencia (difusor perfecto, no fluorescente y que refleja el blanco en la escena original) es 1,0, al igual que en BT.709.
Los valores RGB predefinidos se convierten luego en un componente de luminancia y dos componentes de crominancia a través de una matriz similar a CCIR 601-1: [27]
Finalmente, los componentes de luminancia y crominancia se escalan a valores de 8 bits mediante las siguientes ecuaciones: [27]
Kodak afirma que "los factores de escala y las compensaciones para los canales C1 y C2 resultan de la distribución de colores del mundo real". [27] Dado el rango de números enteros de 8 bits para cada uno de los 3 componentes, 0 ≤ Y ≤ 1,402, -1,40036 ≤ B' - Y' ≤ 0,888689, -1,01003 ≤ G' - Y' ≤ 0,86995.
Una rareza de este esquema de codificación es que permite que las imágenes de Photo CD representen colores que están por encima del 100% (hasta 140,2%), " más blancos que el blanco ". [31] En el momento de la introducción de Photo CD, esto permitió que la visualización de imágenes en los televisores analógicos de la época mostrara colores más brillantes y vívidos de lo que sería el caso de otra manera. Esto era aceptable ya que los televisores analógicos de la época estaban diseñados para funcionar más allá de su nivel de 100% sin recortar abruptamente. Sin embargo, este aspecto de la codificación de Photo CD no es compatible con los formatos de imagen modernos y es la causa del problema bien documentado de "Blown Highlights" al convertir imágenes de Photo CD a formatos más modernos. [32] [33] Todos los formatos de fotos modernos imponen un recorte duro al 100% (los formatos de video en YUV aún tienen margen que está presente en los televisores de alto nivel), lo que resulta en recorte de resaltado en las imágenes convertidas a menos que se realice alguna forma de mapeo de luminancia y crominancia específico de Photo CD. [32]
Además, aunque no se proporciona "espacio para los dedos" (Y < 0), Kodak permite expresamente el uso de R, G, B < 0, lo que permite expresar colores fuera de gama (para Rec. 709). [27] El efecto es similar a xvYCC , que llegó mucho más tarde.
Las imágenes de Photo CD utilizan tres formas de compresión para reducir los requisitos de almacenamiento de imágenes. [27] En primer lugar, el submuestreo de croma reduce el tamaño de las imágenes en aproximadamente un 50%. Este submuestreo se produce por un factor de 4 para imágenes 4Base y por un factor de 2 (4:2:0) para todas las demás resoluciones. En segundo lugar, se logra una reducción adicional del tamaño descomponiendo los datos de imagen de mayor resolución y almacenando los componentes 4Base, 16Base y 64Base como residuos (diferencias con respecto a los píxeles en el nivel de resolución anterior). En tercer y último lugar, el sistema Photo CD emplea una forma de cuantificación y codificación Huffman para comprimir aún más estos datos residuales. Esta codificación Huffman se realiza fila por fila de imágenes. Las tablas Huffman se codifican en la propia imagen de Photo CD y tienen diferentes longitudes según la clase de compresión. Estas clases Huffman son: [34]
Por ejemplo, para recomponer una imagen de 1024 líneas por 1536 píxeles, la imagen base de luminancia de 512 líneas por 768 píxeles (que no es ni "residual" ni está comprimida por Huffman) se interpola a una imagen de 1024 líneas por 1536 píxeles. A continuación, se descomprime un residuo 4Base de 1024 líneas por 1536 píxeles a partir de su forma codificada por Huffman y se añaden sus elementos a cada píxel correspondiente. La imagen resultante contiene detalles de la imagen muestreada completa de 1024 líneas por 1536 píxeles. Para recomponer una imagen a una resolución de 2048 líneas por 3072 píxeles, se repite esencialmente el proceso, utilizando tanto el residuo 4Base como el 16Base. Posteriormente se utiliza una operación similar para recomponer la resolución de 4096 líneas por 6144 píxeles. En cada paso, se aplica un proceso idéntico a los canales de croma.
Kodak basó el esquema PhotoYCC en algunas normas de vídeo existentes, en particular en aspectos de la Recomendación 601 del CCIR utilizada con los sistemas de televisión digital PAL y NTSC, y también en la Recomendación 709 del CCIR (actualmente Recomendación BT.709 de la UIT-R) utilizada para la televisión de alta definición. La definición de PhotoYCC se define de una manera que no está limitada por las limitaciones de la pantalla de vídeo real. [27] [31]
En la práctica, el espacio de color de las imágenes de Photo CD varía significativamente con respecto a la Rec. 709. En primer lugar, el esquema de codificación de Photo CD permite valores superiores al 100% para los componentes de color, lo que permite que las imágenes de Photo CD muestren colores fuera de la gama nominal de Rec. 709. [32] Además, para lograr una reproducción precisa del color, especialmente al escanear películas reversibles, Kodak consideró necesario proporcionar perfiles de color ICC específicos para el tipo de película y el escáner. [35] Como resultado, cuando el formato de Photo CD cayó en desuso, cinco espacios de color diferentes se usaban comúnmente en imágenes de Photo CD (PCD 4050 es un número de modelo de escáner Kodak):
Por lo tanto, si bien el uso del espacio de color genérico de Photo CD proporcionará una reproducción de color aceptable para muchos propósitos, por ejemplo, la visualización en la Web de imágenes en miniatura, para lograr una reproducción de color totalmente precisa, por ejemplo, para fines fotográficos, cualquier software de conversión o visualización de Photo CD debe utilizar el perfil de color correcto para la combinación del medio original y el modelo de escáner.
Para un uso práctico, cualquier imagen de Photo CD deberá convertirse a un formato moderno como JPEG , TIFF o DNG . Si bien hay una gran cantidad de programas de conversión de imágenes disponibles, tanto comerciales como gratuitos o de código abierto , la mayoría solo son capaces de realizar conversiones básicas de baja resolución (a menudo solo a la resolución base, 512x768). Las principales características distintivas entre los programas en lo que respecta a las capacidades de Photo CD son: