PDF

El formato de documento portátil ( PDF ), estandarizado como ISO 32000 , es un formato de archivo desarrollado por Adobe en 1992 para presentar documentos , incluido el formato de texto e imágenes, de una manera independiente del software de aplicación , el hardware y los sistemas operativos . ^[2]^[3] Basado en el lenguaje PostScript , cada archivo PDF encapsula una descripción completa de un documento plano de diseño fijo, incluido el texto, las fuentes , los gráficos vectoriales , las imágenes rasterizadas y otra información necesaria para mostrarlo. PDF tiene sus raíces en "El Proyecto Camelot" iniciado por el cofundador de Adobe, John Warnock, en 1991. ^[4] PDF fue estandarizado como ISO 32000 en 2008. ^[5] La última edición como ISO 32000-2:2020 se publicó en diciembre de 2020.

Los archivos PDF pueden contener una variedad de contenido además de texto plano y gráficos, incluidos elementos de estructuración lógica, elementos interactivos como anotaciones y campos de formulario, capas, contenido multimedia (incluido contenido de video), objetos tridimensionales que utilizan U3D o PRC y varios otros formatos de datos . La especificación PDF también permite el cifrado y las firmas digitales , archivos adjuntos y metadatos para habilitar flujos de trabajo que requieren estas funciones.

Historia

El desarrollo de PDF comenzó en 1991, cuando John Warnock escribió un artículo para un proyecto que entonces tenía el nombre en código de Camelot, en el que proponía la creación de una versión simplificada de PostScript llamada Interchange PostScript (IPS). ^[6] A diferencia del PostScript tradicional, que estaba estrictamente enfocado en la reproducción de trabajos de impresión en dispositivos de salida, IPS estaría optimizado para mostrar páginas en cualquier pantalla y en cualquier plataforma. ^[6]

Adobe Systems puso a disposición de forma gratuita la especificación PDF. En los primeros años, el formato PDF fue popular principalmente en los flujos de trabajo de autoedición y compitió con varios otros formatos, incluidos DjVu , Envoy , Common Ground Digital Paper, Farallon Replica e incluso el propio formato PostScript de Adobe.

PDF era un formato propietario controlado por Adobe hasta que fue lanzado como estándar abierto el 1 de julio de 2008 y publicado por la Organización Internacional de Normalización como ISO 32000-1:2008, ^[7]^[8] momento en el que el control de la especificación pasó a un Comité ISO de expertos voluntarios de la industria. En 2008, Adobe publicó una Licencia Pública de Patente para ISO 32000-1 que otorgaba derechos libres de regalías para todas las patentes propiedad de Adobe necesarias para crear, usar, vender y distribuir implementaciones compatibles con PDF. ^[9]

PDF 1.7, la sexta edición de la especificación PDF que se convirtió en ISO 32000-1, incluye algunas tecnologías propietarias definidas solo por Adobe, como Adobe XML Forms Architecture (XFA) y la extensión JavaScript para Acrobat, que son referenciadas por ISO 32000-1 como normativas e indispensables para la implementación completa de la especificación ISO 32000-1. ^[10] Estas tecnologías propietarias no están estandarizadas y su especificación se publica solo en el sitio web de Adobe. ^[11]^[12]^[13] Muchas de ellas no son compatibles con las implementaciones populares de terceros de PDF.

La ISO publicó en 2017 la versión 2.0 de PDF, ISO 32000-2, disponible para su compra, en sustitución de la especificación gratuita proporcionada por Adobe. ^[14] En diciembre de 2020, se publicó la segunda edición de PDF 2.0, ISO 32000-2:2020, con aclaraciones, correcciones y actualizaciones críticas de las referencias normativas ^[15] (la ISO 32000-2 no incluye ninguna tecnología propietaria como referencia normativa). ^[16] En abril de 2023, la Asociación PDF puso a disposición la ISO 32000-2 para su descarga gratuita. ^[14]

Detalles técnicos

Un archivo PDF suele ser una combinación de gráficos vectoriales , texto y gráficos de mapa de bits . Los tipos básicos de contenido de un PDF son:

Texto tipográfico almacenado como flujos de contenido (es decir, no codificado en texto simple );
Gráficos vectoriales para ilustraciones y diseños que consisten en formas y líneas;
Gráficos rasterizados para fotografías y otros tipos de imágenes; y
Otros objetos multimedia.

En revisiones posteriores de PDF, un documento PDF también puede admitir enlaces (dentro del documento o página web), formularios, JavaScript (inicialmente disponible como complemento para Acrobat 3.0) o cualquier otro tipo de contenido integrado que pueda manejarse mediante complementos.

PDF combina tres tecnologías:

Un subconjunto equivalente del lenguaje de programación de descripción de páginas PostScript, pero en forma declarativa, para generar el diseño y los gráficos.
Un sistema de incorporación/reemplazo de fuentes que permite que las fuentes viajen con los documentos.
Un sistema de almacenamiento estructurado para agrupar estos elementos y cualquier contenido asociado en un solo archivo, con compresión de datos cuando sea necesario.

Lenguaje PostScript

PostScript es un lenguaje de descripción de páginas que se ejecuta en un intérprete para generar una imagen. ^[6] Puede manejar gráficos y tiene características estándar de los lenguajes de programación, como ramificaciones y bucles . ^[6] PDF es un subconjunto de PostScript, simplificado para eliminar dichas características de flujo de control , mientras que los comandos gráficos permanecen. ^[6]

PostScript fue diseñado originalmente para un caso de uso drásticamente diferente : la transmisión de trabajos de impresión lineales unidireccionales en los que el intérprete PostScript recopilaría una serie de comandos hasta que encontrara el showpagecomando, luego ejecutaría todos los comandos para representar una página como una imagen rasterizada en un dispositivo de impresión. ^[17] PostScript no fue pensado para el almacenamiento a largo plazo y la representación interactiva en tiempo real de documentos electrónicos en monitores de computadora , por lo que no había necesidad de soportar nada más que la representación consecutiva de páginas. ^[17] Si había un error en la salida impresa final, el usuario lo corregiría en el nivel de aplicación y enviaría un nuevo trabajo de impresión en forma de un archivo PostScript completamente nuevo. Por lo tanto, cualquier página dada en un archivo PostScript podría ser representada con precisión solo como el resultado acumulativo de ejecutar todos los comandos anteriores para dibujar todas las páginas anteriores, cualquiera de los cuales podría afectar las páginas posteriores, más los comandos para dibujar esa página en particular, y no había una manera fácil de omitir ese proceso para saltar a diferentes páginas. ^[17]

Tradicionalmente, para pasar de PostScript a PDF, se utiliza un archivo PostScript de origen (es decir, un programa ejecutable) como base para generar código PDF similar a PostScript (consulte, por ejemplo, Adobe Distiller ). Esto se hace aplicando técnicas de compilación estándar como el desenrollado de bucles , la inserción en línea y la eliminación de ramas no utilizadas, lo que da como resultado un código que es puramente declarativo y estático. ^[17] Luego, el resultado final se empaqueta en un formato contenedor , junto con todas las dependencias necesarias para una representación correcta (archivos externos, gráficos o fuentes a las que hace referencia el documento), y se comprime . Las aplicaciones modernas escriben en controladores de impresora que generan PDF directamente en lugar de pasar primero por PostScript.

Como formato de documento, PDF tiene varias ventajas sobre PostScript:

PDF contiene únicamente código PostScript declarativo estático que puede procesarse como datos y no requiere un intérprete o compilador de programa completo . ^[17] Esto evita la complejidad y los riesgos de seguridad de un motor con un nivel de complejidad tan alto.
Al igual que Display PostScript , PDF admite gráficos transparentes desde la versión 1.4, mientras que PostScript estándar no.
PDF aplica la regla de que el código de cualquier página en particular no puede afectar a ninguna otra página. ^[17] Esta regla también se recomienda encarecidamente para el código PostScript, pero debe implementarse explícitamente (consulte, por ejemplo, las Convenciones de estructuración de documentos ), ya que PostScript es un lenguaje de programación completo que permite una mayor flexibilidad y no se limita a los conceptos de páginas y documentos.
Todos los datos necesarios para la representación se incluyen dentro del propio archivo, lo que mejora la portabilidad. ^[18]

Sus desventajas son:

Una pérdida de flexibilidad y una limitación a un único caso de uso. ^{[ cita requerida ]}
Un tamaño de archivo (a veces mucho) mayor. ^[19]

A partir de la versión 1.6, el formato PDF admite la incorporación de documentos 3D interactivos: los dibujos 3D se pueden incorporar utilizando U3D o PRC y varios otros formatos de datos. ^[20]^[21]^[22]

Formato de archivo

Un archivo PDF se organiza utilizando caracteres ASCII , excepto ciertos elementos que pueden tener contenido binario. El archivo comienza con un encabezado que contiene un número mágico (como una cadena legible) y la versión del formato, por ejemplo %PDF-1.7. El formato es un subconjunto de un formato COS (estructura de objetos "Carrusel"). ^[23] Un archivo de árbol COS consta principalmente de objetos , de los cuales hay nueve tipos: ^[16]

Valores booleanos , que representan verdadero o falso
Números reales
Números enteros
Cadenas , encerradas entre paréntesis ( (...)) o representadas como hexadecimales entre corchetes angulares simples ( <...>). Las cadenas pueden contener caracteres de 8 bits.
Nombres que comienzan con una barra diagonal ( /)
Matrices , colecciones ordenadas de objetos encerrados entre corchetes ( [...])
Diccionarios , colecciones de objetos indexados por nombres encerrados entre corchetes angulares dobles ( <<...>>)
Flujos , que generalmente contienen grandes cantidades de datos binarios comprimidos opcionalmente, precedidos por un diccionario y encerrados entre las palabras clave streamy endstream.
El objeto nulo

%Se pueden insertar comentarios que utilicen caracteres de 8 bits precedidos por el signo de porcentaje ( ).

Los objetos pueden ser directos (incrustados en otro objeto) o indirectos . Los objetos indirectos se numeran con un número de objeto y un número de generación y se definen entre las palabras clave objy endobjsi residen en la raíz del documento. A partir de la versión 1.5 de PDF, los objetos indirectos (excepto otros flujos) también pueden ubicarse en flujos especiales conocidos como flujos de objetos (marcados como /Type /ObjStm). Esta técnica permite que a los objetos que no son flujos se les apliquen filtros de flujo estándar, reduce el tamaño de los archivos que tienen una gran cantidad de objetos indirectos pequeños y es especialmente útil para PDF etiquetados . Los flujos de objetos no admiten la especificación del número de generación de un objeto (que no sea 0).

Una tabla de índice, también llamada tabla de referencia cruzada, se encuentra cerca del final del archivo y proporciona el desplazamiento en bytes de cada objeto indirecto desde el inicio del archivo. ^[24] Este diseño permite un acceso aleatorio eficiente a los objetos en el archivo y también permite realizar pequeños cambios sin reescribir todo el archivo ( actualización incremental ). Antes de la versión 1.5 de PDF, la tabla siempre estaría en un formato ASCII especial, se marcaría con la xrefpalabra clave y seguiría al cuerpo principal compuesto por objetos indirectos. La versión 1.5 introdujo flujos de referencia cruzada opcionales , que tienen la forma de un objeto de flujo estándar, posiblemente con filtros aplicados. Dicho flujo se puede utilizar en lugar de la tabla de referencia cruzada ASCII y contiene los desplazamientos y otra información en formato binario. El formato es flexible ya que permite la especificación del ancho de números enteros (utilizando la /Wmatriz), de modo que, por ejemplo, un documento que no exceda los 64 KiB de tamaño puede dedicar solo 2 bytes para los desplazamientos de objetos.

Al final de un archivo PDF hay un pie de página que contiene

La startxrefpalabra clave seguida de un desplazamiento al inicio de la tabla de referencia cruzada (comenzando con la xrefpalabra clave) o el objeto de flujo de referencia cruzada, seguido de
El marcador %%EOF de final de archivo .

Si no se utiliza un flujo de referencia cruzada, el pie de página está precedido por la trailerpalabra clave seguida de un diccionario que contiene información que de otro modo estaría contenida en el diccionario del objeto del flujo de referencia cruzada:

Una referencia al objeto raíz de la estructura de árbol, también conocido como catálogo ( /Root)
El recuento de objetos indirectos en la tabla de referencias cruzadas ( /Size)
Otra información opcional

Dentro de cada página, hay uno o varios flujos de contenido que describen el texto, los vectores y las imágenes que se dibujan en la página. El flujo de contenido está basado en pilas , de forma similar a PostScript. ^[25]

Los archivos PDF tienen dos diseños: no linealizados (no "optimizados") y linealizados ("optimizados"). Los archivos PDF no linealizados pueden ser más pequeños que sus contrapartes lineales, aunque son más lentos de acceder porque partes de los datos necesarios para ensamblar las páginas del documento están dispersas por todo el archivo PDF. Los archivos PDF linealizados (también llamados archivos PDF "optimizados" u "optimizados para la web") están construidos de una manera que permite leerlos en un complemento del navegador web sin esperar a que se descargue todo el archivo, ya que todos los objetos necesarios para que se muestre la primera página están organizados de manera óptima al comienzo del archivo. ^[26] Los archivos PDF se pueden optimizar utilizando el software Adobe Acrobat o QPDF .

Las dimensiones de la página no están limitadas por el formato en sí. Sin embargo, Adobe Acrobat impone un límite de 15 millones por 15 millones de pulgadas, o 225 billones en ² (145,161 km ² ). ^[2]^{: 1129}

Modelo de imagen

El diseño básico de cómo se representan los gráficos en PDF es muy similar al de PostScript, excepto por el uso de transparencia, que se agregó en PDF 1.4.

Los gráficos PDF utilizan un sistema de coordenadas cartesianas independiente del dispositivo para describir la superficie de una página. Una descripción de página PDF puede utilizar una matriz para escalar , rotar o inclinar elementos gráficos. Un concepto clave en PDF es el de estado de gráficos , que es una colección de parámetros gráficos que se pueden cambiar, guardar y restaurar mediante una descripción de página . PDF tiene (a partir de la versión 2.0) 25 propiedades de estado de gráficos, de las cuales algunas de las más importantes son:

La matriz de transformación actual (CTM), que determina el sistema de coordenadas
La ruta de recorte
El espacio de color
La constante alfa , que es un componente clave de la transparencia
Control de compensación de puntos negros (introducido en PDF 2.0)

Gráficos vectoriales

Al igual que en PostScript, los gráficos vectoriales en PDF se construyen con trazados . Los trazados suelen estar compuestos de líneas y curvas Bézier cúbicas , pero también se pueden construir a partir de los contornos del texto. A diferencia de PostScript, PDF no permite que un único trazado mezcle contornos de texto con líneas y curvas. Los trazados se pueden trazar, rellenar, rellenar y luego trazar, o utilizar para recortar . Los trazos y rellenos pueden utilizar cualquier color establecido en el estado de gráficos, incluidos los patrones . PDF admite varios tipos de patrones. El más simple es el patrón de mosaico en el que se especifica que una pieza de ilustración se dibuje repetidamente. Este puede ser un patrón de mosaico coloreado , con los colores especificados en el objeto de patrón, o un patrón de mosaico sin color , que difiere la especificación del color al momento en que se dibuja el patrón. A partir de PDF 1.3 también hay un patrón de sombreado , que dibuja colores que varían continuamente. Hay siete tipos de patrones de sombreado, de los cuales los más simples son el sombreado axial (Tipo 2) y el sombreado radial (Tipo 3).

Imágenes rasterizadas

Las imágenes rasterizadas en PDF (denominadas Image XObjects ) se representan mediante diccionarios con un flujo asociado. El diccionario describe las propiedades de la imagen y el flujo contiene los datos de la imagen. (Con menos frecuencia, las imágenes rasterizadas pequeñas pueden incrustarse directamente en una descripción de página como una imagen en línea ). Las imágenes suelen filtrarse con fines de compresión. Los filtros de imágenes compatibles con PDF incluyen los siguientes filtros de uso general:

ASCII85Decode , un filtro utilizado para convertir la secuencia en ASCII de 7 bits,
ASCIIHexDecode , similar a ASCII85Decode pero menos compacto,
FlateDecode , un filtro de uso común basado en el algoritmo deflate definido en RFC 1951 (deflate también se utiliza en los formatos de archivo gzip , PNG y zip , entre otros); introducido en PDF 1.2; puede utilizar uno de los dos grupos de funciones predictoras para una compresión zlib/deflate más compacta: Predictor 2 de la especificación TIFF 6.0 y predictores (filtros) de la especificación PNG ( RFC 2083),
LZWDecode , un filtro basado en compresión LZW ; puede utilizar uno de dos grupos de funciones predictoras para una compresión LZW más compacta: Predictor 2 de la especificación TIFF 6.0 y predictores (filtros) de la especificación PNG.
RunLengthDecode , un método de compresión simple para transmisiones con datos repetitivos que utiliza el algoritmo de codificación de longitud de ejecución y los filtros específicos de la imagen.
DCTDecode , un filtro con pérdida basado en el estándar JPEG ,
CCITTFaxDecode , un filtro binivel (blanco/negro) sin pérdida basado en el estándar de compresión de fax del Grupo 3 o Grupo 4 CCITT (ITU-T) definido en ITU-T T.4 y T.6,
JBIG2Decode , un filtro de dos niveles (blanco/negro) con o sin pérdida basado en el estándar JBIG2 , introducido en PDF 1.4, y
JPXDecode , un filtro con pérdida o sin pérdida basado en el estándar JPEG 2000 , introducido en PDF 1.5.

Normalmente, todo el contenido de imagen de un PDF está incrustado en el archivo. Sin embargo, PDF permite almacenar datos de imágenes en archivos externos mediante el uso de secuencias externas o imágenes alternativas . Los subconjuntos estandarizados de PDF, incluidos PDF/A y PDF/X , prohíben estas funciones.

Texto

El texto en PDF se representa mediante elementos de texto en los flujos de contenido de la página. Un elemento de texto especifica que los caracteres deben dibujarse en determinadas posiciones. Los caracteres se especifican mediante la codificación de un recurso de fuente seleccionado .

Un objeto de fuente en PDF es una descripción de una tipografía digital . Puede describir las características de una tipografía o puede incluir un archivo de fuente incrustado . El último caso se denomina fuente incrustada , mientras que el primero se denomina fuente no incrustada . Los archivos de fuente que se pueden incrustar se basan en formatos de fuentes digitales estándar ampliamente utilizados: Type 1 (y su variante comprimida CFF), TrueType y (a partir de PDF 1.6) OpenType . Además, PDF admite la variante Type 3 en la que los componentes de la fuente se describen mediante operadores gráficos PDF.

Catorce tipos de letra, conocidos como las 14 fuentes estándar , tienen un significado especial en los documentos PDF:

Times (v3) (en formato regular, cursiva, negrita y negrita cursiva)
Courier (en letra normal, oblicua, negrita y negrita oblicua)
Helvética (v3) (en regular, oblicua, negrita y negrita oblicua)
Símbolo
Dingbats de Zapf

Estas fuentes a veces se denominan fuentes base catorce . ^[27] Estas fuentes, o fuentes sustitutas adecuadas con las mismas métricas, deberían estar disponibles en la mayoría de los lectores de PDF, pero no se garantiza que estén disponibles en el lector y es posible que solo se muestren correctamente si el sistema las tiene instaladas. ^[28] Las fuentes se pueden sustituir si no están incrustadas en un PDF.

Dentro de las cadenas de texto, los caracteres se muestran utilizando códigos de caracteres (enteros) que se asignan a glifos en la fuente actual utilizando una codificación . Hay varias codificaciones predefinidas, incluidas WinAnsi , MacRoman y muchas codificaciones para idiomas del este asiático, y una fuente puede tener su propia codificación incorporada. (Aunque las codificaciones WinAnsi y MacRoman se derivan de las propiedades históricas de los sistemas operativos Windows y Macintosh , las fuentes que utilizan estas codificaciones funcionan igualmente bien en cualquier plataforma). PDF puede especificar una codificación predefinida para usar, la codificación incorporada de la fuente o proporcionar una tabla de búsqueda de diferencias con una codificación predefinida o incorporada (no recomendado con fuentes TrueType). ^[2] Los mecanismos de codificación en PDF fueron diseñados para fuentes Type 1, y las reglas para aplicarlos a fuentes TrueType son complejas.

Para fuentes grandes o fuentes con glifos no estándar, se utilizan las codificaciones especiales Identity-H (para escritura horizontal) e Identity-V (para escritura vertical). Con estas fuentes, es necesario proporcionar una tabla ToUnicode si se desea conservar la información semántica sobre los caracteres.

Un documento de texto que se escanea a PDF sin que el texto sea reconocido por el reconocimiento óptico de caracteres (OCR) es una imagen, sin fuentes ni propiedades de texto.

Transparencia

El modelo de imagen original de PDF era opaco, similar a PostScript, donde cada objeto dibujado en la página reemplazaba por completo cualquier cosa previamente marcada en la misma ubicación. En PDF 1.4, el modelo de imagen se amplió para permitir la transparencia. Cuando se utiliza la transparencia, los nuevos objetos interactúan con los objetos previamente marcados para producir efectos de fusión. La adición de transparencia a PDF se realizó por medio de nuevas extensiones que fueron diseñadas para ser ignoradas en productos escritos para PDF 1.3 y especificaciones anteriores. Como resultado, los archivos que usan una pequeña cantidad de transparencia pueden ser vistos aceptablemente por visores más antiguos, pero los archivos que hacen un uso extensivo de la transparencia pueden ser vistos incorrectamente por un visor más antiguo.

Las extensiones de transparencia se basan en los conceptos clave de grupos de transparencia , modos de fusión , forma y alfa . El modelo está estrechamente alineado con las características de Adobe Illustrator versión 9. Los modos de fusión se basaron en los utilizados por Adobe Photoshop en ese momento. Cuando se publicó la especificación PDF 1.4, Adobe mantuvo en secreto las fórmulas para calcular los modos de fusión. Desde entonces se han publicado. ^[29]

El concepto de grupo de transparencias en la especificación PDF es independiente de las nociones existentes de "grupo" o "capa" en aplicaciones como Adobe Illustrator. Esas agrupaciones reflejan relaciones lógicas entre objetos que tienen sentido al editarlos, pero no forman parte del modelo de imágenes.

Características adicionales

Estructura lógica y accesibilidad

Un PDF etiquetado (consulte la cláusula 14.8 en ISO 32000) incluye información semántica y de la estructura del documento para permitir la extracción y accesibilidad de texto confiable . ^[30] Técnicamente hablando, un PDF etiquetado es un uso estilizado del formato que se basa en el marco de estructura lógica introducido en PDF 1.3. Un PDF etiquetado define un conjunto de tipos de estructura y atributos estándar que permiten extraer el contenido de la página (texto, gráficos e imágenes) y reutilizarlo para otros fines. ^[31]

El PDF etiquetado no es necesario en situaciones en las que un archivo PDF está destinado únicamente a imprimirse. Dado que la función es opcional y que las reglas para el PDF etiquetado eran relativamente vagas en la norma ISO 32000-1, el soporte para el PDF etiquetado entre los dispositivos de consumo, incluida la tecnología de asistencia (TA), es desigual a partir de 2021. ^[32] Sin embargo, la norma ISO 32000-2 incluye una discusión mejorada del PDF etiquetado que se prevé que facilitará una mayor adopción.

Un subconjunto del formato PDF estandarizado por ISO específicamente orientado a la accesibilidad, PDF/UA , se publicó por primera vez en 2012.

Grupos de contenido opcionales (capas)

Con la introducción de la versión 1.5 (2003) de PDF, surgió el concepto de capas. Las capas, más formalmente conocidas como grupos de contenido opcional (OCG), hacen referencia a secciones de contenido de un documento PDF que los autores o lectores del documento pueden ver u ocultar de forma selectiva. Esta capacidad es útil en dibujos CAD, ilustraciones en capas, mapas, documentos en varios idiomas, etc.

Básicamente, consiste en un diccionario de propiedades de contenido opcional que se agrega a la raíz del documento. Este diccionario contiene una matriz de grupos de contenido opcionales (OCG), cada uno de los cuales describe un conjunto de información y cada uno de los cuales puede mostrarse o suprimirse individualmente, además de un conjunto de diccionarios de configuración de contenido opcionales, que indican el estado (mostrado o suprimido) de los OCG en cuestión.

Cifrado y firmas

Un archivo PDF puede estar cifrado por razones de seguridad, en cuyo caso se necesita una contraseña para ver o editar el contenido. PDF 2.0 define el cifrado AES de 256 bits como el estándar para los archivos PDF 2.0. La Referencia PDF también define formas en las que terceros pueden definir sus propios sistemas de cifrado para PDF.

Los archivos PDF pueden firmarse digitalmente para proporcionar una autenticación segura; en la norma ISO 32000-2 se proporcionan detalles completos sobre la implementación de firmas digitales en PDF.

Los archivos PDF también pueden contener restricciones DRM integradas que brindan más controles que limitan la copia, edición o impresión. Estas restricciones dependen del software del lector para que las respete, por lo que la seguridad que brindan es limitada.

La seguridad estándar proporcionada por PDF consta de dos métodos diferentes y dos contraseñas diferentes: una contraseña de usuario , que encripta el archivo y evita su apertura, y una contraseña de propietario , que especifica las operaciones que deben restringirse incluso cuando el documento está desencriptado, que pueden incluir modificar, imprimir o copiar texto y gráficos del documento, o agregar o modificar notas de texto y campos de AcroForm. La contraseña de usuario encripta el archivo, mientras que la contraseña de propietario no lo hace, sino que depende del software cliente para respetar estas restricciones. Una contraseña de propietario se puede eliminar fácilmente mediante software, incluidos algunos servicios en línea gratuitos. ^[33] Por lo tanto, las restricciones de uso que un autor de documento coloca en un documento PDF no son seguras y no se pueden garantizar una vez que se distribuye el archivo; esta advertencia se muestra al aplicar dichas restricciones utilizando el software Adobe Acrobat para crear o editar archivos PDF.

Incluso sin eliminar la contraseña, la mayoría de los lectores de PDF gratuitos o de código abierto ignoran las "protecciones" de permisos y permiten al usuario imprimir o hacer copias de extractos del texto como si el documento no estuviera limitado por la protección de contraseña. ^[34]^[35]^[36]

A partir de PDF 1.5, las firmas de derechos de uso (UR) se utilizan para habilitar funciones interactivas adicionales que no están disponibles de forma predeterminada en una aplicación de visualización de PDF en particular. La firma se utiliza para validar que los permisos han sido otorgados por una autoridad otorgante de buena fe . Por ejemplo, se puede utilizar para permitir a un usuario: ^[37]

Para guardar el documento PDF junto con un formulario modificado o datos de anotación
Importar archivos de datos de formulario en formatos FDF, XFDF y texto (CSV/TSV)
Exportar archivos de datos de formulario en formatos FDF y XFDF
Enviar datos del formulario
Crear nuevas páginas a partir de plantillas de páginas con nombre
Aplicar una firma digital a un campo de formulario de firma digital existente
Crear, eliminar, modificar, copiar, importar y exportar anotaciones

Por ejemplo, Adobe Systems otorga permisos para habilitar funciones adicionales en Adobe Reader, utilizando criptografía de clave pública . Adobe Reader verifica que la firma utilice un certificado de una autoridad de certificación autorizada por Adobe. Cualquier aplicación PDF puede utilizar este mismo mecanismo para sus propios fines. ^[37]

En circunstancias específicas, incluidos sistemas del receptor que no están parcheados , la información que ve el receptor de un documento firmado digitalmente puede ser manipulada por el remitente después de que el firmante haya firmado el documento. ^[38]

PAdES ( PDF Advanced Electronic Signatures ) es un conjunto de restricciones y extensiones de PDF y de la norma ISO 32000-1 ^[39] que lo hacen adecuado para las firmas electrónicas avanzadas . Está publicado por ETSI como TS 102 778. ^[40]

Archivos adjuntos

Los archivos PDF pueden tener archivos adjuntos a los que los procesadores pueden acceder y abrir o guardar en un sistema de archivos local. ^[41]

Metadatos

Los archivos PDF pueden contener dos tipos de metadatos. ^[2] El primero es el Diccionario de información del documento, un conjunto de campos clave/valor como autor, título, tema, fecha de creación y fecha de actualización. Esto es opcional y se hace referencia a él desde una Infoclave en el tráiler del archivo. Se define un pequeño conjunto de campos y se puede ampliar con valores de texto adicionales si es necesario. Este método está obsoleto en PDF 2.0.

En PDF 1.4, se agregó compatibilidad con secuencias de metadatos, utilizando la Plataforma de metadatos extensible (XMP) para agregar metadatos extensibles basados en estándares XML, como se usa en otros formatos de archivo. PDF 2.0 permite adjuntar metadatos a cualquier objeto del documento, como información sobre ilustraciones, fuentes e imágenes incrustadas, así como al documento completo (adjuntándolo al catálogo de documentos), utilizando un esquema extensible.

Los documentos PDF también pueden contener configuraciones de visualización, incluido el diseño de la página y el nivel de zoom en un objeto de Preferencias del Visor. Adobe Reader utiliza estas configuraciones para anular las configuraciones predeterminadas del usuario al abrir el documento. ^[42] El Adobe Reader gratuito no puede eliminar estas configuraciones.

Accesibilidad

Los archivos PDF se pueden crear específicamente para que sean accesibles para personas con discapacidades. ^[43]^[44]^[45]^[46]^[47] Los formatos de archivos PDF en uso a partir de 2014 ^[actualizar]pueden incluir etiquetas, equivalentes de texto, subtítulos, descripciones de audio y más. Algunos programas pueden producir automáticamente archivos PDF etiquetados , pero esta función no siempre está habilitada de forma predeterminada. ^[48]^[49] Los principales lectores de pantalla , incluidos JAWS , Window-Eyes , Hal y Kurzweil 1000 y 3000 , pueden leer archivos PDF etiquetados. ^[50]^[51] Además, los archivos PDF etiquetados se pueden volver a ajustar y ampliar para lectores con discapacidades visuales. Agregar etiquetas a archivos PDF más antiguos y a los que se generan a partir de documentos escaneados puede presentar algunos desafíos.

Uno de los desafíos más importantes de la accesibilidad de los archivos PDF es que estos tienen tres vistas distintas que, según la creación del documento, pueden ser incoherentes entre sí. Las tres vistas son (i) la vista física, (ii) la vista de etiquetas y (iii) la vista de contenido. La vista física se muestra e imprime (lo que la mayoría de las personas considera un documento PDF). La vista de etiquetas es lo que utilizan los lectores de pantalla y otras tecnologías de asistencia para ofrecer una experiencia de lectura y navegación de alta calidad a los usuarios con discapacidades. La vista de contenido se basa en el orden físico de los objetos dentro del flujo de contenido del PDF y puede mostrarse mediante software que no admita totalmente la vista de etiquetas, como la función Reflow de Adobe Reader.

PDF/UA , el estándar internacional para PDF accesible basado en ISO 32000-1, se publicó por primera vez como ISO 14289–1 en 2012 y establece un lenguaje normativo para la tecnología PDF accesible.

Multimedia

Rich Media PDF es un archivo PDF que incluye contenido interactivo que se puede incrustar o vincular dentro del archivo. Puede contener imágenes, audio, contenido de video o botones. Por ejemplo, si el PDF interactivo es un catálogo digital para una empresa de comercio electrónico, los productos se pueden incluir en las páginas PDF y se pueden agregar imágenes y enlaces al sitio web y botones para realizar pedidos directamente desde el documento.

Formularios

Los formularios interactivos son un mecanismo para agregar formularios al formato de archivo PDF. PDF actualmente admite dos métodos diferentes para integrar datos y formularios PDF. Ambos formatos coexisten hoy en día en la especificación PDF: ^[37]^[52]^[53]^[54]

AcroForms (también conocido como formularios Acrobat), introducido en la especificación de formato PDF 1.2 e incluido en todas las especificaciones PDF posteriores.
Formularios XML Forms Architecture (XFA), introducidos en la especificación de formato PDF 1.5. Los formularios XFA de Adobe no son compatibles con AcroForms. ^[55] XFA quedó obsoleto en PDF con PDF 2.0.

Los AcroForms se introdujeron en el formato PDF 1.2. Los AcroForms permiten el uso de objetos ( por ejemplo , cuadros de texto , botones de opción , etc. ) y algo de código ( por ejemplo, JavaScript). Junto con los tipos de acciones estándar de PDF, los formularios interactivos (AcroForms) admiten el envío, restablecimiento e importación de datos. La acción "enviar" transmite los nombres y valores de los campos de formulario interactivo seleccionados a un localizador uniforme de recursos (URL) especificado. Los nombres y valores de los campos de formulario interactivo se pueden enviar en cualquiera de los siguientes formatos (según la configuración de los indicadores ExportFormat, SubmitPDF y XFDF de la acción): ^[37]

Formato de formulario HTML: Especificación HTML 4.01 desde PDF 1.5; HTML 2.0 desde 1.2
Formato de datos de formularios (FDF): basado en PDF, utiliza la misma sintaxis y tiene esencialmente la misma estructura de archivos, pero es mucho más simple que PDF ya que el cuerpo de un documento FDF consta de un solo objeto requerido. El formato de datos de formularios se define en la especificación PDF (desde PDF 1.2). El formato de datos de formularios se puede utilizar al enviar datos de formulario a un servidor, recibir la respuesta e incorporarla al formulario interactivo. También se puede utilizar para exportar datos de formulario a archivos independientes que se pueden volver a importar al formulario interactivo PDF correspondiente. FDF se definió originalmente en 1996 como parte de ISO 32000-2:2017. ^{[ cita requerida ]}
Formato de datos de formularios XML (XFDF): (Especificación de formato de datos de formularios XML externa, versión 2.0; compatible desde PDF 1.5; reemplazó el formato de envío de formularios "XML" definido en PDF 1.4) la versión XML del formato de datos de formularios, pero el XFDF implementa solo un subconjunto de FDF que contiene formularios y anotaciones. Algunas entradas en el diccionario FDF no tienen equivalentes XFDF, como Estado, Codificación, JavaScript, Claves de página, EmbeddedFDFs, Diferencias y Destino. Además, XFDF no permite la generación o adición de nuevas páginas basadas en los datos proporcionados; como se puede hacer al usar un archivo FDF. La especificación XFDF se referencia (pero no se incluye) en la especificación PDF 1.5 (y en versiones posteriores). Se describe por separado en la Especificación de formato de datos de formularios XML . ^[56] La especificación PDF 1.4 permitía envíos de formularios en formato XML, pero esto fue reemplazado por envíos en formato XFDF en la especificación PDF 1.5. XFDF se ajusta al estándar XML. XFDF se puede utilizar de la misma manera que FDF; por ejemplo, los datos del formulario se envían a un servidor, se realizan modificaciones, luego se envían de vuelta y los nuevos datos del formulario se importan en un formulario interactivo. También se puede utilizar para exportar datos del formulario a archivos independientes que se pueden volver a importar en el formulario interactivo PDF correspondiente. A partir de agosto de 2019, XFDF 3.0 es un estándar ISO/IEC con el nombre formal ISO 19444-1:2019 - Gestión de documentos — Formato de datos de formularios XML — Parte 1: Uso de ISO 32000-2 (XFDF 3.0) . ^[57] Este estándar es una referencia normativa de ISO 32000-2.
PDF

Se puede enviar el documento completo en lugar de campos y valores individuales, como se definió en PDF 1.4.

AcroForms puede mantener los valores de los campos de formulario en archivos externos independientes que contienen pares clave-valor. Los archivos externos pueden utilizar archivos de formato de datos de formularios (FDF) y de formato de datos de formularios XML (XFDF). ^[58]^[56]^[59] Las firmas de derechos de uso (UR) definen los derechos para importar archivos de datos de formularios en formatos FDF, XFDF y de texto ( CSV / TSV ), y exportar archivos de datos de formularios en formatos FDF y XFDF. ^[37]

En PDF 1.5, Adobe Systems introdujo un formato propietario para formularios: Adobe XML Forms Architecture (XFA). Los formularios Adobe XFA no son compatibles con la función AcroForms de ISO 32000 y la mayoría de los procesadores PDF no admiten contenido XFA. La especificación XFA se menciona en ISO 32000-1/PDF 1.7 como una especificación externa y se eliminó por completo de PDF con ISO 32000-2 (PDF 2.0).

Licencias

Cualquiera puede crear aplicaciones que puedan leer y escribir archivos PDF sin tener que pagar regalías a Adobe Systems; Adobe posee patentes de PDF, pero las licencia para su uso libre de regalías en el desarrollo de software que cumpla con su especificación PDF. ^[60]

Seguridad

Cambios en el contenido

En noviembre de 2019, investigadores de la Universidad del Ruhr de Bochum y Hackmanit GmbH publicaron ataques a archivos PDF firmados digitalmente. ^[61] Demostraron cómo cambiar el contenido visible en un PDF firmado sin invalidar la firma en 21 de los 22 visores de PDF de escritorio y 6 de los 8 servicios de validación en línea abusando de fallas de implementación. En la misma conferencia, mostraron además cómo exfiltrar el texto sin formato del contenido cifrado en archivos PDF. ^[62] En 2021, mostraron nuevos llamados ataques shadow en archivos PDF que abusan de la flexibilidad de las características proporcionadas en la especificación. ^[63] Jens Müller presentó una descripción general de los problemas de seguridad en archivos PDF con respecto a los ataques de denegación de servicio , divulgación de información , manipulación de datos y ejecución de código arbitrario . ^[64]^[65]

Vulnerabilidad de malware

Los archivos PDF pueden estar infectados con virus, troyanos y otros programas maliciosos. Pueden tener código JavaScript oculto que podría explotar vulnerabilidades en un PDF, objetos ocultos que se ejecutan cuando se abre el archivo que los oculta y, con menos frecuencia, un PDF malicioso puede ejecutar programas maliciosos. ^[66]

Los archivos PDF adjuntos que contienen virus se descubrieron por primera vez en 2001. El virus, llamado OUTLOOK.PDFWorm o Peachy , utiliza Microsoft Outlook para enviarse como un archivo PDF de Adobe adjunto. Se activó con Adobe Acrobat, pero no con Acrobat Reader. ^[67]

De vez en cuando, se descubren nuevas vulnerabilidades en varias versiones de Adobe Reader, ^[68] lo que lleva a la empresa a publicar parches de seguridad. Otros lectores de PDF también son susceptibles. Un factor agravante es que un lector de PDF puede configurarse para iniciarse automáticamente si una página web tiene un archivo PDF incrustado, lo que proporciona un vector para el ataque. Si una página web maliciosa contiene un archivo PDF infectado que se aprovecha de una vulnerabilidad en el lector de PDF, el sistema puede verse comprometido incluso si el navegador es seguro. Algunas de estas vulnerabilidades son el resultado de que el estándar PDF permite que los documentos PDF se escriban con JavaScript. Deshabilitar la ejecución de JavaScript en el lector de PDF puede ayudar a mitigar tales exploits futuros, aunque no protege contra exploits en otras partes del software de visualización de PDF. Los expertos en seguridad dicen que JavaScript no es esencial para un lector de PDF y que el beneficio de seguridad que se obtiene al deshabilitar JavaScript supera cualquier problema de compatibilidad causado. ^[69] Una forma de evitar los exploits de archivos PDF es tener un servicio local o web que convierta los archivos a otro formato antes de verlos.

El 30 de marzo de 2010, el investigador de seguridad Didier Stevens informó sobre una vulnerabilidad de explotación de Adobe Reader y Foxit Reader que ejecuta un archivo ejecutable malicioso si el usuario lo permite cuando se le solicita. ^[70]

Software

Espectadores y editores

Se ofrecen muchos visualizadores de PDF gratuitos de diversas fuentes. Los programas para manipular y editar archivos PDF están disponibles, generalmente a la venta.

Existen muchas opciones de software para crear archivos PDF, incluidas las capacidades de impresión PDF integradas en macOS , iOS , ^[71] y la mayoría de las distribuciones de Linux . Gran parte del software de procesamiento de documentos, incluidos LibreOffice , Microsoft Office 2007 (si se actualiza a SP2 ) y posteriores, ^[72] WordPerfect 9 y Scribus , pueden exportar documentos en formato PDF. Hay muchos controladores de impresión PDF para Microsoft Windows, el sistema de composición tipográfica pdfTeX , las herramientas PDF de DocBook , aplicaciones desarrolladas en torno a Ghostscript y el propio Adobe Acrobat , así como Adobe InDesign , Adobe FrameMaker , Adobe Illustrator, Adobe Photoshop, que permiten configurar una "impresora PDF", que cuando se selecciona envía la salida a un archivo PDF en lugar de a una impresora física. La suite de oficina en línea de Google, Google Docs, permite cargar y guardar en PDF. Algunas aplicaciones web ofrecen herramientas gratuitas de edición y anotación de PDF.

La Free Software Foundation estaba "desarrollando un conjunto de bibliotecas y programas libres, de alta calidad y completamente funcionales que implementan el formato de archivo PDF y las tecnologías asociadas al estándar ISO 32000", como uno de sus proyectos de alta prioridad . ^[73]^[74] Sin embargo, en 2011, el proyecto GNU PDF fue eliminado de la lista de "proyectos de alta prioridad" debido a la maduración de la biblioteca Poppler , ^[75] que ha disfrutado de un uso más amplio en aplicaciones como Evince con el entorno de escritorio GNOME . Poppler se basa en la base de código Xpdf ^[76]^[77] . También hay bibliotecas de desarrollo comerciales disponibles como se enumera en la Lista de software PDF .

El proyecto Apache PDFBox de la Apache Software Foundation es una biblioteca Java de código abierto, licenciada bajo la Licencia Apache , para trabajar con documentos PDF. ^[78]

Impresión

Los procesadores de imágenes rasterizadas (RIP) se utilizan para convertir archivos PDF en un formato rasterizado adecuado para la impresión en papel y otros medios en impresoras, prensas de producción digital y preimpresión en un proceso conocido como rasterización . Los RIP capaces de procesar PDF directamente incluyen Adobe PDF Print Engine ^[79] de Adobe Systems y Jaws ^[80] y Harlequin RIP de Global Graphics .

En 1993, el procesador de imágenes rasterizadas Jaws de Global Graphics se convirtió en el primer RIP de preimpresión que interpretaba PDF de forma nativa sin conversión a otro formato. La empresa lanzó una actualización de su RIP Harlequin con la misma capacidad en 1997. ^[81]

Agfa-Gevaert presentó y lanzó Apogee, el primer sistema de flujo de trabajo de preimpresión basado en PDF, en 1997.

Muchas imprentas offset comerciales han aceptado el envío de archivos PDF listos para imprimir como fuente de impresión, específicamente el subconjunto PDF/X-1a y variaciones del mismo. ^[82] El envío de archivos PDF listos para imprimir es un reemplazo de la problemática necesidad de recibir archivos de trabajo nativos recopilados.

En 2006, el formato PDF fue ampliamente aceptado como el formato estándar para trabajos de impresión en la Cumbre de Impresión de los Laboratorios de Desarrollo de Código Abierto . El Sistema de Impresión Común de Unix lo admite como formato de trabajo de impresión y los proyectos de aplicaciones de escritorio como GNOME, KDE , Firefox , Thunderbird , LibreOffice y OpenOffice han cambiado para emitir trabajos de impresión en PDF. ^[83]

Algunas impresoras de escritorio también admiten la impresión directa de PDF, que puede interpretar datos PDF sin ayuda externa.

Modelo de visualización nativo

PDF fue seleccionado como el formato de metarchivo "nativo" para macOS (originalmente llamado Mac OS X), reemplazando el formato PICT del Mac OS clásico anterior . El modelo de imágenes de la capa gráfica Quartz se basa en el modelo común a Display PostScript y PDF, lo que lleva al apodo de Display PDF . La aplicación Vista previa puede mostrar archivos PDF, al igual que la versión 2.0 y posteriores del navegador web Safari . La compatibilidad a nivel de sistema con PDF permite que las aplicaciones macOS creen documentos PDF automáticamente, siempre que admitan la arquitectura de impresión estándar del sistema operativo. Luego, los archivos se exportan en formato PDF 1.3 de acuerdo con el encabezado del archivo. Al tomar una captura de pantalla en las versiones 10.0 a 10.3 de Mac OS X, la imagen también se capturó como PDF; las versiones posteriores guardan las capturas de pantalla como un archivo PNG, aunque este comportamiento se puede volver a configurar en PDF si se desea.

Anotación

Adobe Acrobat es un ejemplo de software propietario que permite al usuario anotar, resaltar y agregar notas a archivos PDF ya creados. Una aplicación UNIX disponible como software libre (bajo la Licencia Pública General GNU ) es PDFedit . El freeware Foxit Reader , disponible para Microsoft Windows, macOS y Linux, permite anotar documentos. El PDF-XChange Viewer de Tracker Software permite anotaciones y marcas sin restricciones en su alternativa de freeware . El visor de PDF integrado de macOS de Apple , Preview, también permite anotaciones al igual que el software de código abierto Skim , y este último admite la interacción con LaTeX , SyncTeX y PDFSync y la integración con el software de gestión de referencias BibDesk . El freeware Qiqqa puede crear un informe de anotaciones que resume todas las anotaciones y notas que uno ha hecho en su biblioteca de PDF. La herramienta de verificación de texto exporta diferencias en los documentos como anotaciones y marcas.

También existen sistemas de anotación web que admiten la anotación en PDF y otros formatos de documentos. En los casos en los que se espera que los PDF tengan todas las funciones de los documentos en papel, se requiere la anotación con tinta.

Conversión y extracción de información

El énfasis de PDF en preservar la apariencia visual de los documentos en diferentes plataformas de software y hardware plantea desafíos para la conversión de documentos PDF a otros formatos de archivo y la extracción dirigida de información , como texto, imágenes, tablas, información bibliográfica y metadatos de documentos . Numerosas herramientas y bibliotecas de código fuente respaldan estas tareas. Existen varios conjuntos de datos etiquetados para probar las herramientas de conversión de PDF y extracción de información y se han utilizado para evaluaciones comparativas del rendimiento de la herramienta. ^[84]

Alternativas

La especificación de papel Open XML es un formato competitivo que se utiliza tanto como lenguaje de descripción de páginas como formato de administrador de impresión nativo para Microsoft Windows desde Windows Vista .

Objeto mixto: la arquitectura de contenido de documentos es un formato competitivo. MO:DCA-P es parte de la presentación de funciones avanzadas .

Véase también

Referencias

^ ab Hardy, M.; Masinter, L.; Markovic, D.; Johnson, D.; Bailey, M. (marzo de 2017). Tipo de medio application/pdf. IETF . doi : 10.17487/RFC8118 . RFC 8118.
^ abcd Adobe Systems Incorporated (noviembre de 2006). «PDF Reference» (PDF) . 1.7 (6.ª ed.). Archivado desde el original (PDF) el 1 de octubre de 2008. Consultado el 12 de enero de 2023 .
^ Warnock, J. (14 de octubre de 2004) [Fecha original: 5 de mayo de 1995]. "The Camelot Project" (PDF) . Archivado (PDF) del original el 18 de julio de 2011.
^ "¿Qué es un PDF? Formato de documento portátil | Adobe Acrobat DC". Adobe Systems Inc. Archivado desde el original el 30 de enero de 2023. Consultado el 12 de enero de 2023 .
^ "ISO 32000-1:2008" (PDF) . Archivado desde el original (PDF) el 26 de julio de 2018.
^ abcde Pfiffner, Pamela (2003). Inside the Publishing Revolution: The Adobe Story (Dentro de la revolución editorial: la historia de Adobe) . Berkeley: Peachpit Press. pág. 137. ISBN 0-321-11564-3.
^ "ISO 32000-1:2008 – Gestión de documentos – Formato de documento portátil – Parte 1: PDF 1.7". ISO. 1 de julio de 2008. Archivado desde el original el 6 de diciembre de 2010. Consultado el 21 de febrero de 2010 .
^ Orion, Egan (5 de diciembre de 2007). «PDF 1.7 está aprobado como ISO 32000». The Inquirer . Archivado desde el original el 13 de diciembre de 2007. Consultado el 5 de diciembre de 2007 .
^ "Licencia de patente pública, ISO 32000-1: 2008 – PDF 1.7" (PDF) . Adobe Systems Inc. 2008. Archivado (PDF) desde el original el 18 de junio de 2009. Consultado el 12 de enero de 2023 .
^ "Guía para la contratación de TIC basadas en estándares – Elementos de buenas prácticas, Contra el encierro: creación de sistemas de TIC abiertos mediante un mejor uso de las normas en la contratación pública". Comisión Europea. 25 de junio de 2013. Archivado desde el original el 19 de septiembre de 2020. Consultado el 12 de enero de 2023. Ejemplo: ISO/IEC 29500, ISO/IEC 26300 e ISO 32000 para formatos de documentos, información de referencia a la que no tienen acceso todas las partes (referencias a tecnología y marcas registradas, alcance incompleto o enlaces web inactivos).
^ "ISO/TC 171/SC 2/WG 8 N 603 – Informe de la reunión" (PDF) . Editar . 27 de junio de 2011. Archivado desde el original (PDF) el 26 de noviembre de 2012 – vía Archivo. XFA no será un estándar ISO por ahora. El Comité insta a Adobe Systems a enviar la Especificación XFA, XML Forms Architecture (XFA), a ISO para su estandarización El Comité está preocupado por la estabilidad de la especificación XFA La Parte 2 hará referencia a XFA 3.1
^ "Incorporación y publicación de figuras científicas tridimensionales interactivas en archivos de formato de documento portátil (PDF)". PLOS ONE . 8 (9). 2013. doi : 10.1371/journal.pone.0069446.s001 . la implementación del estándar U3D no fue completa y se utilizaron extensiones propietarias.
^ Leonard Rosenthol (2012). «PDF y estándares» (PDF) . Adobe Systems. Archivado desde el original (PDF) el 2 de septiembre de 2013. Consultado el 20 de octubre de 2013 a través de Parleys.
^ ab "Anuncio de acceso sin costo al último estándar PDF: ISO 32000-2 (PDF 2.0)" (Nota de prensa). PDF Association. 16 de junio de 2023 [Actualizado; publicado originalmente el 5 de abril de 2023]. Archivado desde el original el 23 de septiembre de 2023 . Consultado el 6 de octubre de 2023 .
^ "La norma ISO 32000-2:2020 ya está disponible". PDFA. 14 de diciembre de 2020. Archivado desde el original el 4 de diciembre de 2022. Consultado el 3 de febrero de 2021 .
^ ab «ISO 32000-2 – Gestión de documentos — Formato de documento portátil — Parte 2: PDF 2.0». ISO. 5 de enero de 2021. Archivado desde el original el 28 de enero de 2021. Consultado el 3 de febrero de 2021 .
^ abcdef Pfiffner, Pamela (2003). Inside the Publishing Revolution: The Adobe Story . Berkeley: Peachpit Press. pág. 139. ISBN 0-321-11564-3.
^ "Referencia del lenguaje PostScript" (PDF) . Archivado desde el original (PDF) el 24 de julio de 2021.
^ Anton Ertl, Martin. "¿Para qué sirve el formato PDF?". complang.tuwien.ac.at . Universidad Tecnológica de Viena. Archivado desde el original el 4 de abril de 2024. Consultado el 8 de abril de 2024 .
^ "Formatos compatibles con 3D". Adobe Systems Inc. 14 de julio de 2009. Archivado desde el original el 12 de febrero de 2010. Consultado el 21 de febrero de 2010 .
^ "Formatos de archivo compatibles con Acrobat y Reader". Adobe Systems Inc. 11 de noviembre de 2022. Archivado desde el original el 21 de diciembre de 2022. Consultado el 12 de enero de 2023 .
^ "JavaScript para Acrobat 3D | Adobe Acrobat Developer Center". Adobe Systems Inc. Archivado desde el original el 12 de noviembre de 2009. Consultado el 12 de enero de 2023 .
^ Pravetz, Jim. "En defensa de COS, o por qué me encanta JSON y odio XML". jimpravetz.com . Archivado desde el original el 2 de mayo de 2014.{{cite web}}: CS1 maint: URL no apta ( enlace )
^ Adobe Systems, Referencia PDF, págs. 39–40.
^ Documentación de PikePdf. «Trabajar con flujos de contenido». Archivado desde el original el 5 de julio de 2022. Consultado el 8 de mayo de 2022 .
^ "Adobe Developer Connection: PDF Reference and Adobe Extensions to the PDF Specification". Adobe Systems Inc. Archivado desde el original el 15 de noviembre de 2006. Consultado el 13 de diciembre de 2010 .
^ Howard, Jacci. «Desktop Publishing: Base 14 Fonts – Definition» (Edición de escritorio: fuentes Base 14: definición). About.com Tech . Archivado desde el original el 14 de junio de 2016.
^ Merz, Thomas (junio de 2003). "El acuario de fuentes PDF" (PDF) . Archivado desde el original el 18 de julio de 2011.{{cite web}}: CS1 maint: URL no apta ( enlace )
^ "Anexo de modos de fusión de PDF" (PDF) . Archivado desde el original (PDF) el 14 de octubre de 2011. Consultado el 12 de enero de 2023 .
^ "Guía de mejores prácticas para PDF etiquetado: sintaxis" (PDF) . pdfa.org . PDF Association . Junio de 2019 . Consultado el 24 de junio de 2024 .
^ Johnson, Duff (22 de abril de 2004). "¿Qué es un PDF etiquetado?". Archivado desde el original el 7 de agosto de 2004.
^ "¿Es accesible el formato PDF?". DO-IT - Discapacidades, oportunidades, interconexión de redes y tecnología . Universidad de Washington. 4 de octubre de 2022. Archivado desde el original el 10 de febrero de 2023. Consultado el 12 de enero de 2023 .
^ "FreeMyPDF.com – Elimina las contraseñas de los archivos PDF visibles". freemypdf.com . Archivado desde el original el 20 de febrero de 2021 . Consultado el 23 de junio de 2009 .
^ Kirk, Jeremy (4 de diciembre de 2008). «Adobe admite que la nueva protección con contraseña para PDF es más débil». Macworld . IDG Communications Inc. Archivado desde el original el 17 de enero de 2017 . Consultado el 14 de septiembre de 2016 .
^ Guignard, Bryan. "Cuán seguro es el formato PDF" (PDF) . Universidad Carnegie Mellon. Archivado desde el original (PDF) el 24 de octubre de 2005.
^ Merz, Thomas (noviembre de 2001). PDF Security Overview: Strengths and Weaknesses (PDF) . PDF Conferencia de 2001. Scottsdale/Arizona. Archivado desde el original el 11 de octubre de 2010.{{cite conference}}: CS1 maint: URL no apta ( enlace )
^ abcde Adobe Systems Inc. (1 de julio de 2008). «Gestión de documentos: formato de documento portátil, parte 1: PDF 1.7, primera edición» (PDF) . Archivado desde el original (PDF) el 3 de diciembre de 2008. Consultado el 12 de enero de 2023 .
^ "Sitio web sobre inseguridad en PDF". pdf-insecurity.org . Archivado desde el original el 26 de marzo de 2023. Consultado el 12 de enero de 2023 .
^ "ISO 32000-1:2008 Gestión de documentos - Formato de documento portátil - Parte 1: PDF 1.7". Organización Internacional de Normalización ISO. Archivado desde el original el 10 de febrero de 2017. Consultado el 22 de marzo de 2016 .
^ "ETSI TS 102 778-1 - Firmas electrónicas e infraestructuras (ESI); PDF Perfiles avanzados de firma electrónica; Parte 1: Descripción general de PAdES: un documento marco para PAdES" (PDF) . 1.1.1. Instituto Europeo de Normas de Telecomunicaciones ETSI. Julio de 2009. Archivado (PDF) desde el original el 8 de marzo de 2023 . Consultado el 12 de enero de 2023 .
^ "Enlaces y archivos adjuntos en archivos PDF". Archivado desde el original el 23 de abril de 2021 . Consultado el 23 de abril de 2021 .
^ "Familiarizarse con Adobe Reader > Comprender las preferencias". Adobe Press . Pearson. 2 de septiembre de 2005. Archivado desde el original el 23 de octubre de 2012 . Consultado el 12 de enero de 2023 .
^ "Accesibilidad de PDF". WebAIM. Archivado desde el original el 12 de enero de 2023. Consultado el 12 de enero de 2023 .
^ Clark, Joe (22 de agosto de 2005). «Hechos y opiniones sobre la accesibilidad de los archivos PDF». Archivado desde el original el 24 de enero de 2013. Consultado el 12 de enero de 2023 .
^ "Accesibilidad y documentos PDF". Centro de Accesibilidad Web . Universidad Estatal de Ohio. Archivado desde el original el 27 de abril de 2010. Consultado el 12 de enero de 2023 .
^ "Estándares de accesibilidad de PDF". 1.2. BBC. Archivado desde el original el 29 de mayo de 2010. Consultado el 12 de enero de 2023 .
^ "Accesibilidad de PDF" (PDF) . Universidad Estatal de California. 2009. Archivado desde el original (PDF) el 27 de mayo de 2010. Consultado el 12 de enero de 2023 .
^ "Ayuda de LibreOffice: Exportar como PDF". Archivado desde el original el 12 de enero de 2023. Consultado el 12 de enero de 2023 .
^ Z., Andrew (11 de enero de 2008). «Exportación de PDF/A para archivado a largo plazo». Archivado desde el original el 24 de febrero de 2021. Consultado el 22 de septiembre de 2012 .
^ Biersdorfer, JD (10 de abril de 2009). «Consejo de la semana: función 'Leer en voz alta' de Adobe Reader». The New York Times . Archivado desde el original el 22 de noviembre de 2020. Consultado el 12 de enero de 2023 .
^ "Acceso a documentos PDF con tecnología de asistencia: guía del usuario de un lector de pantalla" (PDF) . Adobe Systems Inc. Archivado desde el original (PDF) el 28 de julio de 2008 . Consultado el 12 de enero de 2023 .
^ "Gnu PDF – PDF Knowledge – Formato de datos de formularios". Archivado desde el original el 1 de enero de 2013 . Consultado el 12 de enero de 2023 .{{cite web}}: CS1 maint: URL no apta ( enlace )
^ "Acerca de los formularios PDF". Adobe Systems Inc. Archivado desde el original el 29 de abril de 2011. Consultado el 19 de febrero de 2010 .
^ Demling, Peter (1 de julio de 2008). «¿Cómo convertir un formulario XFA a AcroForm?». Archivado desde el original el 12 de enero de 2023. Consultado el 12 de enero de 2023 .
^ "Migración de formularios de Adobe Acrobat a formularios XML". Archivado desde el original el 6 de octubre de 2010. Consultado el 12 de enero de 2023 .
^ ab "Especificación del formato de datos de formularios XML, versión 2" (PDF) . Septiembre de 2007. Archivado desde el original (PDF) el 30 de julio de 2018. Consultado el 19 de febrero de 2010 .
^ "ISO 19444-1:2019(en)". Organización Internacional de Normalización. Archivado desde el original el 17 de junio de 2016 . Consultado el 3 de diciembre de 2020 .
^ Adobe Systems Incorporated (20 de septiembre de 2022). «Uso de formularios y datos de formularios de Acrobat en la Web». Archivado desde el original el 12 de enero de 2023. Consultado el 12 de enero de 2023 .
^ "Especificación de intercambio de datos FDF" (PDF) . 8 de febrero de 2007. Archivado desde el original (PDF) el 3 de diciembre de 2008. Consultado el 12 de enero de 2023 .
^ "Recursos para desarrolladores". Adobe Systems Inc. Archivado desde el original el 27 de febrero de 2016.
^ Mladenov, Vladislav; Mainka, Christian; Meyer Zu Selhausen, Karsten; Grothe, Martin; Schwenk, Jörg (6 de noviembre de 2019). "Reembolso de 1 billón de dólares: cómo falsificar firmas PDF". Actas de la Conferencia ACM SIGSAC de 2019 sobre seguridad informática y de las comunicaciones . CCS '19. Biblioteca digital ACM, Conferencia ACM SIGSAC sobre seguridad informática y de las comunicaciones. págs. 1–14. doi :10.1145/3319535.3339812. ISBN 9781450367479. S2CID 199367545. Archivado desde el original el 26 de abril de 2021 . Consultado el 6 de abril de 2021 .
^ Müller, Jens; Ising, Fabian; Mladenov, Vladislav; Mainka, Christian; Schinzel, Sebastian; Schwenk, Jörg (6 de noviembre de 2019). "Descifrado práctico exFiltration: Breaking PDF Encryption". Actas de la Conferencia ACM SIGSAC de 2019 sobre seguridad informática y de las comunicaciones . CCS '19. Biblioteca digital ACM, Conferencia ACM SIGSAC sobre seguridad informática y de las comunicaciones. págs. 15–29. doi :10.1145/3319535.3354214. ISBN 9781450367479. S2CID 207959243. Archivado desde el original el 26 de abril de 2021 . Consultado el 6 de abril de 2021 .
^ "Ataques ocultos: ocultar y reemplazar contenido en archivos PDF firmados". Internet Society, Simposio sobre seguridad de redes y sistemas distribuidos. Archivado desde el original el 21 de abril de 2021. Consultado el 6 de abril de 2021 .
^ "Procesamiento de rutas peligrosas: sobre seguridad y privacidad del formato de documento portátil". Internet Society, Simposio sobre seguridad de redes y sistemas distribuidos. Archivado desde el original el 21 de abril de 2021. Consultado el 6 de abril de 2021 .
^ "Fallos de documentos portátiles 101". Blackhat. Archivado desde el original el 9 de abril de 2021. Consultado el 6 de abril de 2021 .
^ "¿Los archivos PDF pueden tener virus? Mantenga sus archivos seguros". Adobe. Archivado desde el original el 4 de octubre de 2023. Consultado el 3 de octubre de 2023 .
^ Foros de Adobe, Anuncio: Virus de archivos adjuntos PDF "Peachy" Archivado el 4 de septiembre de 2015 en Wayback Machine , 15 de agosto de 2001.
^ "Boletines y avisos de seguridad". Adobe Systems Inc. 10 de enero de 2023. Archivado desde el original el 6 de abril de 2010. Consultado el 12 de enero de 2023 .
^ Gibson, Steve; Laporte, Leo (12 de marzo de 2009). «Steve Gibson – SecurityNow Podcast». Archivado desde el original el 8 de mayo de 2020. Consultado el 11 de enero de 2011 .
^ "Los archivos PDF maliciosos ejecutan código sin vulnerabilidad". PCMAG . Archivado desde el original el 4 de abril de 2010.
^ Pathak, Khamosh (7 de octubre de 2017). «Cómo crear un PDF a partir de una página web en iPhone y iPad con iOS 11». iJunkie . Archivado desde el original el 12 de enero de 2023. Consultado el 12 de enero de 2023 .
^ "Descripción de 2007 Microsoft Office Suite Service Pack 2 (SP2)". Microsoft . Archivado desde el original el 29 de abril de 2009 . Consultado el 12 de enero de 2023 .
^ El 2 de abril de 2014, una nota fechada el 10 de febrero de 2009 hacía referencia a Current FSF High Priority Free Software Projects Archived August 10, 2007, at the Wayback Machine como fuente. Sin embargo, el contenido de esta última página cambia con el tiempo.
^ "Objetivos y motivaciones". gnupdf.org . GNUpdf. 28 de noviembre de 2007. Archivado desde el original el 4 de julio de 2014 . Consultado el 2 de abril de 2014 .{{cite web}}: CS1 maint: URL no apta ( enlace )
^ Lee, Matt (6 de octubre de 2011). "El proyecto GNU PDF abandona la lista de proyectos de alta prioridad de la FSF; ¡misión cumplida!". fsf.org . Free Software Foundation. Archivado desde el original el 28 de diciembre de 2014.
^ "Página de inicio de Poppler". Archivado desde el original el 8 de enero de 2015. Consultado el 12 de enero de 2023. Poppler es una biblioteca de renderizado de PDF basada en el código base xpdf-3.0 .
^ "Licencia Xpdf". Archivado desde el original el 14 de abril de 2013. Consultado el 12 de enero de 2023. Xpdf tiene licencia GNU General Public License (GPL), versión 2 o 3.
^ "El proyecto Apache PDFBox: lanzamiento de Apache PDFBox 3.0.0". 17 de agosto de 2023. Archivado desde el original el 7 de enero de 2023.Actualizado para nuevos lanzamientos.
^ "Adobe PDF Print Engine". Adobe Systems Inc. Archivado desde el original el 22 de agosto de 2013. Consultado el 20 de agosto de 2014 .
^ "Jaws® 3.0 PDF and PostScript RIP SDK". globalgraphics.com . Archivado desde el original el 5 de marzo de 2016. Consultado el 26 de noviembre de 2010 .
^ "Harlequin MultiRIP". Archivado desde el original el 9 de febrero de 2014 . Consultado el 2 de marzo de 2014 .
^ "Archivos PDF listos para imprimir". Archivado desde el original el 5 de febrero de 2009. Consultado el 12 de enero de 2023. Para cualquier persona interesada en tener su proyecto gráfico impreso comercialmente directamente desde archivos digitales o PDF .{{cite web}}: CS1 maint: URL no apta ( enlace )
^ "PDF como formato estándar de trabajos de impresión". The Linux Foundation . Linux Foundation . 23 de octubre de 2009. Archivado desde el original el 14 de noviembre de 2009 . Consultado el 12 de enero de 2023 .
^ Meuschke, Norman; Jagdale, Apurva; Spinde, Timo; Mitrović, Jelena; Gipp, Bela (2023), Sserwanga, Isaac; Goulding, Anne; Moulaison-Sandy, Heather; Du, Jia Tina (eds.), "Un punto de referencia de las herramientas de extracción de información PDF utilizando un marco de evaluación multitarea y multidominio para documentos académicos", Información para un mundo mejor: normalidad, virtualidad, fisicalidad, inclusión , vol. 13972, Cham: Springer Nature Switzerland, págs. 383–405, arXiv : 2303.09957 , doi :10.1007/978-3-031-28032-0_31, ISBN 978-3-031-28031-3

Lectura adicional

Hardy, MRB; Brailsford, DF (2002). "Mapeo y visualización de transformaciones estructurales entre XML y PDF" (PDF) . Actas del simposio ACM de 2002 sobre ingeniería de documentos – DocEng '02 . págs. 95–102. doi :10.1145/585058.585077. ISBN. 1-58113-594-7. S2CID 9371237. Archivado desde el original (PDF) el 24 de marzo de 2017.^{[ ¿importante? ]}
PDF 2.0 «ISO 32000-2:2020(en), Gestión de documentos — Formato de documento portátil — Parte 2: PDF 2.0». Organización Internacional de Normalización . Consultado el 16 de diciembre de 2020 .
PDF 2.0 «ISO 32000-2:2017(en), Gestión de documentos — Formato de documento portátil — Parte 2: PDF 2.0». Organización Internacional de Normalización . 3 de agosto de 2017 . Consultado el 31 de enero de 2019 .
PDF 1.7 (ISO 32000-1:2008)
PDF 1.7 y erratas de la versión 1.7 en Wayback Machine (archivado el 6 de marzo de 2022)
PDF 1.6 ( ISBN 0-321-30474-8 ) y erratas de 1.6 en Wayback Machine (archivado el 6 de marzo de 2022)
PDF 1.5 y erratas de 1.5 en Wayback Machine (archivado el 22 de diciembre de 2021)
PDF 1.4 ( ISBN 0-201-75839-3 ) y erratas de 1.4 en Wayback Machine (archivado el 6 de marzo de 2022)
PDF 1.3 ( ISBN 0-201-61588-6 ) y erratas de 1.3 en Wayback Machine (archivado el 6 de marzo de 2022)
PDF 1.2
PDF 1.0 ( ISBN 0-201-62628-4 )

Enlaces externos

Wikimedia Commons tiene medios relacionados con Formato de documento portátil .

PDF Association: La PDF Association es la asociación industrial para desarrolladores de software que producen o procesan archivos PDF.
- Índice de especificaciones PDF en la PDF Association
Adobe PDF 101: Resumen de PDF en Wayback Machine (archivado el 7 de octubre de 2010)
Adobe: PostScript vs. PDF en Wayback Machine (archivado el 13 de abril de 2016): comparación introductoria oficial de PS, EPS vs. PDF.
Estándares PDF... transición de la especificación PDF de un estándar de facto a un estándar de iure en Wayback Machine (archivado el 24 de abril de 2011) – Información sobre las especificaciones PDF/E y PDF/UA para formatos de archivo de documentos accesibles
PDF/A-1 Norma ISO publicada por la Organización Internacional de Normalización (con correcciones)
Referencia de PDF y extensiones de Adobe para la especificación de PDF en Wayback Machine (archivado el 16 de enero de 2021)
Formato de documento portátil: Introducción para programadores: Introducción a PDF vs. PostScript y aspectos internos de PDF (hasta v1.3)
El artículo de Camelot en Wayback Machine (archivado el 22 de abril de 2019): el artículo en el que John Warnock describió el proyecto que creó PDF
Todo lo que quería saber sobre PDF pero tenía miedo de preguntar en Wayback Machine (archivado el 18 de enero de 2016): grabación de una charla de Leonard Rosenthol (45 minutos) ( Adobe Systems ) en TUG 2007