Type of text or binary file format
Un formato de archivo de documento es un formato de archivo de texto o binario para almacenar documentos en un medio de almacenamiento , especialmente para su uso en computadoras . Actualmente existen una multitud de formatos de archivos de documentos incompatibles.
Ejemplos de estándares abiertos basados en XML son DocBook , XHTML y, más recientemente, los estándares ISO / IEC OpenDocument (ISO 26300:2006) y Office Open XML (ISO 29500:2008).
En 1993, la UIT-T intentó establecer una norma para los formatos de archivos de documentos, conocida como Arquitectura de Documentos Abierta (ODA), que supuestamente reemplazaría a todos los formatos de archivos de documentos de la competencia. Se describe en los documentos UIT-T T.411 a T.421, que son equivalentes a la norma ISO 8613. No tuvo éxito.
Los lenguajes de descripción de páginas como PostScript y PDF se han convertido en el estándar de facto para documentos que un usuario típico solo debería poder crear y leer, no editar. En 2001, comenzaron a publicarse una serie de estándares ISO / IEC para PDF, incluida la especificación para PDF en sí, ISO-32000 .
HTML es el estándar internacional más utilizado y abierto, y también se utiliza como formato de archivo de documentos. También se ha convertido en estándar ISO / IEC (ISO 15445:2000).
El formato de archivo binario predeterminado utilizado por Microsoft Word ( .doc ) se ha convertido en un estándar de facto para los documentos de oficina, pero es un formato propietario y no siempre es totalmente compatible con otros procesadores de texto.
Formatos de archivos de documentos comunes
- ASCII , UTF-8 : codificaciones de texto sin formato . Con estos dos conjuntos de caracteres, se utilizan tres finales de línea diferentes: (a) LF: salto de línea, en UNIX y sistemas similares, (b) CRLF: retorno de carro, salto de línea en sistemas DOS y Windows, y (c) CR: retorno de carro en sistemas Macintosh más antiguos.
- Guía de Amiga
- .doc para Microsoft Word : formato binario estructural desarrollado por Microsoft (especificaciones disponibles desde 2008 bajo la Promesa de Especificación Abierta ) [1] [2]
- DjVu : formato de archivo diseñado principalmente para almacenar documentos escaneados [3]
- DocBook : un formato XML para documentación técnica
- HTML (.html, .htm), (estándar abierto, ISO a partir de 2000), en combinación con los posibles archivos de imagen a los que se hace referencia.
- FictionBook (.fb2): formato de libro electrónico abierto basado en XML
- Markdown (.md): lenguaje de marcado para crear texto formateado utilizando texto simple
- Office Open XML : .docx (estándar basado en XML para documentos de Office)
- OpenDocument — .odt (estándar basado en XML para documentos de oficina)
- OpenOffice.org XML — .sxw (formato abierto basado en XML para documentos de oficina)
- OXPS : especificación de papel XML abierto (Windows 8.1 y posteriores, la versión anterior es XPS utilizada en Windows 7)
- PalmDoc : formato de documentos para dispositivos portátiles
- .pages para Páginas
- PDF : estándar abierto para el intercambio de documentos. Los estándares ISO incluyen PDF/X (eXchange), PDF/A (Archive), PDF/E (Engineering), ISO 32000 (PDF), PDF/UA (Accesibility) y PDF/VT (Variable data and transactional printing). Los archivos PDF se pueden leer en casi todas las plataformas con lectores gratuitos o de código abierto. También hay disponibles creadores de archivos PDF de código abierto.
- PostScript — .ps
- Formato de texto enriquecido (RTF) : formato de metadatos desarrollado por Microsoft desde 1987 para productos de Microsoft e intercambio de documentos entre plataformas [4] [5] [6] [7] [8]
- Enlace simbólico (SYLK)
- Gráficos vectoriales escalables (SVG): formato de gráficos principalmente para imágenes basadas en vectores.
- TeX : programa y formato de composición tipográfica de código abierto. Primer lenguaje de notación matemática exitoso.
- TEI — Formato XML para publicación digital
- Trofeo
- Formato de oficina uniforme : estándar chino
- WordPerfect (.wpd, .wp, .wp7, .doc) (Nota: posible confusión con la extensión de formato Word)
Véase también
Referencias
- ^ "Formatos de archivos binarios (doc, xls, ppt) de Microsoft Office". Microsoft . 15 de febrero de 2008. Archivado desde el original el 8 de marzo de 2009. Consultado el 18 de marzo de 2010 .
- ^ Microsoft Corporation (23 de julio de 2010). «MS-DOC - Especificación de la estructura del formato de archivo binario (.doc) de Word» . Consultado el 8 de agosto de 2010 .
- ^ "¿Qué es DjVu? - DjVu.org". DjVu.org . Archivado desde el original el 21 de enero de 2019. Consultado el 5 de marzo de 2009 .
- ^ Microsoft Corporation (mayo de 1999). «Rich Text Format (RTF) Specification, version 1.6» (Especificación de formato de texto enriquecido, versión 1.6) . Consultado el 13 de marzo de 2010 .
- ^ "4.3 Formatos de archivos no HTML". Unidad de Gobierno Electrónico. Mayo de 2002. Archivado desde el original el 18 de febrero de 2010. Consultado el 13 de marzo de 2010 .
- ^ "RTF (.rtf)—Documentación del lenguaje Wolfram". reference.wolfram.com .
- ^ "WD: Especificación de formato de texto enriquecido (RTF) 1.7". support.microsoft.com .
- ^ Ranjan Parekh, Ranjan (2006). Principios de multimedia . Tata McGraw-Hill. pág. 87. ISBN 0-07-058833-3.
Enlaces externos
- Perdidos en la traducción: problemas de interoperabilidad para estándares abiertos: ODF y OOXML como ejemplos