stringtranslate.com

Doc (informática)

.doc (una abreviatura de " documento ") es una extensión de nombre de archivo utilizada para documentos de procesamiento de textos almacenados en el formato de archivo binario Microsoft Word, propiedad de Microsoft ; Era el formato principal de Microsoft Word hasta que la versión 2007 lo reemplazó con archivos Office Open XML . [4] Microsoft ha utilizado la extensión desde 1983. .docx

Formato de archivo binario de Microsoft Word

Los archivos DOC binarios a menudo contienen más información de formato de texto (así como scripts e información de deshacer) que otros formatos de archivos de documentos como el formato de texto enriquecido y el lenguaje de marcado de hipertexto , pero generalmente son menos compatibles .

Los archivos DOC creados con las versiones de Microsoft Word difieren. Las versiones de Microsoft Word anteriores a Word 97 ("8.0") usaban un formato diferente al de Microsoft Word 97 – 2003, basado en OLE y CFBF .

En Microsoft Word 2007 y posteriores, el formato de archivo binario fue reemplazado como formato predeterminado por el formato Office Open XML , aunque Microsoft Word aún puede producir archivos DOC.

Soporte de aplicaciones

El formato DOC es nativo de Microsoft Word. Otros procesadores de texto , como OpenOffice.org Writer , IBM Lotus Symphony , Apple Pages y AbiWord , también pueden crear y leer archivos DOC, aunque con algunas limitaciones. Los programas de línea de comandos para sistemas operativos tipo Unix que pueden convertir archivos del formato DOC a texto sin formato u otros formatos estándar incluyen la biblioteca wv , que a su vez es utilizada directamente por AbiWord .

Especificación

Debido a que el formato de archivo DOC fue una especificación cerrada durante muchos años, el manejo inconsistente del formato persiste y puede causar cierta pérdida de información de formato al manejar el mismo archivo con múltiples programas de procesamiento de texto. Algunas especificaciones para los formatos de archivos binarios de Microsoft Office 97 se publicaron en 1997 bajo una licencia restrictiva, pero estas especificaciones se eliminaron de la descarga en línea en 1999. [5] [6] [7] [8] Especificaciones de versiones posteriores del archivo binario de Microsoft Office Los formatos no estaban disponibles públicamente. La especificación del formato DOC estuvo disponible en Microsoft previa solicitud [9] desde 2006 [10] bajo términos restrictivos RAND-Z hasta febrero de 2008. Sun Microsystems y OpenOffice.org realizaron ingeniería inversa al formato de archivo. [11] El 15 de febrero de 2008, Microsoft publicó una especificación de formato .DOC [4] [12] [13] bajo la Promesa de especificación abierta de Microsoft . [14] [15] Sin embargo, esta especificación no describe todas las características utilizadas por el formato DOC y el trabajo de ingeniería inversa sigue siendo necesario. [16] Desde 2008, la especificación se ha actualizado varias veces; el último cambio se realizó en mayo de 2022.

El formato utilizado en versiones anteriores de Word anteriores a 97 ("1.0" 1989 a "7.0" 1995) es menos conocido, pero tanto OpenOffice como LibreOffice contienen código fuente abierto para leer estos formatos. El formato probablemente esté relacionado con el formato "Stream" que se encuentra en versiones similares de Excel. [17] Word 95 también parece tener un formato envuelto en OLE.

Otros formatos de archivo

Algunas documentaciones históricas pueden usar la extensión de nombre de archivo DOC para archivos de texto sin formato, lo que indica documentación para software o hardware. La extensión de nombre de archivo DOC también fue utilizada durante la década de 1980 por WordPerfect para su formato propietario.

Los usuarios de Palm OS a veces utilizan DOC como abreviatura de PalmDoc, un formato no relacionado (que comúnmente usa la extensión de nombre de archivo PDB) que se usa para codificar archivos de texto como libros electrónicos .

Ver también

Referencias

  1. ^ "Tipo/subtipo de contenido IME: aplicación/msword". IANA . 1993-07-22 . Consultado el 20 de junio de 2012 .
  2. ^ Referencia de identificadores de tipo uniforme (PDF) , Apple , consultado el 20 de junio de 2012
  3. ^ "Identificadores de tipo uniforme declarados por el sistema (Mac OS X v10.4)". Conexión de desarrollador de Apple . Apple Inc. 2008-04-08.
  4. ^ abc MS-DOC: formato de archivo binario de Word (.doc), 2019-11-19 , consultado el 25 de febrero de 2020
  5. ^ "Comparación ODF y OOXML" (PDF) . 2006. Archivado desde el original (pdf) el 28 de septiembre de 2011 . Consultado el 23 de mayo de 2011 .
  6. ^ Cuidado con los geeks que llevan regalos, 2006 , consultado el 23 de mayo de 2011
  7. ^ "Un conversor de Word 8 para Unix" . Consultado el 23 de mayo de 2011 .
  8. ^ "Formato de archivo binario de Microsoft Word 97" . Consultado el 23 de mayo de 2011 .
  9. ^ "Especificaciones libres de derechos para formatos de archivos binarios de Microsoft Office" . Consultado el 23 de mayo de 2011 .
  10. ^ "Asignación de documentos en formato binario (.doc; .xls; .ppt) al formato Open XML". 2008-01-16 . Consultado el 23 de mayo de 2011 .
  11. ^ "Formato de documento compuesto de Microsoft" (PDF) . OpenOffice.org . 2007-08-07.
  12. ^ Formatos de archivo binarios de Microsoft Office (doc, xls, ppt), 2008-02-15, archivado desde el original el 2008-02-18
  13. ^ "Microsoft Office Word 97 - Especificación de formato de archivo binario 2007 (*.doc)" (PDF) . Corporación Microsoft . 2008.
  14. ^ "Promesa de especificación abierta de Microsoft". Corporación Microsoft . 23 de marzo de 2009.
  15. ^ "Cómo extraer información de archivos de Office mediante esquemas y formatos de archivos de Office" . Consultado el 23 de mayo de 2011 .
  16. ^ Joel Spolsky. "¿Por qué los formatos de archivo de Microsoft Office son tan complicados? (Y algunas soluciones)". Archivado desde el original el 14 de octubre de 2013 . Consultado el 23 de mayo de 2011 .
  17. ^ "LibreOffice/núcleo". GitHub .

enlaces externos