stringtranslate.com

Doc (informática)

.doc (abreviatura de " documento ") es una extensión de nombre de archivo utilizada para documentos de procesamiento de texto almacenados en el formato de archivo binario Microsoft Word, propiedad de Microsoft ; fue el formato principal de Microsoft Word hasta que la versión de 2007 lo reemplazó con archivos Office Open XML . [4] Microsoft ha utilizado la extensión desde 1983. .docx

Formato de archivo binario de Microsoft Word

Los archivos DOC binarios a menudo contienen más información de formato de texto (así como scripts e información de deshacer) que otros formatos de archivos de documentos como Rich Text Format y Hypertext Markup Language , pero normalmente son menos compatibles .

Los archivos DOC creados con las versiones de Microsoft Word son diferentes. Las versiones de Microsoft Word anteriores a Word 97 ("8.0") utilizaban un formato diferente al de Microsoft Word 97 – 2003 basado en OLE y CFBF .

En Microsoft Word 2007 y versiones posteriores, el formato de archivo binario fue reemplazado como formato predeterminado por el formato Office Open XML , aunque Microsoft Word aún puede producir archivos DOC.

Soporte de aplicaciones

El formato DOC es nativo de Microsoft Word. Otros procesadores de texto , como OpenOffice.org Writer , IBM Lotus Symphony , Apple Pages y AbiWord , también pueden crear y leer archivos DOC, aunque con algunas limitaciones. Los programas de línea de comandos para sistemas operativos tipo Unix que pueden convertir archivos del formato DOC a texto sin formato u otros formatos estándar incluyen la biblioteca wv , que a su vez es utilizada directamente por AbiWord .

Especificación

Debido a que el formato de archivo DOC fue una especificación cerrada durante muchos años, persiste un manejo inconsistente del formato y puede causar alguna pérdida de información de formato al manejar el mismo archivo con múltiples programas de procesamiento de texto. Algunas especificaciones para formatos de archivos binarios de Microsoft Office 97 se publicaron en 1997 bajo una licencia restrictiva, pero estas especificaciones se eliminaron de la descarga en línea en 1999. [5] [6] [7] [8] Las especificaciones de versiones posteriores de formatos de archivos binarios de Microsoft Office no estaban disponibles públicamente. La especificación de formato DOC estaba disponible de Microsoft a pedido [9] desde 2006 [10] bajo términos restrictivos de RAND-Z hasta febrero de 2008. Sun Microsystems y OpenOffice.org realizaron ingeniería inversa del formato de archivo. [11] El 15 de febrero de 2008, Microsoft lanzó una especificación de formato .DOC [4] [12] [13] bajo la Promesa de especificación abierta de Microsoft . [14] [15] Sin embargo, esta especificación no describe todas las características utilizadas por el formato DOC y el trabajo de ingeniería inversa sigue siendo necesario. [16] Desde 2008, la especificación se ha actualizado varias veces; el último cambio se realizó en mayo de 2022.

El formato utilizado en versiones anteriores de Word, anteriores a 1997 (de la "1.0" de 1989 a la "7.0" de 1995), es menos conocido, pero tanto OpenOffice como LibreOffice contienen código de fuente abierta para leer estos formatos. El formato probablemente esté relacionado con el formato "Stream" que se encuentra en versiones similares de Excel. [17] Word 95 también parece tener un formato encapsulado en OLE.

Otros formatos de archivos

Algunas documentaciones históricas pueden utilizar la extensión de nombre de archivo DOC para archivos de texto sin formato, lo que indica documentación de software o hardware. La extensión de nombre de archivo DOC también fue utilizada durante la década de 1980 por WordPerfect para su formato propietario.

Los usuarios de Palm OS a veces utilizan DOC como abreviatura de PalmDoc, un formato no relacionado (que normalmente utiliza la extensión de nombre de archivo PDB) utilizado para codificar archivos de texto como libros electrónicos .

Véase también

Referencias

  1. ^ "Tipo/subtipo de contenido IME: aplicación/msword". IANA . 1993-07-22 . Consultado el 20 de junio de 2012 .
  2. ^ Referencia de identificadores de tipo uniforme (PDF) , Apple , consultado el 20 de junio de 2012
  3. ^ "Identificadores de tipo uniforme declarados por el sistema (Mac OS X v10.4)". Apple Developer Connection . Apple Inc. 8 de abril de 2008.
  4. ^ abc MS-DOC: formato de archivo binario de Word (.doc), 19 de noviembre de 2019 , consultado el 25 de febrero de 2020
  5. ^ "Comparación de ODF y OOXML" (PDF) . 2006. Archivado desde el original (pdf) el 28 de septiembre de 2011. Consultado el 23 de mayo de 2011 .
  6. ^ Cuidado con los geeks que traen regalos, 2006 , consultado el 23 de mayo de 2011
  7. ^ "Un convertidor de Word 8 para Unix" . Consultado el 23 de mayo de 2011 .
  8. ^ "Formato de archivo binario de Microsoft Word 97" . Consultado el 23 de mayo de 2011 .
  9. ^ "Especificaciones libres de regalías para formatos de archivos binarios de Microsoft Office" . Consultado el 23 de mayo de 2011 .
  10. ^ "Asignación de documentos en formato binario (.doc; .xls; .ppt) al formato Open XML". 16 de enero de 2008. Consultado el 23 de mayo de 2011 .
  11. ^ "Formato de documento compuesto de Microsoft" (PDF) . OpenOffice.org . 2007-08-07.
  12. ^ Formatos de archivo binarios de Microsoft Office (doc, xls, ppt), 15 de febrero de 2008, archivado desde el original el 18 de febrero de 2008
  13. ^ "Especificación del formato de archivo binario de Microsoft Office Word 97 - 2007 (*.doc)" (PDF) . Microsoft Corporation . 2008.
  14. ^ "Promesa de especificación abierta de Microsoft". Microsoft Corporation . 23 de marzo de 2009.
  15. ^ "Cómo extraer información de archivos de Office mediante formatos y esquemas de archivos de Office" . Consultado el 23 de mayo de 2011 .
  16. ^ Joel Spolsky. "¿Por qué son tan complicados los formatos de archivos de Microsoft Office? (Y algunas soluciones alternativas)". Archivado desde el original el 14 de octubre de 2013. Consultado el 23 de mayo de 2011 .
  17. ^ "LibreOffice/core". GitHub .

Enlaces externos