.doc (abreviatura de " documento ") es una extensión de nombre de archivo utilizada para documentos de procesamiento de texto almacenados en el formato de archivo binario Microsoft Word, propiedad de Microsoft ; fue el formato principal de Microsoft Word hasta que la versión de 2007 lo reemplazó con archivos Office Open XML . [4] Microsoft ha utilizado la extensión desde 1983. .docx
Los archivos DOC binarios a menudo contienen más información de formato de texto (así como scripts e información de deshacer) que otros formatos de archivos de documentos como Rich Text Format y Hypertext Markup Language , pero normalmente son menos compatibles .
Los archivos DOC creados con las versiones de Microsoft Word son diferentes. Las versiones de Microsoft Word anteriores a Word 97 ("8.0") utilizaban un formato diferente al de Microsoft Word 97 – 2003 basado en OLE y CFBF .
En Microsoft Word 2007 y versiones posteriores, el formato de archivo binario fue reemplazado como formato predeterminado por el formato Office Open XML , aunque Microsoft Word aún puede producir archivos DOC.
El formato DOC es nativo de Microsoft Word. Otros procesadores de texto , como OpenOffice.org Writer , IBM Lotus Symphony , Apple Pages y AbiWord , también pueden crear y leer archivos DOC, aunque con algunas limitaciones. Los programas de línea de comandos para sistemas operativos tipo Unix que pueden convertir archivos del formato DOC a texto sin formato u otros formatos estándar incluyen la biblioteca wv , que a su vez es utilizada directamente por AbiWord .
Debido a que el formato de archivo DOC fue una especificación cerrada durante muchos años, persiste un manejo inconsistente del formato y puede causar alguna pérdida de información de formato al manejar el mismo archivo con múltiples programas de procesamiento de texto. Algunas especificaciones para formatos de archivos binarios de Microsoft Office 97 se publicaron en 1997 bajo una licencia restrictiva, pero estas especificaciones se eliminaron de la descarga en línea en 1999. [5] [6] [7] [8] Las especificaciones de versiones posteriores de formatos de archivos binarios de Microsoft Office no estaban disponibles públicamente. La especificación de formato DOC estaba disponible de Microsoft a pedido [9] desde 2006 [10] bajo términos restrictivos de RAND-Z hasta febrero de 2008. Sun Microsystems y OpenOffice.org realizaron ingeniería inversa del formato de archivo. [11] El 15 de febrero de 2008, Microsoft lanzó una especificación de formato .DOC [4] [12] [13] bajo la Promesa de especificación abierta de Microsoft . [14] [15] Sin embargo, esta especificación no describe todas las características utilizadas por el formato DOC y el trabajo de ingeniería inversa sigue siendo necesario. [16] Desde 2008, la especificación se ha actualizado varias veces; el último cambio se realizó en mayo de 2022.
El formato utilizado en versiones anteriores de Word, anteriores a 1997 (de la "1.0" de 1989 a la "7.0" de 1995), es menos conocido, pero tanto OpenOffice como LibreOffice contienen código de fuente abierta para leer estos formatos. El formato probablemente esté relacionado con el formato "Stream" que se encuentra en versiones similares de Excel. [17] Word 95 también parece tener un formato encapsulado en OLE.
Algunas documentaciones históricas pueden utilizar la extensión de nombre de archivo DOC para archivos de texto sin formato, lo que indica documentación de software o hardware. La extensión de nombre de archivo DOC también fue utilizada durante la década de 1980 por WordPerfect para su formato propietario.
Los usuarios de Palm OS a veces utilizan DOC como abreviatura de PalmDoc, un formato no relacionado (que normalmente utiliza la extensión de nombre de archivo PDB) utilizado para codificar archivos de texto como libros electrónicos .