Procesamiento de documentos

El procesamiento de documentos es un campo de investigación y un conjunto de procesos de producción destinados a convertir un documento analógico en digital. El procesamiento de documentos no tiene como objetivo simplemente fotografiar o escanear un documento para obtener una imagen digital , sino también hacerlo digitalmente inteligible. Esto incluye extraer la estructura del documento o el diseño y luego el contenido, que puede tomar forma de texto o imágenes. El proceso puede involucrar algoritmos tradicionales de visión por computadora , redes neuronales convolucionales o trabajo manual. Los problemas abordados están relacionados con la segmentación semántica , la detección de objetos , el reconocimiento óptico de caracteres (OCR) , el reconocimiento de texto escrito a mano (HTR) y, más ampliamente, la transcripción , ya sea automática o no. ^[1] El término también puede incluir la fase de digitalización del documento utilizando un escáner y la fase de interpretación del documento, por ejemplo utilizando procesamiento del lenguaje natural (NLP) o tecnologías de clasificación de imágenes . Se aplica en muchos campos industriales y científicos para la optimización de procesos administrativos, procesamiento de correo y digitalización de archivos analógicos y documentos históricos.

Fondo

Inicialmente, el procesamiento de documentos era, y hasta cierto punto sigue siendo, una especie de trabajo en línea de producción que se ocupaba del tratamiento de documentos , como cartas y paquetes, con el objetivo de clasificar, extraer o extraer datos en masa. Este trabajo podría realizarse internamente o mediante subcontratación de procesos comerciales . ^[2]^[3] De hecho, el procesamiento de documentos puede implicar algún tipo de trabajo manual externalizado, como el turco mecánico .

Como ejemplo de procesamiento manual de documentos, relativamente reciente en 2007, ^[4] el procesamiento de documentos para "millones de solicitudes de visa y ciudadanía" implicaba el uso de "aproximadamente 1.000 trabajadores subcontratados" que trabajaban para "administrar la sala de correo y la entrada de datos ".

Si bien el procesamiento de documentos implicaba la entrada de datos a través del teclado mucho antes del uso de un mouse o un escáner de computadora , un artículo de 1990 en The New York Times sobre lo que llamó la " oficina sin papel " afirmaba que "el procesamiento de documentos comienza con el escáner". ^[5] En este contexto, un ex vicepresidente de Xerox , Paul Strassman, expresó una opinión crítica, afirmando que los ordenadores añaden, en lugar de reducir, el volumen de papel en una oficina. ^[5] Se decía que los documentos de ingeniería y mantenimiento de un avión pesan "más que el propio avión" ^{[ cita requerida ]} .

Procesamiento automático de documentos

A medida que avanzó el estado de la técnica , el procesamiento de documentos pasó a manejar "componentes de documentos... como entidades de bases de datos". ^[6]

Una tecnología llamada procesamiento automático de documentos o, a veces, procesamiento inteligente de documentos (ID), surgió como una forma específica de automatización inteligente de procesos ( IPA ), que combina inteligencia artificial como el aprendizaje automático (ML), el procesamiento del lenguaje natural (NLP) o el reconocimiento inteligente de caracteres (ICE). ) para extraer datos de varios tipos de documentos. ^[7]^[8]

Aplicaciones

El procesamiento automático de documentos se aplica a una amplia gama de documentos, ya sean estructurados o no. Por ejemplo, en el mundo de los negocios y las finanzas, se pueden utilizar tecnologías para procesar facturas, formularios, órdenes de compra, contratos y billetes en papel. ^[9] Las instituciones financieras utilizan el procesamiento inteligente de documentos para procesar grandes volúmenes de formularios, como formularios reglamentarios o documentos de préstamos. ID utiliza IA para extraer y clasificar datos de documentos, reemplazando la entrada manual de datos. ^[10]

En medicina, se han desarrollado métodos de procesamiento de documentos para facilitar el seguimiento de los pacientes y agilizar los procedimientos administrativos, en particular mediante la digitalización de informes médicos o de análisis de laboratorio. El objetivo también es estandarizar las bases de datos médicas. ^[11] Los algoritmos también se utilizan directamente para ayudar a los médicos en el diagnóstico médico, por ejemplo, mediante el análisis de imágenes de resonancia magnética , ^[12]^[13] o imágenes microscópicas . ^[14]

El procesamiento de documentos también es muy utilizado en humanidades y humanidades digitales , con el fin de extraer big data históricos de archivos o colecciones patrimoniales. Se desarrollaron enfoques específicos para diversas fuentes, incluidos documentos textuales, como hemerotecas, ^[15] pero también imágenes, ^[16] o mapas. ^[17]^[18]

Tecnologías

Si, a partir de la década de 1980, los algoritmos tradicionales de visión por computadora se utilizaron ampliamente para resolver problemas de procesamiento de documentos, ^[19]^[20] estos han sido reemplazados gradualmente por tecnologías de redes neuronales en la década de 2010. ^[21] Sin embargo, en algunos sectores todavía se utilizan tecnologías tradicionales de visión por computadora, a veces junto con redes neuronales.

Muchas tecnologías apoyan el desarrollo del procesamiento de documentos, en particular el reconocimiento óptico de caracteres (OCR) y el reconocimiento de texto escrito a mano (HTR), que permiten la transcripción automática del texto. Los segmentos de texto como tales se identifican mediante algoritmos de detección de instancias u objetos , que en ocasiones también pueden utilizarse para detectar la estructura del documento. La resolución de este último problema a veces también utiliza algoritmos de segmentación semántica .

Estas tecnologías suelen formar el núcleo del procesamiento de documentos. Sin embargo, otros algoritmos pueden intervenir antes o después de estos procesos. De hecho, también intervienen tecnologías de digitalización de documentos , ya sea en forma de escaneo clásico o tridimensional. ^[22] La digitalización de documentos 3D puede recurrir, en particular, a derivados de la fotogrametría . En ocasiones, también es necesario desarrollar escáneres 2D específicos para adaptarse al tamaño de los documentos o por motivos de ergonomía de escaneo. ^[16] El procesamiento de documentos también depende de la codificación digital de los documentos en un formato de archivo adecuado . Además, el procesamiento de bases de datos heterogéneas puede depender de tecnologías de clasificación de imágenes .

En el otro extremo de la cadena se encuentran varios algoritmos de finalización de imágenes, extrapolación o limpieza de datos. Para documentos textuales, la interpretación puede utilizar tecnologías de procesamiento del lenguaje natural (NLP).

Ver también

Referencias

^ Len Asprey; Michael Middleton (2003). Gestión integradora de contenidos y documentos: estrategias para explotar el conocimiento empresarial. Idea Group Inc (IGI). ISBN 9781591400554.
^ Vinod V. Sople (25 de mayo de 2009). Subcontratación de procesos comerciales: una cadena de suministro de conocimientos especializados. PHI Aprendizaje Pvt. Limitado. ISBN limitado 978-8120338159.
^ Mark Kobayashi-Hillary (5 de diciembre de 2005). Subcontratación a la India: la ventaja offshore. Medios de ciencia y negocios de Springer. ISBN 9783540247944.
^ Julia Preston (2 de diciembre de 2007). "El contratista de inmigración recorta los salarios". Los New York Times .
^ ab Lawrence M. Fisher (7 de julio de 1990). "El papel, una vez cancelado, mantiene un lugar en la oficina". Los New York Times .
^ Al joven; Dayle Woolstein; Jay Johnson (febrero de 1996). "Título desconocido". Revista Objeto . pag. 51.
^ "Procesamiento inteligente de documentos" (PDF) . Departamento de Informática – Universidad de Bari . 2005-04-07 . Consultado el 8 de septiembre de 2018 .
^ Floriana Esposito , Stefano Ferilli, Teresa MA Basile, Nicola Di Mauro (1 de abril de 2005). “Tramitación Inteligente de Documentos” en Actas. Octava Conferencia Internacional sobre Análisis y Reconocimiento de Documentos, Seúl, Corea del Sur, 2005 págs. 1100-1104. doi: 10.1109/ICDAR.2005.144. doi :10.1109/ICDAR.2005.144. S2CID 17302169.{{cite book}}: Mantenimiento CS1: varios nombres: lista de autores ( enlace )
^ EE. UU. activo US7873576B2, John E. Jones; William J. Jones y Frank M. Csultis, "Sistema de procesamiento de documentos financieros", publicado el 18 de enero de 2011, publicado el 18 de enero de 2011
^ Bridgewater, Adrián. "Appian agrega Google Cloud Intelligence a la combinación de automatización de código bajo". Forbes . Consultado el 21 de abril de 2021 .
^ Adamo, Francisco; Attivissimo, Filippo; Di Nisio, Attilio; Spadavecchia, Maurizio (febrero de 2015). "Un sistema automático de procesamiento de documentos para la extracción de datos médicos". Medición . 61 : 88–99. Código Bib : 2015Medidas...61...88A. doi :10.1016/j.medición.2014.10.032 . Consultado el 31 de enero de 2021 .
^ Changwan, Kim; Seong-Il, Lee; Won Joon, Cho (septiembre de 2020). "Evaluación volumétrica de la extrusión en desgarros de la raíz posterior del menisco medial mediante segmentación semiautomática en imágenes de resonancia magnética de 3 teslas". Ortopedia y Traumatología: Cirugía e Investigación . 101 (5): 963–968. doi :10.1016/j.rcot.2020.06.003. S2CID 225215597 . Consultado el 31 de enero de 2021 .
^ Despotovic, Ivana; Bart, Goossens; Wilfried, Philips (1 de marzo de 2015). "Segmentación por resonancia magnética del cerebro humano: desafíos, métodos y aplicaciones". Técnicas de Inteligencia Computacional en Medicina . 2015 : 963–968. doi : 10.1155/2015/450341 . PMC 4402572 . PMID 25945121.
^ Putzuá, Lorenzo; Caocci, Giovanni; Di Rubertoa, Cecilia (noviembre de 2014). "Clasificación de leucocitos para la detección de leucemia mediante técnicas de procesamiento de imágenes". Inteligencia artificial en medicina . 63 (3): 179-191. doi :10.1016/j.artmed.2014.09.002. hdl : 11584/94592 . PMID 25241903.
^ Ehrmann, Maud; Romanello, Mateo; Clemátide, Simón; Ströbel, Phillip; Barman, Raphaël (2020). "Recursos lingüísticos para periódicos históricos: la colección Impresso". Actas de la 12ª Conferencia de Evaluación y Recursos Lingüísticos . Marsella, Francia. págs. 958–968.
^ ab Seguin, Benoit; Costiner, Lisandra; di Lenardo, Isabella; Kaplan, Frédéric (1 de abril de 2018). "Nuevas técnicas para la digitalización de archivos fotográficos históricos de arte: el caso de la Fundación Cini de Venecia". Archivado del programa final y las actas de 2018 . Sociedad de Ciencia y Tecnología de la Imagen. págs. 1 a 5. doi :10.2352/issn.2168-3204.2018.1.0.2.
^ Ares Oliveira, Sofía; di Lenardo, Isabella; Tourenc, Bastien; Kaplan, Frédéric (11 de julio de 2019). Un enfoque de aprendizaje profundo para la Computación Catastral. Jornada de Humanidades Digitales. Utrecht, Países Bajos.
^ Petitpierre, Rémi (julio de 2020). Redes neuronales para la segmentación semántica de mapas históricos de ciudades: desempeño intercultural y el impacto de la diversidad figurativa (Maestría). arXiv : 2101.12478 . doi :10.13140/RG.2.2.10973.64484.
^ Fujisawa, H.; Nakano, Y.; Kurino, K. (julio de 1992). "Métodos de segmentación para el reconocimiento de caracteres: de la segmentación al análisis de la estructura del documento". Actas del IEEE . 80 (7): 1079–1092. doi : 10.1109/5.156471 . Consultado el 3 de febrero de 2021 .
^ Tang, Yuan Y.; Lee, Seong-Whan; Suen, Ching Y. (1996). "Procesamiento automático de documentos: una encuesta". Reconocimiento de patrones . 29 (12): 1931-1952. Código Bib : 1996PatRe..29.1931T. doi :10.1016/S0031-3203(96)00044-1 . Consultado el 3 de febrero de 2021 .
^ Ares Oliveira, Sofía; Seguin, Benoit; Kaplan, Frederic (5 a 8 de agosto de 2018). dhSegment: un enfoque genérico de aprendizaje profundo para la segmentación de documentos. 2018 16ª Conferencia Internacional sobre Fronteras en el Reconocimiento de Escritura (CIFDH). Cataratas del Niágara, Nueva York, Estados Unidos: IEEE. arXiv : 1804.10371 . doi :10.1109/CIFDH-2018.2018.00011.
^ "Tecnología de escaneo revolucionaria para el arte". Artmyn . Consultado el 3 de febrero de 2021 .