Reconocimiento inteligente de caracteres

El reconocimiento inteligente de caracteres ( ICR ) se utiliza para extraer texto escrito a mano de imágenes. Es un tipo más sofisticado de tecnología OCR que reconoce diferentes estilos de escritura a mano y fuentes para interpretar de manera inteligente datos en formularios y documentos físicos. ^[1]

Estos documentos en papel se escanean, se extrae la información y luego los datos se almacenan digitalmente en un programa de base de datos que utiliza tecnología ICR. Los datos se utilizan para informes analíticos y se integran con los procesos comerciales. Las empresas utilizan la tecnología ICR para organizar datos no estructurados y obtener información actual de estos informes. Los usuarios pueden leer rápidamente datos escritos a mano en papel utilizando ICR y luego convertirlos a formato digital. Los algoritmos ICR colaboran con OCR para automatizar la entrada de datos desde formularios eliminando la necesidad de pulsar teclas. Tiene un alto grado de precisión y es un método confiable para procesar varios papeles rápidamente. ^[1]

Capacidades

La mayoría del software ICR tiene un sistema de autoaprendizaje denominado red neuronal , que actualiza automáticamente la base de datos de reconocimiento para nuevos patrones de escritura a mano. Amplía la utilidad de los dispositivos de escaneo para el procesamiento de documentos, desde el reconocimiento de caracteres impresos (una función de OCR) hasta el reconocimiento de textos escritos a mano. Debido a que este proceso está involucrado en el reconocimiento de la escritura a mano, los niveles de precisión pueden, en algunas circunstancias, no ser muy buenos, pero pueden alcanzar tasas de precisión superiores al 97 % en la lectura de escritura a mano en formas estructuradas. A menudo, para lograr estas altas tasas de reconocimiento, se utilizan varios motores de lectura dentro del software y a cada uno se le otorgan derechos de voto electivos para determinar la verdadera lectura de los caracteres. En los campos numéricos, los motores diseñados para leer números tienen preferencia, mientras que en los campos alfa, los motores diseñados para leer letras escritas a mano tienen mayores derechos de elección. Cuando se utiliza junto con un centro de interfaz personalizado, los datos escritos a mano se pueden ingresar automáticamente en un sistema administrativo evitando la laboriosa introducción manual y pueden ser más precisos que la entrada de datos humana tradicional.

Procesamiento automatizado de formularios

Un avance importante de ICR fue la invención del procesamiento automatizado de formularios en 1993 por Joseph Corcoran, a quien se le otorgó una patente sobre la invención. Esto implicó un proceso de tres etapas: capturar la imagen del formulario que ICR procesará y prepararla para permitir que el motor ICR brinde los mejores resultados, luego capturar la información usando el motor ICR y finalmente procesar los resultados para validar automáticamente la salida. del motor ICR.

Esta aplicación de ICR aumentó la utilidad de la tecnología y la hizo aplicable para su uso con formularios del mundo real en aplicaciones comerciales normales. Las aplicaciones de software modernas utilizan ICR como tecnología para reconocer texto en formularios completados a mano (impresos a mano).

Diferencias entre ICR y OCR

LOC

Se considera comúnmente que el reconocimiento óptico de caracteres (OCR) se aplica a cualquier técnica de reconocimiento que lea texto impreso por máquina. Un ejemplo de un caso de uso tradicional de OCR sería traducir los caracteres de una imagen de un documento impreso, como la página de un libro, un recorte de periódico o un contrato legal, en un archivo separado que podría buscarse y actualizarse con un procesador de texto o visor de documentos. También es muy útil para automatizar el procesamiento de formularios. La información se puede extraer rápidamente de los campos del formulario e ingresarla en otra aplicación, como una hoja de cálculo o una base de datos, aplicando zonalmente el motor OCR a esos campos.

Sin embargo, los datos normalmente se ingresan manualmente en lugar de escribirse en los campos del formulario. La identificación de personajes se vuelve aún más desafiante al leer material escrito a mano. La diversidad de más de 700.000 variantes de fuentes impresas es pequeña en comparación con las variaciones casi ilimitadas de los caracteres impresos a mano. El programa de reconocimiento debe tener en cuenta no sólo las diferencias estilísticas, sino también el tipo de instrumento de escritura utilizado, la calidad del papel, los errores, la estabilidad de la mano y las manchas o la tinta corrida. ^[2]

ICR

El reconocimiento inteligente de caracteres (ICR) utiliza algoritmos que mejoran continuamente para recopilar más información sobre las variaciones en los caracteres impresos a mano e identificarlos con mayor precisión. ICR, que se creó a principios de la década de 1990 para ayudar en la automatización del procesamiento de formularios, permite la conversión de datos ingresados manualmente en texto que es fácil de leer, buscar y cambiar. Cuando se utiliza para leer caracteres que obviamente están divididos en áreas o zonas distintas, como los campos fijos que se ven en muchos formularios estructurados, funciona mejor. ^[2]

Tanto OCR como ICR se pueden configurar para leer una variedad de idiomas; sin embargo, limitar el conjunto de caracteres esperado a un número menor de idiomas producirá mejores resultados de reconocimiento. ICR no puede leer escritura a mano en cursiva ya que aún debe poder evaluar cada carácter individualmente. Al escribir en cursiva, puede resultar difícil saber dónde termina un carácter y comienza otro, y hay más diferencias entre las muestras que cuando se imprime texto a mano. Un método más reciente llamado reconocimiento inteligente de palabras (IWR) se centra en leer una palabra en contexto en lugar de reconocer caracteres individuales. ^[2]

Reconocimiento inteligente de palabras

El reconocimiento inteligente de palabras (IWR) puede reconocer y extraer no solo información escrita a mano, sino también escritura cursiva. ICR reconoce a nivel de carácter, mientras que IWR trabaja con palabras o frases completas. Capaz de capturar información no estructurada de páginas cotidianas, se dice que IWR está más evolucionado que ICR impreso a mano. ^{[ cita necesaria ]}

IWR no pretende reemplazar los sistemas ICR y OCR convencionales, sino que está optimizado para procesar documentos del mundo real que contienen en su mayoría campos de datos de formato libre y difíciles de reconocer que son inherentemente inadecuados para ICR. Esto significa que el mayor y mejor uso de IWR es eliminar un alto porcentaje de la entrada manual de datos escritos a mano y campos de impresión manual en documentos que de otro modo solo podrían ser ingresados por humanos.

Ver también

Lista de referencias

^ ab "¿Qué es el reconocimiento inteligente de caracteres? Una introducción al OCR inteligente". www.docsumo.com . Consultado el 19 de marzo de 2023 .
^ abc "OCR vs ICR: ¿Cuál es la diferencia?". Accusoft . Consultado el 19 de marzo de 2023 .