stringtranslate.com

Documento legible por máquina

Un documento legible por máquina es un documento cuyo contenido puede ser procesado fácilmente por computadoras . Dichos documentos se distinguen de los datos legibles por máquina más generales en virtud de que tienen una estructura adicional para proporcionar el contexto necesario para respaldar los procesos comerciales para los que fueron creados.

Definición

Los datos sin contexto no tienen sentido y carecen de las cuatro características esenciales de los registros comerciales confiables especificadas en la norma ISO 15489 Información y documentación – Gestión de registros : [1]

La gran mayoría de la información son datos no estructurados y, desde una perspectiva empresarial, eso significa que son "inmaduros", es decir, de nivel 1 (caótico) del modelo de madurez de capacidades . Esta inmadurez fomenta la ineficiencia, disminuye la calidad y limita la eficacia. La información no estructurada tampoco es adecuada para las funciones de gestión de registros , proporciona pruebas inadecuadas para fines legales, aumenta el costo del descubrimiento en litigios y hace que el acceso y el uso sean innecesariamente engorrosos en los procesos comerciales rutinarios y continuos .

Hay al menos cuatro aspectos de la legibilidad por máquina:

Ya en 1983, la Oficina de Responsabilidad Gubernamental (GAO) de los Estados Unidos comenzó a enfatizar los beneficios de la información legible por máquinas. [2] Incluso antes, en 1981, la GAO comenzó a informar sobre el problema de las prácticas inadecuadas de mantenimiento de registros en el gobierno federal de los Estados Unidos . [3] Tales deficiencias no son exclusivas del gobierno y los avances en la tecnología de la información significan que la mayoría de la información ahora "nace digital" y, por lo tanto, potencialmente mucho más fácil de administrar por medios automatizados. [4] Sin embargo, en su testimonio ante el Congreso en 2010, la GAO destacó los problemas con la gestión de registros electrónicos y, tan recientemente como en 2015, la GAO ha seguido informando sobre las deficiencias en el desempeño de las agencias del Poder Ejecutivo en el cumplimiento de los requisitos de gestión de registros. [5] [6] Además, más de dos décadas después de que una importante y anteriormente muy respetada firma de auditoría, Arthur Andersen , se encontrara con su desaparición debido a un escándalo de destrucción de registros, las prácticas de mantenimiento de registros se convirtieron en un tema central en las elecciones presidenciales de 2016.

El 4 de enero de 2011, el presidente Obama firmó la HR 2142, la Ley de Modernización de la Ley de Desempeño y Resultados del Gobierno (GPRA) de 2010 (GPRAMA), como ley PL 111-352. La sección 10 de la GPRAMA requiere que las agencias federales de los EE. UU. publiquen sus planes e informes estratégicos y de desempeño en un formato que se pueda buscar y leer por máquina. [7] Además, en 2013, emitió la Orden Ejecutiva 13642, que hace que la información abierta y legible por máquina sea la nueva opción predeterminada para la información gubernamental en general. [8] El 28 de julio de 2016, la Oficina de Administración y Presupuesto (OMB) hizo un seguimiento al incluir en la emisión revisada de la Circular A-130 la instrucción para que las agencias usen formatos abiertos y legibles por máquina, [9] y publiquen "información pública en línea de una manera que promueva el análisis y la reutilización para la gama más amplia posible de propósitos", [10] lo que significa que la información es tanto de acceso público como legible por máquina. El 14 de enero de 2019, el presidente Trump promulgó la ley HR 4174, [11] la Ley de Datos Gubernamentales Abiertos (OGDA), que codifica en la ley el requisito de que las agencias pongan a disposición sus activos de datos públicos en formato legible por máquina. El 28 de junio de 2019, en la Circular A-11, [12] la OMB expresó su intención de comenzar a cumplir con la sección 10 de GPRAMA. [13]

En apoyo de esta orientación política, el avance tecnológico está permitiendo una gestión y un uso más eficientes y eficaces de los registros electrónicos legibles por máquina. Se han desarrollado bases de datos orientadas a documentos para almacenar, recuperar y gestionar información orientada a documentos, también conocida como datos semiestructurados. El lenguaje de marcado extensible ( XML ) es una recomendación del Consorcio World Wide Web ( W3C ) que establece reglas para codificar documentos en un formato que sea legible tanto para humanos como para máquinas. Se han desarrollado muchas herramientas de edición de XML y la mayoría de las principales aplicaciones de tecnología de la información, si no todas, admiten XML en mayor o menor grado. El hecho de que XML en sí sea un formato abierto, estándar y legible por máquina hace que sea relativamente fácil para los desarrolladores de aplicaciones hacerlo.

La Recomendación de esquema XML ( XSD ) del W3C especifica cómo describir formalmente los elementos de un documento XML. Con respecto a la especificación de esquemas XML, la Organización para el Avance de Estándares de Información Estructurada (OASIS) es una organización líder en el desarrollo de estándares . Sin embargo, muchos desarrolladores técnicos prefieren trabajar con JSON y, para definir la estructura de los datos JSON para la validación, documentación y control de la interacción, el esquema JSON [ broken anchor ] fue desarrollado por el Grupo de Trabajo de Ingeniería de Internet (IETF).

El formato de documento portátil (PDF) es un formato de archivo que se utiliza para presentar documentos de una manera independiente del software de aplicación, el hardware y los sistemas operativos. Cada archivo PDF encapsula una descripción completa de la presentación del documento, incluidos el texto, las fuentes, los gráficos y otra información necesaria para mostrarlo. PDF/A es una versión estandarizada por la ISO del PDF especializada para su uso en el archivado y la conservación a largo plazo de documentos electrónicos. PDF/A-3 permite la incrustación de otros formatos de archivo, incluido XML , en documentos compatibles con PDF/A , lo que potencialmente proporciona lo mejor de la legibilidad tanto para humanos como para máquinas. El lenguaje de marcado XSL-FO (XSL Formatting Objects) del W3C se utiliza comúnmente para generar archivos PDF.

Los metadatos , datos sobre datos, se pueden utilizar para organizar recursos electrónicos, proporcionar identificación digital y respaldar el archivo y la conservación de recursos. En registros electrónicos bien estructurados y legibles por máquina, el contenido se puede reutilizar como datos y metadatos. En el contexto de los sistemas de mantenimiento de registros electrónicos, los términos "gestión" y "metadatos" son prácticamente sinónimos. Si se dispone de los metadatos adecuados, las funciones de gestión de registros se pueden automatizar, lo que reduce el riesgo de destrucción de pruebas y otras manipulaciones fraudulentas de los registros. Además, dichos registros se pueden utilizar para automatizar el proceso de auditoría de los datos mantenidos en bases de datos , lo que reduce el riesgo de puntos únicos de fallo asociados con el concepto maquiavélico de una única fuente de verdad .

Las cadenas de bloques permiten crear y mantener listas de registros en constante crecimiento, protegidas contra manipulaciones y revisiones. Una característica clave es que cada nodo de un sistema descentralizado tiene una copia de la cadena de bloques, por lo que no existe un único punto de falla sujeto a manipulación y fraude .

Véase también

Referencias

  1. ^ "Guía de NARA sobre la gestión de registros web". Archivos Nacionales . 15 de agosto de 2016.
  2. ^ "Un mejor uso de la tecnología de la información puede reducir la carga de trámites federales" (PDF) . gao.gov . 1983-04-11 . Consultado el 25 de julio de 2019 .
  3. ^ "GESTIÓN DE REGISTROS FEDERALES: Una historia de negligencia". gao.gov . 1981-02-24 . Consultado el 2016-09-08 .
  4. ^ "Definición de "Born Digital": Un ensayo de Ricky Erway, OCLC Research" (PDF) . oclc.org . 2010-11-30 . Consultado el 2016-09-08 .
  5. ^ "GESTIÓN DE LA INFORMACIÓN: Los desafíos de la gestión de registros electrónicos, declaración de Valerie C. Melvin, directora de Gestión de la información y cuestiones de capital humano" (PDF) . gao.gov . 2010-06-17 . Consultado el 2016-09-08 .
  6. ^ "GESTIÓN DE LA INFORMACIÓN: Se necesitan acciones adicionales para cumplir con los requisitos de la Directiva de gestión de registros gubernamentales". gao.gov . 2015-05-14 . Consultado el 2016-09-08 .
  7. ^ "GPRAMA SEC. 10. FORMATO DE LOS PLANES E INFORMES DE DESEMPEÑO". congress.gov . 2011-01-04. Archivado desde el original el 2016-04-13 . Consultado el 2016-09-08 .
  8. ^ "Orden ejecutiva 13642 en formato de lenguaje de marcado de estrategia abierto, estándar y legible por máquina". whitehouse.gov . 2013-05-09. Archivado desde el original el 2016-03-03 . Consultado el 2016-09-08 .
  9. ^ "Circular del Plan Estratégico Nº A-130, Gestión de la información como recurso estratégico, Objetivo d.5.a: Interoperabilidad, API y legibilidad por máquina".
  10. ^ "Circular No. A-130 del Plan Estratégico, Gestión de la Información como Recurso Estratégico, Objetivo e.2.a: Publicación".
  11. ^ Ryan, Paul D. (14 de enero de 2019). "Texto - HR4174 - 115.° Congreso (2017-2018): Ley de Fundamentos para la Formulación de Políticas Basadas en la Evidencia de 2018". www.congress.gov .
  12. ^ "PREPARACIÓN, PRESENTACIÓN Y EJECUCIÓN DEL PRESUPUESTO" (PDF) . whitehouse.gov . 2019-06-28 . Consultado el 2019-07-25 .
  13. ^ "Circular No. A-130 del Plan Estratégico, Gestión de la Información como Recurso Estratégico, Legibilidad Objetiva por Máquina".

Enlaces externos