El lenguaje de marcado de procedencia (abreviado PML ; originalmente llamado lenguaje de marcado de prueba ) es una interlingua para representar y compartir conocimiento sobre cómo la información publicada en la Web fue afirmada a partir de fuentes de información y/o derivada de información de la Web por agentes inteligentes . El lenguaje fue desarrollado inicialmente en apoyo del lenguaje de marcado de agente de DARPA con el objetivo de explicar cómo los demostradores de teoremas automatizados (ATP) derivan conclusiones de un conjunto de axiomas . La información , los pasos de inferencia , las reglas de inferencia y los agentes son los tres bloques de construcción principales del lenguaje. En el contexto de un paso de inferencia, la información puede desempeñar el papel de antecedente (también llamado premisa) y conclusión. La información también puede desempeñar el papel de axioma que es básicamente una conclusión sin antecedentes. PML utiliza la definición filosófica amplia de agente en oposición a cualquier otra definición más específica de agente.
El uso de PML en proyectos posteriores hizo evolucionar el lenguaje en nuevas direcciones, ampliando su capacidad para representar el conocimiento de procedencia más allá del ámbito de los ATP y el razonamiento automatizado . El conjunto original de requisitos se relajó para incluir lo siguiente: la información representada originalmente como oraciones lógicas en el Formato de Intercambio de Conocimiento se permitió que fuera información escrita en cualquier idioma, incluido el idioma inglés ; y las reglas de inferencia definidas originalmente como patrones sobre antecedentes y conclusiones de pasos de inferencia se permitieron subespecificar siempre que se identificaran y nombraran. Estas relajaciones fueron esenciales para explicar cómo se extrae el conocimiento del texto mediante el uso de componentes de extracción de información. También se requirieron mejoras para comprender mejor la motivación detrás de la necesidad de los demostradores de teoremas automatizados para derivar conclusiones: se agregaron nuevas capacidades para anotar cómo la información que desempeña el papel de axiomas eran atributos como afirmaciones de fuentes de información; y se introdujo la noción de preguntas y respuestas en el lenguaje para explicar a un agente externo por qué se utilizó un demostrador de teoremas automatizado para probar un teorema (es decir, una respuesta) a partir de un conjunto dado de axiomas.
La primera versión de PML (PML1) fue desarrollada en el Laboratorio de Sistemas de Conocimiento de la Universidad de Stanford en 2003 y originalmente fue coescrita por Paulo Pinheiro , Deborah McGuinness y Richard Fikes . [1] La segunda versión de PML (PML2) desarrollada en 2007 modularizó PML1 en tres módulos para reducir el costo de mantenimiento y reutilización: procedencia , justificación y relaciones de confianza. [2] Una nueva versión de PML (PML3) basada en PROV del Consorcio World Wide Web está en desarrollo. [3]