Wikidata en la nube de datos abiertos vinculados. Las bases de datos se indican como círculos (con wikidata indicado como 'WD'), con líneas grises que vinculan las bases de datos en la red si sus datos están alineados.DBpedia como el conjunto de datos LOD más interconectado y el punto de cristalización de Linked Open Data Cloud desde 2008, generado a partir de https://lod-cloud.net/
En informática , los datos vinculados son datos estructurados que están interconectados con otros datos para que sean más útiles a través de consultas semánticas . Se basa en tecnologías web estándar como HTTP , RDF y URI , pero en lugar de utilizarlas para servir páginas web sólo para lectores humanos, las amplía para compartir información de una manera que las computadoras puedan leer automáticamente. Parte de la visión de los datos vinculados es que Internet se convierta en una base de datos global . [1]
Se deben utilizar URI HTTP para permitir que estas cosas se busquen, interpreten y posteriormente "desreferencian".
Se debe proporcionar información útil sobre lo que identifica un nombre a través de estándares abiertos como RDF , SPARQL , etc.
Al publicar datos en la Web, se debe hacer referencia a otras cosas utilizando sus nombres basados en URI HTTP.
Tim Berners-Lee posteriormente reafirmó estos principios en una conferencia TED de 2009 , nuevamente parafraseados de la siguiente manera: [4]
Todo lo conceptual debe tener un nombre que comience con HTTP .
La búsqueda de un nombre HTTP debería devolver datos útiles sobre el objeto en cuestión en un formato estándar.
Cualquier otra cosa con la que esa misma cosa tenga una relación a través de sus datos también debe recibir un nombre que comience con HTTP.
Componentes
Por lo tanto, podemos identificar los siguientes componentes como esenciales para un sistema global de Datos Vinculados tal como se concibió, y para cualquier subconjunto de Datos Vinculados real dentro del mismo:
Los datos abiertos vinculados son datos vinculados que son datos abiertos . [5] [6] [7] Tim Berners-Lee ofrece la definición más clara de datos abiertos vinculados a diferencia de los datos vinculados.
Linked Open Data (LOD) son datos vinculados que se publican bajo una licencia abierta, lo que no impide su reutilización de forma gratuita.
— Tim Berners-Lee, Datos vinculados [2] [8]
Grandes conjuntos de datos abiertos vinculados incluyen DBpedia , Wikibase , Wikidata y Open ICEcat [Reino Unido; nl] .
Datos abiertos vinculados de 5 estrellas
Esquema de implementación de datos abiertos vinculados [9]
En 2010, Tim Berners-Lee sugirió un sistema de 5 estrellas para calificar la calidad de los datos abiertos en la web, donde la clasificación más alta es Linked Open Data: [10]
1 estrella: los datos están disponibles abiertamente en algún formato.
3 estrellas: los datos están disponibles en un formato estructurado no propietario, como valores separados por comas (.csv).
4 estrellas: los datos siguen los estándares del W3C , como el uso de RDF y el empleo de URI .
5 estrellas: todos los demás, además de enlaces a otras fuentes de Linked Open Data.
Historia
El término "datos abiertos vinculados" se ha utilizado al menos desde febrero de 2007, cuando se creó la lista de correo "Vincular datos abiertos" [11] . [12] La lista de correo fue alojada inicialmente por el proyecto SIMILE [13] en el Instituto de Tecnología de Massachusetts .
Proyecto comunitario Vinculación de Datos Abiertos
El diagrama anterior muestra qué conjuntos de datos de Linking Open Data están conectados, en agosto de 2014. Esto fue producido por el proyecto Linked Open Data Cloud, que se inició en 2007. Algunos conjuntos pueden incluir datos protegidos por derechos de autor que están disponibles gratuitamente. [14]El mismo diagrama anterior, pero para febrero de 2017, que muestra el crecimiento en solo dos años y medio.
El objetivo del proyecto comunitario Linking Open Data del grupo de Educación y Divulgación de la Web Semántica del W3C es ampliar la Web con datos comunes publicando varios conjuntos de datos abiertos como RDF en la Web y estableciendo enlaces RDF entre elementos de datos de diferentes fuentes de datos. En octubre de 2007, los conjuntos de datos constaban de más de dos mil millones de tripletes RDF , que estaban interconectados por más de dos millones de enlaces RDF. [15] [16] En septiembre de 2011, esto había aumentado a 31 mil millones de triples RDF, interconectados por alrededor de 504 millones de enlaces RDF. En 2014 se publicó un desglose estadístico detallado. [17]
proyectos de la unión europea
Hay una serie de proyectos de la Unión Europea que involucran datos vinculados. Estos incluyen el proyecto Linked Open Data Around the Clock (LATC), [18] el proyecto AKN4EU para datos legislativos legibles por máquina, [19] el proyecto PlanetData, [20] el proyecto DaPaaS (Data-and-Platform-as-a- Service), [21] y el proyecto Linked Open Data 2 (LOD2). [22] [23] [24] La vinculación de datos es uno de los principales objetivos del Portal de Datos Abiertos de la UE , que pone a disposición miles de conjuntos de datos para que cualquiera pueda reutilizarlos y vincularlos.
Ontologías
Las ontologías son descripciones formales de estructuras de datos. Algunas de las ontologías más conocidas son:
FOAF : una ontología que describe personas, sus propiedades y relaciones.
UMBEL : una estructura de referencia ligera de 20.000 clases de conceptos temáticos y sus relaciones derivadas de OpenCyc , que puede actuar como clases vinculantes para datos externos; también tiene enlaces a 1,5 millones de entidades nombradas de DBpedia y YAGO
Conjuntos de datos
DBpedia : un conjunto de datos que contiene datos extraídos de Wikipedia; Contiene alrededor de 3,4 millones de conceptos descritos por mil millones de tripletas , incluidos resúmenes en 11 idiomas diferentes.
GeoNames : proporciona descripciones RDF de más de 7.500.000 características geográficas en todo el mundo.
Wikidata : un conjunto de datos vinculado creado en colaboración que actúa como almacenamiento central para los datos estructurados de sus proyectos hermanos de la Fundación Wikimedia.
Base de datos de identificadores de investigación global ( GRID ): una base de datos internacional de 89.506 instituciones dedicadas a la investigación académica, con 14.401 relaciones. GRID modela dos tipos de relaciones: una relación padre-hijo que define una asociación subordinada y una relación relacionada que describe otras asociaciones [25] [26]
KnowWhereGraph [27] : un gráfico integrado de conocimiento sólido de 12 mil millones de triples de 30 capas de datos en la intersección entre los humanos y su entorno utilizando tecnologías de Web Semántica y Datos Vinculados. [28]
Relaciones de clase e instancia de conjunto de datos
Se encuentran disponibles diagramas en los que se puede hacer clic que muestran los conjuntos de datos individuales y sus relaciones dentro de la nube LOD generada por DBpedia (como en las figuras de la derecha). [29] [30]
Ver también
American Art Collaborative : consorcio de museos de arte de EE. UU. comprometidos a establecer una masa crítica de datos abiertos vinculados sobre el arte estadounidense.
^ "Datos vinculados como JSON". Datos vinculados como JSON . Consultado el 4 de diciembre de 2020 .
^ a b C Tim Berners-Lee (27 de julio de 2006). "Datos vinculados". Problemas de diseño . W3C . Consultado el 18 de diciembre de 2010 .
^ "¿Qué son los datos vinculados y los datos abiertos vinculados?". Ontotexto . Consultado el 8 de mayo de 2019 .
^ "Tim Berners-Lee en la próxima Web". Archivado desde el original el 10 de abril de 2011 . Consultado el 15 de marzo de 2009 .
^ "Preguntas frecuentes (FAQ) - Datos vinculados - Conecte datos distribuidos en la Web". Archivado desde el original el 18 de noviembre de 2015 . Consultado el 29 de diciembre de 2014 .
^ "COAR» 7 cosas que debes saber sobre… Datos vinculados ". Archivado desde el original el 18 de noviembre de 2015 . Consultado el 29 de diciembre de 2015 .
^ "Conceptos básicos de datos vinculados para expertos en tecnología". Archivado desde el original el 5 de mayo de 2021 . Consultado el 29 de diciembre de 2015 .
^ "Datos abiertos de 5 estrellas".
^ "Datos abiertos de 5 estrellas". 5stardata.info . Consultado el 7 de marzo de 2021 .
^ "¿Qué son los datos vinculados de 5 estrellas? | Grupo comunitario Webize Everything". www.w3.org . Consultado el 7 de marzo de 2021 .
^ Vinculación del diagrama de nube de datos abiertos 2014, por Max Schmachtenberg, Christian Bizer, Anja Jentzsch y Richard Cyganiak. http://lod-cloud.net/
^ "SweoIG/TaskForces/CommunityProjects/LinkingOpenData - W3C Wiki". esw.w3.org . Consultado el 22 de marzo de 2018 .
^ Fensel, Dieter; Facca, Federico Michele; Simperl, Elena; Ioan, Toma (2011). Servicios de Web Semántica . Saltador. pag. 99.ISBN978-3642191923.
^ Máx. "Estado de la nube LOD". linkeddatacatalog.dws.informatik.uni-mannheim.de . Consultado el 22 de marzo de 2018 .
^ "Datos abiertos vinculados las 24 horas (LATC)". proyecto-latc.eu . Archivado desde el original el 19 de septiembre de 2018 . Consultado el 22 de marzo de 2018 .
^ Flatt, Amelie; Langner, Arne; Leps, Olof (2022), "Desarrollo basado en modelos de perfiles de aplicaciones AKN: antecedentes y requisitos", Desarrollo basado en modelos de perfiles de aplicaciones Akoma Ntoso , Cham: Springer International Publishing, págs. 5–12, doi :10.1007/978- 3-031-14132-4_2, ISBN978-3-031-14131-7, recuperado el 7 de enero de 2023
^ "¡Bienvenido a PlanetData! - PlanetData". planet-data.eu . Archivado desde el original el 21 de abril de 2021 . Consultado el 22 de marzo de 2018 .
^ "DaPaaS". proyecto.dapaas.eu . Archivado desde el original el 18 de diciembre de 2020 . Consultado el 22 de marzo de 2018 .
^ Vinculación de datos abiertos 2 (LOD2)
^ "Proyectos de TIC del 7PM de CORDIS - LOD2". Comisión Europea. 2010-04-20.
^ "Hoja informativa del proyecto LOD2: resumen del proyecto" (PDF) . 2010-09-01. Archivado desde el original (PDF) el 20 de julio de 2011 . Consultado el 18 de diciembre de 2010 .
^ "Estadísticas de GRID". grid.ac/stats . Consultado el 26 de octubre de 2018 .
^ "Políticas GRID". grid.ac. Consultado el 26 de octubre de 2018 .
^ "Saber dónde gráfico". knowwheregraph.org . Consultado el 16 de mayo de 2022 .
^ Krzysztof Janowicz; Pascal Hitzler ; Wenwen Li; Dean Rehberger; Mark Schildhauer; Rui Zhu; Cogan Shimizu; Colby K. Fisher; Ling Cai; Gengchen Mai; José Zalewski; Lu Zhou; Shirley Stephen; Seila González Estrecha; Bryce D. Mecum; Anna López-Carr; Andrés Schroeder; Dave Smith; Amanecer J. Wright; Sizhe Wang; Yuanyuan Tian; Zilong Liu; Meilin Shi; Antonio D'Onofrio; Zhining G; Kitty Currier (2022). "Know, Know Where, Knowwheregraph: un gráfico de conocimiento entre dominios densamente conectado y una pila de servicios de enriquecimiento geográfico para aplicaciones de inteligencia ambiental". Revista AI . 43 (1): 30–39. doi : 10.1609/aimag.v43i1.19120 . hdl : 1983/be176aba-9dec-456c-9615-01a0e8556b7b .
^ "Relaciones de instancia entre conjuntos de datos". fu-berlin.de . Archivado desde el original el 17 de octubre de 2012 . Consultado el 22 de marzo de 2018 .
^ "Relaciones de clases entre conjuntos de datos". Archivado desde el original el 28 de agosto de 2011 . Consultado el 22 de marzo de 2018 .
Otras lecturas
Ahmet Soylu, Felix Mödritscher y Patrick De Causmaecker. 2012. "Navegación web ubicua mediante la recolección de datos semánticos integrados: un escenario móvil". Archivado el 19 de septiembre de 2018 en Wayback Machine Ingeniería integrada asistida por computadora 19 (1): 93–109.
Datos vinculados: evolución de la Web hacia un espacio de datos global (2011) por Tom Heath y Christian Bizer, Conferencias de síntesis sobre la web semántica: teoría y tecnología, Morgan & Claypool
Cómo publicar datos vinculados en la Web Archivado el 19 de abril de 2021 en Wayback Machine , por Chris Bizer, Richard Cyganiak y Tom Heath, Tutorial de datos vinculados en la Freie Universität Berlin, Alemania, 27 de julio de 2007.
La Web cumple 20 años: los datos vinculados dan poder a las personas, parte 1 de 4, por Mark Fischetti, Scientific American 23 de octubre de 2010
Los datos vinculados son simplemente más datos: Prateek Jain, Pascal Hitzler , Peter Z. Yeh, Kunal Verma y Amit P. Sheth. En: Dan Brickley, Vinay K. Chaudhri, Harry Halpin y Deborah McGuinness: los datos vinculados se encuentran con la inteligencia artificial . Informe técnico SS-10-07, AAAI Press, Menlo Park, California, 2010, págs. 82–86.
Más allá de lo mismoComo con PLATO: detección de partonomía para datos vinculados: Prateek Jain, Pascal Hitzler , Kunal Verma, Peter Z. Yeh, Amit Sheth. En: Actas de la 23ª conferencia ACM Hypertext and Social Media (HT 2012), Milwaukee, WI, EE. UU., 25 al 28 de junio de 2012.
Freitas, André, Edward Curry, João Gabriel Oliveira y Sean O'Riain. 2012. "Consulta de conjuntos de datos heterogéneos en la web de datos vinculados: desafíos, enfoques y tendencias". Computación de Internet IEEE 16 (1): 24–33.
Interconexión de datos abiertos en la Web: Chris Bizer, Tom Heath, Danny Ayers, Yves Raimond. En las actas Poster Track, ESWC2007, Innsbruck, Austria
Alineación de ontologías para datos abiertos vinculados: Prateek Jain, Pascal Hitzler , Amit Sheth, Kunal Verma, Peter Z. Yeh. En actas de la 9ª Conferencia Internacional sobre Web Semántica, ISWC 2010, Shanghai, China
Datos abiertos vinculados sobre medicamentos para la investigación y el desarrollo farmacéuticos - J Cheminform. 2011; 3: 19. Samwald, Jentzsch, Bouton, Kallesøe, Willighagen, Hajagos, Marshall, Prud'hommeaux, Hassenzadeh, Pichler y Stephens (mayo de 2011)
Entrevista con Sören Auer, jefe del proyecto LOD2 sobre la continuación de LOD2 en 2011, junio de 2011
Datos abiertos vinculados: lo esencial: Florian Bauer y Martin Kaltenböck (enero de 2012)
El aleteo de una mariposa - semanticweb.com Richard Wallis (febrero de 2012)
enlaces externos
Scholia tiene un perfil de tema para datos vinculados .