stringtranslate.com

Wikidatos

Wikidata es un gráfico de conocimiento multilingüe editado en colaboración y alojado por la Fundación Wikimedia . [2] Es una fuente común de datos abiertos que los proyectos de Wikimedia, como Wikipedia , [3] [4] y cualquier otro, pueden utilizar bajo la licencia de dominio público CC0 . Wikidata es un wiki impulsado por el software MediaWiki , incluida su extensión para datos semiestructurados , Wikibase .

Concepto

Este diagrama muestra los términos más importantes utilizados en Wikidata.

Wikidata es una base de datos orientada a documentos , centrada en elementos, que representan cualquier tipo de tema, concepto u objeto. A cada elemento se le asigna un identificador único y persistente , un número entero positivo precedido por la letra Q mayúscula, conocido como "QID". Q es el nombre de Qamarniso Vrandečić (de soltera Ismoilova), una wikimediana uzbeka casada con el codesarrollador de Wikidata Denny Vrandečić . [5] Esto permite traducir la información básica requerida para identificar el tema que cubre el artículo sin favorecer ningún idioma.

Ejemplos de elementos incluyen Juegos Olímpicos de Verano de 1988 (Q8470), amor (Q316), Johnny Cash (Q42775), Elvis Presley (Q303) y Gorilla (Q36611).

Las etiquetas de los artículos no tienen por qué ser únicas. Por ejemplo, hay dos artículos denominados "Elvis Presley": Elvis Presley (Q303), que representa al cantante y actor estadounidense , y Elvis Presley (Q610926), que representa su álbum homónimo . Sin embargo, la combinación de una etiqueta y su descripción debe ser única. Para evitar ambigüedades, el identificador único de un artículo ( QID ) está vinculado a esta combinación.

Partes principales

Captura de pantalla de Wikidata


Un diseño de los cuatro componentes principales de una página Wikidata de fase 1: la etiqueta, la descripción, los alias y los enlaces entre idiomas.

Básicamente, un artículo consta de:

Declaraciones

Captura de pantalla de Wikidata
Tres declaraciones del artículo de Wikidata sobre el planeta Marte (Q111). Los valores incluyen enlaces a otros elementos y a Wikimedia Commons .

Las declaraciones son la forma en que se registra en Wikidata cualquier información conocida sobre un elemento. Formalmente, constan de pares clave-valor , que relacionan una propiedad (como "autor" o "fecha de publicación") con uno o más valores de entidad (como " Sir Arthur Conan Doyle " o "1902"). Por ejemplo, la declaración informal en inglés "la leche es blanca" se codificaría mediante una declaración que combina la propiedad color (P462) con el valor blanco (Q23444) bajo el elemento leche (Q8495).

Las declaraciones pueden asignar una propiedad a más de un valor. Por ejemplo, la propiedad "ocupación" de Marie Curie podría vincularse con los valores "físico" y "químico", para reflejar el hecho de que ella se dedicaba a ambas ocupaciones. [6]

Los valores pueden adoptar muchos tipos, incluidos otros elementos, cadenas, números o archivos multimedia de Wikidata. Las propiedades prescriben con qué tipos de valores se pueden combinar. Por ejemplo, la URL del sitio web oficial de la propiedad (P856) solo puede combinarse con valores del tipo "URL". [7]

Opcionalmente, se pueden utilizar calificadores para refinar el significado de una declaración proporcionando información adicional. Por ejemplo, una declaración de "población" podría modificarse con un calificador como "momento en el tiempo (P585): 2011" (como su propio par clave-valor). Los valores de las declaraciones también pueden estar anotados con referencias , que apuntan a una fuente que respalda el contenido de la declaración. [8] Al igual que con las declaraciones, todos los calificadores y referencias son pares propiedad-valor.

Propiedades

Ejemplo de una declaración simple que consta de un par propiedad-valor

Cada propiedad tiene un identificador numérico precedido de una P mayúscula y una página en Wikidata con etiqueta, descripción, alias y declaraciones opcionales. Como tal, existen propiedades con el único propósito de describir otras propiedades, como la subpropiedad de (P1647).

Las propiedades también pueden definir reglas más complejas sobre su uso previsto, denominadas restricciones . Por ejemplo, la propiedad capital (P36) incluye una "restricción de valor único", lo que refleja la realidad de que (típicamente) los territorios tienen una sola ciudad capital. Las restricciones se tratan como alertas y sugerencias de prueba, en lugar de reglas inviolables. [9]

Antes de crear una nueva propiedad, es necesario pasar por un proceso de discusión. [10] [11]

La propiedad más utilizada es el trabajo de citas (P2860), que se utiliza en más de 290.000.000 de páginas de artículos hasta noviembre de 2023. [12]

Lexemas

En lingüística , un lexema es una unidad de significado léxico . De manera similar, los lexemas de Wikidata son elementos con una estructura que los hace más adecuados para almacenar datos lexicográficos . Además de almacenar el idioma al que se refiere el lexema, cuentan con un apartado para formas y otro para sentidos . [13]

Esquemas de entidad

En enero de 2019, comenzó el desarrollo de una nueva extensión para MediaWiki para permitir almacenar expresiones de formas en un espacio de nombres separado. [14] [15]

Desde entonces, esta extensión se ha instalado en Wikidata [16] y permite a los contribuyentes utilizar expresiones de forma para validar y describir datos del marco de descripción de recursos en elementos y lexemas. Cualquier elemento o lexema de Wikidata se puede validar con un esquema de entidad, y esto lo convierte en una herramienta importante para el control de calidad.

Desarrollo

La creación del proyecto fue financiada por donaciones del Instituto Allen de Inteligencia Artificial , la Fundación Gordon y Betty Moore y Google, Inc. , por un total de 1,3 millones de euros . [17] [18] El desarrollo del proyecto está impulsado principalmente por Wikimedia Deutschland bajo la dirección de Lydia Pintscher, y originalmente se dividió en tres fases: [19]

  1. Centralizar enlaces interidiomas: enlaces entre artículos de Wikipedia sobre el mismo tema en diferentes idiomas.
  2. Proporcionar un lugar central para los datos del cuadro de información de todas las Wikipedias.
  3. Creación y actualización de listas de artículos basadas en datos de Wikidata y vinculación a otros proyectos hermanos de Wikimedia, incluido Meta-Wiki y el propio Wikidata (interwikilinks).

Lanzamiento inicial

Wikidata se lanzó el 29 de octubre de 2012 y fue el primer proyecto nuevo de la Fundación Wikimedia desde 2006. [3] [20] [21] En ese momento, solo estaba disponible la centralización de enlaces de idiomas. Esto permitió crear elementos y completarlos con información básica: una etiqueta (un nombre o título), alias (términos alternativos para la etiqueta), una descripción y enlaces a artículos sobre el tema en todas las ediciones de Wikipedia en varios idiomas (enlaces interwikipedia). .

Históricamente, un artículo de Wikipedia incluiría una lista de enlaces entre idiomas (enlaces a artículos sobre el mismo tema en otras ediciones de Wikipedia, si existieran). Wikidata era originalmente un depósito autónomo de enlaces entre idiomas. [22] Las ediciones de idiomas de Wikipedia todavía no podían acceder a Wikidata, por lo que necesitaban continuar manteniendo sus propias listas de enlaces entre idiomas. [ cita necesaria ]

El 14 de enero de 2013, la Wikipedia húngara se convirtió en la primera en permitir el suministro de enlaces entre idiomas a través de Wikidata. [23] Esta funcionalidad se amplió a las Wikipedias hebrea e italiana el 30 de enero, a la Wikipedia en inglés el 13 de febrero y a todas las demás Wikipedias el 6 de marzo. [24] [25] [26] [27] Después de que no se alcanzó consenso sobre una propuesta para restringir la eliminación de enlaces de idiomas de la Wikipedia en inglés, [28] los bots los eliminaron automáticamente . El 23 de septiembre de 2013, se publicaron enlaces interlingüísticos en Wikimedia Commons. [29]

Declaraciones y acceso a datos

El 4 de febrero de 2013, se introdujeron declaraciones en las entradas de Wikidata. Los valores posibles para las propiedades se limitaron inicialmente a dos tipos de datos (elementos e imágenes en Wikimedia Commons), y más adelante seguirán más tipos de datos (como coordenadas y fechas). El primer tipo nuevo, el de cuerda, se desplegó el 6 de marzo. [30]

La capacidad de las ediciones en distintos idiomas de Wikipedia para acceder a datos de Wikidata se implementó progresivamente entre el 27 de marzo y el 25 de abril de 2013. [31] [32] El 16 de septiembre de 2015, Wikidata comenzó a permitir el llamado acceso arbitrario , o acceso desde un artículo dado de una Wikipedia a las declaraciones sobre elementos de Wikidata que no están directamente relacionados con él. Por ejemplo, en el artículo de Berlín se pudieron leer datos sobre Alemania, algo que antes no era posible. [33] El 27 de abril de 2016 se activó el acceso arbitrario en Wikimedia Commons. [34]

Según un estudio de 2020, una gran proporción de los datos de Wikidata consisten en entradas importadas en masa de otras bases de datos por robots de Internet , lo que ayuda a "derribar los muros" de los silos de datos . [35]

Servicio de consultas y otras mejoras.

El 7 de septiembre de 2015, la Fundación Wikimedia anunció el lanzamiento del Servicio de Consulta Wikidata, [36] que permite a los usuarios realizar consultas sobre los datos contenidos en Wikidata. [37] El servicio utiliza SPARQL como lenguaje de consulta. A noviembre de 2018, existen al menos 26 herramientas diferentes que permiten consultar los datos de diferentes formas. [38] Utiliza Blazegraph como su triple almacén y base de datos de gráficos . [39] [40]

En 2021, Wikimedia Deutschland lanzó Query Builder, [41] "un creador de consultas basado en formularios que permite a las personas que no saben cómo usar SPARQL" escribir una consulta.

Logo

Las barras del logo contienen la palabra "WIKI" codificada en código Morse . [42] Fue creado por Arun Ganesh y seleccionado mediante decisión de la comunidad. [43]

Recepción

En noviembre de 2014, Wikidata recibió el premio Open Data Publisher Award del Open Data Institute "por su gran escala y su apertura integrada". [44]

En diciembre de 2014, Google anunció que cerraría Freebase en favor de Wikidata. [45]

En noviembre de 2018 , la información de Wikidata se utilizó en el 58,4% de todos los artículos de Wikipedia en inglés, principalmente para identificadores externos o ubicaciones de coordenadas. En conjunto, los datos de Wikidata se muestran en el 64% de todas las páginas de Wikipedia , el 93% de todos los artículos de Wikivoyage , el 34% de todas las Wikiquotes , el 32% de todas las Wikisources y el 27% de Wikimedia Commons. El uso en otros proyectos de la Fundación Wikimedia es testimonial. [46]

En diciembre de 2020 , los datos de Wikidata fueron visualizados mediante al menos otras 20 herramientas externas [47] y se han publicado más de 300 artículos sobre Wikidata. [48]

El conjunto de datos estructurados de Wikidata ha sido utilizado por asistentes virtuales como Siri de Apple y Amazon Alexa . [49]

Aplicaciones

En 2019 se realizó una revisión sistemática de la literatura sobre los usos de Wikidata en la investigación .

Ver también

Referencias

  1. ^ "La revolución de Wikidata ya está aquí: permitir datos estructurados en Wikipedia". 25 de abril de 2013 . Consultado el 12 de junio de 2022 . Desde que Wikidata.org entró en funcionamiento el 30 de octubre de 2012,
  2. ^ Chalabi, Mona (26 de abril de 2013). "¡Bienvenidos a Wikidata! ¿Y ahora qué?". Archivado desde el original el 2 de octubre de 2021 . Consultado el 2 de octubre de 2021 .
  3. ^ ab Wikidata (archivado el 29 de octubre de 2012 en Wayback Machine )
  4. ^ "Revolución de datos para Wikipedia". Wikimedia Alemania. 30 de marzo de 2012. Archivado desde el original el 23 de octubre de 2012 . Consultado el 11 de septiembre de 2012 .
  5. ^ Vrandečić, Denny; Pintscher, Lydia; Krötzsch, Markus (30 de abril de 2023). "Wikidata: la creación de". Actas complementarias de la conferencia web ACM 2023 . págs. 615–624. doi :10.1145/3543873.3585579. ISBN 9781450394192. S2CID  258377705.
  6. ^ "Ayuda: Declaraciones - Wikidata". www.wikidata.org . Archivado desde el original el 25 de marzo de 2019 . Consultado el 20 de febrero de 2019 .
  7. ^ "Ayuda: tipo de datos: Wikidata". www.wikidata.org . Archivado desde el original el 23 de marzo de 2019 . Consultado el 20 de febrero de 2019 .
  8. ^ "Ayuda: Fuentes - Wikidata". www.wikidata.org . Archivado desde el original el 17 de abril de 2019 . Consultado el 20 de febrero de 2019 .
  9. ^ "Ayuda: portal de restricciones de propiedad". Wikidatos . Archivado desde el original el 1 de junio de 2019 . Consultado el 20 de febrero de 2019 .
  10. ^ Cochrane, Euan (30 de septiembre de 2016). "Wikidata como base de conocimientos sobre preservación digital". openpreservation.org . Archivado desde el original el 5 de enero de 2022 . Consultado el 5 de enero de 2022 .
  11. ^ Samuel, John (15 de agosto de 2018). "Las relaciones internacionales experimentales se encuentran con el multilingüismo, la multimodalidad y la interacción". "Las relaciones internacionales experimentales se encuentran con el multilingüismo, la multimodalidad y la interacción ". CLEF 2018. Apuntes de conferencias sobre informática. vol. 11018. pág. 129. doi :10.1007/978-3-319-98932-7_12. ISBN 978-3-319-98931-0.
  12. ^ "Wikidata: informes de base de datos/lista de propiedades/Top100". Archivado desde el original el 24 de febrero de 2023 . Consultado el 18 de noviembre de 2023 .
  13. ^ "Wikidata: datos lexicográficos / documentación - Wikidata". www.wikidata.org . Archivado desde el original el 13 de noviembre de 2018 . Consultado el 13 de noviembre de 2018 .
  14. ^ "Extensión: EntitySchema - MediaWiki". mediawiki.org . Archivado desde el original el 25 de junio de 2021 . Consultado el 10 de septiembre de 2021 .
  15. ^ "Repositorio vacío inicial". Gerrit . 15 de enero de 2019. Archivado desde el original el 19 de marzo de 2022 . Consultado el 12 de junio de 2022 .
  16. ^ "Versión - Wikidata". Wikidata.org . Archivado desde el original el 19 de octubre de 2021 . Consultado el 10 de septiembre de 2021 .
  17. ^ Dickinson, Boonsri (30 de marzo de 2012). "Paul Allen invierte en un proyecto enorme para mejorar Wikipedia". Business Insider . Archivado desde el original el 23 de diciembre de 2017 . Consultado el 11 de septiembre de 2012 .
  18. ^ Pérez, Sarah (30 de marzo de 2012). "La próxima gran novedad de Wikipedia: Wikidata, una base de datos legible por máquina y editable por el usuario financiada por Google, Paul Allen y otros". TechCrunch . Archivado desde el original el 5 de octubre de 2012 . Consultado el 11 de septiembre de 2012 .
  19. ^ "Wikidata - Meta". meta.wikimedia.org . Archivado desde el original el 7 de abril de 2012 . Consultado el 8 de noviembre de 2015 .
  20. ^ Pintscher, Lydia (30 de octubre de 2012). "wikidata.org está activo (con algunas advertencias)". wikidata-l (lista de correo) . Consultado el 3 de noviembre de 2012 .
  21. ^ Roth, Matthew (30 de marzo de 2012). "La revolución de los datos de Wikipedia". Fundación Wikimedia. Archivado desde el original el 11 de septiembre de 2012 . Consultado el 11 de septiembre de 2012 .
  22. ^ Leitch, Thomas (1 de noviembre de 2014). Wikipedia U: Conocimiento, autoridad y educación liberal en la era digital . Prensa de la Universidad Johns Hopkins . pag. 120.ISBN _ 978-1-4214-1550-5.
  23. ^ Pintscher, Lydia (14 de enero de 2013). "Primeros pasos de Wikidata en la Wikipedia húngara". Wikimedia Alemania. Archivado desde el original el 14 de diciembre de 2015 . Consultado el 17 de diciembre de 2015 .
  24. ^ Pintscher, Lydia (30 de enero de 2013). "Wikidata llegará a las dos próximas Wikipedias". Wikimedia Alemania. Archivado desde el original el 4 de octubre de 2018 . Consultado el 31 de enero de 2013 .
  25. ^ Pintscher, Lydia (13 de febrero de 2013). "Wikidata vive en la Wikipedia en inglés". Wikimedia Alemania. Archivado desde el original el 19 de febrero de 2013 . Consultado el 15 de febrero de 2013 .
  26. ^ Pintscher, Lydia (6 de marzo de 2013). "Wikidata ahora está disponible en todas las Wikipedias". Wikimedia Alemania. Archivado desde el original el 14 de abril de 2013 . Consultado el 8 de marzo de 2013 .
  27. ^ "Wikidata ist für alle Wikipedien da" (en alemán). Golem.de. Archivado desde el original el 6 de noviembre de 2018 . Consultado el 29 de enero de 2014 .
  28. ^ "Charla de Wikipedia: Wikidata interwiki RFC". 29 de marzo de 2013. Archivado desde el original el 18 de octubre de 2021 . Consultado el 30 de marzo de 2013 .
  29. ^ Pintscher, Lydia (23 de septiembre de 2013). "¡Wikidata está aquí!". Comunes: Bomba de pueblo. Archivado desde el original el 6 de diciembre de 2021 . Consultado el 30 de agosto de 2016 .
  30. ^ Pintscher, Lydia. "Wikidata/Actualizaciones de estado/2013 03 01". Meta-Wiki de Wikimedia . Fundación Wikimedia. Archivado desde el original el 12 de abril de 2013 . Consultado el 3 de marzo de 2013 .
  31. ^ Pintscher, Lydia (27 de marzo de 2013). "¡Puedes tener todos los datos!". Wikimedia Alemania. Archivado desde el original el 29 de marzo de 2013 . Consultado el 28 de marzo de 2013 .
  32. ^ "Wikidata se lanza en todo el mundo". El H. 25 de abril de 2013. Archivado desde el original el 1 de enero de 2014.
  33. ^ Pintscher, Lydia (16 de septiembre de 2015). "Wikidata: el acceso a datos de elementos arbitrarios está aquí". Wikipedia: bomba de pueblo (técnica) . Archivado desde el original el 27 de septiembre de 2016 . Consultado el 30 de agosto de 2016 .
  34. ^ Pintscher, Lydia (27 de abril de 2016). "Soporte de Wikidata: el acceso arbitrario está aquí". Comunes: Bomba de pueblo. Archivado desde el original el 5 de febrero de 2017 . Consultado el 30 de agosto de 2016 .
  35. ^ Waagmeester, Andra; Stupp, Gregorio; Burgstaller-Muehlbacher, Sebastián; et al. (17 de marzo de 2020). "Wikidata como gráfico de conocimiento para las ciencias biológicas". eVida . 9 . doi : 10.7554/ELIFE.52614 . ISSN  2050-084X. PMC 7077981 . PMID  32180547. Wikidata  Q87830400. 
  36. ^ "Inicio". consulta.wikidata.org . Archivado desde el original el 7 de noviembre de 2016 . Consultado el 30 de enero de 2019 .
  37. ^ "[Wikidata] Anuncio del lanzamiento del servicio de consulta Wikidata - Wikidata - listas.wikimedia.org". Archivado desde el original el 10 de noviembre de 2015 . Consultado el 13 de noviembre de 2018 .
  38. ^ "Wikidata: herramientas/datos de consulta - Wikidata". www.wikidata.org . Archivado desde el original el 31 de mayo de 2020 . Consultado el 13 de noviembre de 2018 .
  39. ^ "[Wikidata-tech] Actualización del backend de consultas de Wikidata (¡toma dos!)". listas.wikimedia.org . Archivado desde el original el 6 de enero de 2021 . Consultado el 29 de agosto de 2018 .(El mensaje también contiene un enlace a la comparación de bases de datos de gráficos realizada por Wikimedia).
  40. ^ 86 en GitHub
  41. ^ "Generador de consultas de Wikidata". consulta.wikidata.org .
  42. ^ commons: Charla sobre archivos: Wikidata-logo-en.svg#Hybrid. Consultado el 6 de octubre de 2016.
  43. ^ "Und der Gewinner ist..." 13 de julio de 2012. Archivado desde el original el 21 de enero de 2021 . Consultado el 16 de junio de 2020 .
  44. ^ "Primeros premios ODI Open Data presentados por los señores Tim Berners-Lee y Nigel Shadbolt". Archivado desde el original el 24 de marzo de 2016.
  45. ^ "Base libre". Google Mas . 16 de diciembre de 2014. Archivado desde el original el 20 de marzo de 2019.
  46. ^ "Porcentaje de artículos que utilizan datos de Wikidata". Archivado desde el original el 15 de noviembre de 2018 . Consultado el 15 de noviembre de 2018 .
  47. ^ "Wikidata: Herramientas/Visualizar datos - Wikidata". www.wikidata.org . Archivado desde el original el 15 de noviembre de 2018 . Consultado el 15 de noviembre de 2018 .
  48. ^ "Escolia". Escolia . Archivado desde el original el 30 de septiembre de 2021 . Consultado el 2 de agosto de 2021 .
  49. ^ Simonita, Tom (18 de febrero de 2019). "Dentro del mundo de Wikidata compatible con Alexa". Cableado . ISSN  1059-1028 . Consultado el 25 de diciembre de 2020 .
  50. ^ "Rob Barry / Mwnci: hojas de cálculo profundas". GitLab . Archivado desde el original el 21 de septiembre de 2019 . Consultado el 21 de septiembre de 2019 .
  51. ^ Krause, Volker (12 de enero de 2020), Itinerario de KDE: un asistente de viaje con diseño de privacidad, archivado desde el original el 26 de junio de 2020 , recuperado 10 de noviembre 2020
  52. ^ cabestrillo en GitHub
  53. ^ Scharpf, P. Schubotz, M. Gipp, B. Minería de documentos matemáticos para responder preguntas mediante etiquetado de fórmulas no supervisadas Archivado el 10 de febrero de 2023 en la Conferencia conjunta Wayback Machine ACM/IEEE sobre bibliotecas digitales, 2022.
  54. ^ Mora-Cantallops, Marçal; Sánchez-Alonso, Salvador; García-Barriocanal, Elena (2 de septiembre de 2019). "Una revisión sistemática de la literatura sobre Wikidata". Tecnologías y aplicaciones de datos . 53 (3): 250–268. doi :10.1108/DTA-12-2018-0110. S2CID  202036639.

Otras lecturas

enlaces externos