Un infobox es una tabla física o digital que se utiliza para recopilar y presentar un subconjunto de información sobre su tema, como un documento . Es un documento estructurado que contiene un conjunto de pares atributo-valor , [1] y en Wikipedia representa un resumen de información sobre el tema de un artículo . [2] De esta manera, son comparables a las tablas de datos en algunos aspectos. Cuando se presenta dentro del documento más grande que resume, un infobox a menudo se presenta en un formato de barra lateral .
Un infobox se puede implementar en otro documento transcluyéndolo en ese documento y especificando algunos o todos los pares atributo-valor asociados con ese infobox, lo que se conoce como parametrización .
Un infobox puede utilizarse para resumir la información de un artículo en Wikipedia . [3] Se utilizan en artículos similares para garantizar la coherencia de la presentación mediante el uso de un formato común. [4] [2] Originalmente, los infoboxes (y las plantillas en general) se utilizaban para fines de diseño de páginas . [2] Un infobox puede incorporarse a un artículo especificando el valor de algunos o todos sus parámetros . [5] El nombre del parámetro utilizado debe ser el mismo que el especificado en la plantilla del infobox, pero se le puede asociar cualquier valor. [5] El nombre está delimitado del valor por un signo igual . [5] El nombre del parámetro puede considerarse un atributo del tema del artículo. [6]
En Wikipedia, un cuadro de información se transcluye en un artículo encerrando su nombre y pares de atributo-valor dentro de un doble conjunto de llaves . El software MediaWiki en el que opera Wikipedia analiza el documento, para lo cual el cuadro de información y otras plantillas son procesadas por un procesador de plantillas . Este es un motor de plantillas que produce un documento web y una hoja de estilo utilizada para la presentación del documento. Esto permite que el diseño del cuadro de información se separe del contenido que manipula; [2] es decir, el diseño de la plantilla se puede actualizar sin afectar la información dentro de ella, y el nuevo diseño se propagará automáticamente a todos los artículos que transcluyan el cuadro de información. [4] Por lo general, los cuadros de información están formateados para aparecer en la esquina superior derecha de un artículo de Wikipedia en la vista de escritorio, [3] o en la parte superior en la vista móvil.
La ubicación de un cuadro de información dentro del wikitexto de un artículo es importante para la accesibilidad . [7] Una buena práctica es colocarlos después de las plantillas de desambiguación (aquellas que dirigen a los lectores a artículos sobre temas con nombres similares) y plantillas de mantenimiento (como la que marca un artículo como no referenciado), pero antes de todo el resto del contenido . [8] [9]
Baeza-Yates y King dicen que algunos editores encuentran complicadas las plantillas como los infoboxes, [10] ya que la plantilla puede ocultar texto sobre una propiedad o recurso que el editor desea cambiar; esto se ve agravado por las plantillas encadenadas, es decir, plantillas transcluidas dentro de otras plantillas. [10]
En agosto de 2009, la Wikipedia en inglés utilizaba alrededor de 3000 plantillas de infobox que, en conjunto, utilizaban más de 20 000 atributos. [11] Desde entonces, muchas se han fusionado para reducir la redundancia. En junio de 2013, había al menos 1 345 446 transclusiones de la plantilla Infobox original , [12] utilizada por algunos, pero no todos, los infoboxes, en 4 251 127 artículos.
El nombre de un Infobox normalmente es "Infobox [género]"; sin embargo, a los infoboxes de uso generalizado se les pueden asignar nombres más cortos, como "taxobox" para taxonomía. [8]
En 2008, aproximadamente el 44,2% de los artículos de Wikipedia contenían un cuadro de información [13] y en 2010, aproximadamente el 33% . [14] La extracción automática de conocimiento semántico mediante algoritmos de aprendizaje automático se utiliza para "extraer información procesable por máquina a un coste de complejidad relativamente bajo". [1] Sin embargo, la baja cobertura lo hace más difícil, aunque esto se puede superar parcialmente complementando los datos del artículo con los de las categorías en las que se incluye el artículo. [13] La Wikipedia en francés inició el proyecto Infobox Versión 2 en mayo de 2011. [15] [16]
El conocimiento obtenido mediante el aprendizaje automático se puede utilizar para mejorar un artículo, por ejemplo, mediante el uso de sugerencias de software automatizadas para que los editores agreguen datos del cuadro de información. [13] El proyecto iPopulator creó un sistema para agregar un valor al parámetro del cuadro de información de un artículo mediante un análisis automático del texto de ese artículo. [11]
DBpedia utiliza contenido estructurado extraído de infoboxes [2] mediante algoritmos de aprendizaje automático para crear un recurso de datos vinculados en la Web Semántica ; Tim Berners-Lee lo ha descrito como "uno de los componentes más famosos" del proyecto de datos vinculados. [17]
La extracción por máquina crea un triple que consiste en un sujeto, un predicado o relación y un objeto. [1] Cada par atributo-valor del infobox se utiliza para crear una declaración RDF utilizando una ontología . [18] Esto se ve facilitado por la brecha más estrecha entre Wikipedia y una ontología que la que existe entre un texto libre o no estructurado y una ontología. [19]
La relación semántica entre el sujeto y el objeto se establece mediante el predicado. [1] En el cuadro de información de ejemplo, el triple ("crostata", tipo, "tarta") indica que una crostata es un tipo de tarta . El tema del artículo se utiliza como sujeto, el nombre del parámetro se utiliza como predicado y el valor del parámetro como objeto. [18] [1] Cada tipo de cuadro de información se asigna a una clase de ontología, y cada propiedad (parámetro) dentro de un cuadro de información se asigna a una propiedad de ontología. [20] Estas asignaciones se utilizan al analizar un artículo de Wikipedia para extraer datos.
Al presentar los hechos básicos de un artículo dentro de un cuadro de información, también se permite presentar los hechos de una manera amigable para la máquina, lo que permite una funcionalidad adicional, como cuando se pega un enlace a una wikipedia en un programa compatible, en lugar de publicar solo el enlace, también se publica otra información como la imagen del artículo.
{{cite book}}
: |work=
ignorado ( ayuda )