stringtranslate.com

Caja de información

Un cuadro de información de la vida real del vagón 43185 de British Rail Class 43 operado por First Great Western

Un cuadro de información es una tabla digital o física que se utiliza para recopilar y presentar un subconjunto de información sobre su tema, como un documento . Es un documento estructurado que contiene un conjunto de pares atributo-valor , [1] y en Wikipedia representa un resumen de información sobre el tema de un artículo . [2] De esta manera, son comparables a las tablas de datos en algunos aspectos. Cuando se presenta dentro del documento más grande que resume, un cuadro de información a menudo se presenta en formato de barra lateral .

Un cuadro de información se puede implementar en otro documento transcluyéndolo en ese documento y especificando algunos o todos los pares atributo-valor asociados con ese cuadro de información, lo que se conoce como parametrización .

Wikipedia

Se puede utilizar un cuadro de información para resumir la información de un artículo en Wikipedia . [3] Se utilizan en artículos similares para garantizar la coherencia de la presentación mediante el uso de un formato común. [4] [2] Originalmente, los cuadros de información (y las plantillas en general) se utilizaban para fines de diseño de páginas . [2] Un cuadro de información se puede transcluir en un artículo especificando el valor de algunos o todos sus parámetros . [5] El nombre del parámetro utilizado debe ser el mismo que el especificado en la plantilla del cuadro de información, pero se le puede asociar cualquier valor. [5] El nombre está delimitado del valor por un signo igual . [5] El nombre del parámetro puede considerarse como un atributo del tema del artículo. [6]

El cuadro de información del artículo de Wikipedia Crostata representado por un motor de navegador web en una computadora de escritorio
El taxobox (abreviatura de cuadro de información de taxonomía ) del artículo de Wikipedia Xuanhanosaurus representado por un motor de navegador web (en Safari ) en una computadora de escritorio ( iMac ). Un taxobox es un tipo de cuadro de información que detalla la taxonomía de una forma de vida o animal específico.

En Wikipedia, un cuadro de información se transcluye en un artículo encerrando su nombre y sus pares atributo-valor entre un doble conjunto de llaves . El software MediaWiki en el que opera Wikipedia analiza el documento, para lo cual el cuadro de información y otras plantillas son procesadas por un procesador de plantillas . Este es un motor de plantillas que produce un documento web y una hoja de estilo utilizada para la presentación del documento. Esto permite separar el diseño del cuadro de información del contenido que manipula; [2] es decir, el diseño de la plantilla se puede actualizar sin afectar la información que contiene, y el nuevo diseño se propagará automáticamente a todos los artículos que incluyan el cuadro de información. [4] Por lo general, los cuadros de información tienen el formato para aparecer en la esquina superior derecha de un artículo de Wikipedia en la vista de escritorio, [3] o en la parte superior de la vista móvil.

La ubicación de un cuadro de información dentro del wikitexto de un artículo es importante para la accesibilidad . [7] Una mejor práctica es colocarlos después de las plantillas de desambiguación (aquellas que dirigen a los lectores a artículos sobre temas con nombres similares) y plantillas de mantenimiento (como las que marcan un artículo como sin referencia), pero antes de todo el resto del contenido . [8] [9]

Baeza-Yates y King dicen que algunos editores encuentran complicadas las plantillas como los cuadros de información, [10] ya que la plantilla puede ocultar texto sobre una propiedad o recurso que el editor desea cambiar; Esto se ve exacerbado por plantillas encadenadas, es decir, plantillas transcluidas dentro de otras plantillas. [10]

En agosto de 2009, Wikipedia en inglés utilizaba alrededor de 3.000 plantillas de cuadros de información que en conjunto utilizaban más de 20.000 atributos. [11] Desde entonces, muchas se han fusionado para reducir la redundancia. En junio de 2013, había al menos 1.345.446 transclusiones de la plantilla principal de cuadro de información , [12] utilizada por algunos, pero no todos, cuadros de información, en 4.251.127 artículos.

El nombre de un cuadro de información suele ser "Cuadro de información [género]"; sin embargo, a los cuadros de información más utilizados se les pueden asignar nombres más cortos, como "taxobox" para taxonomía. [8]

Aprendizaje automático

Aproximadamente el 44,2% de los artículos de Wikipedia contenían un cuadro de información en 2008, [13] y alrededor del 33% en 2010. [14] La extracción automatizada de conocimiento semántico utilizando algoritmos de aprendizaje automático se utiliza para "extraer información procesable por máquina a un costo de complejidad relativamente bajo". [1] Sin embargo, la baja cobertura lo hace más difícil, aunque esto puede superarse parcialmente complementando los datos del artículo con los de las categorías en las que se incluye el artículo. [13] La Wikipedia francesa inició el proyecto Infobox Versión 2 en mayo de 2011. [15] [16]

El conocimiento obtenido mediante el aprendizaje automático se puede utilizar para mejorar un artículo, por ejemplo, mediante sugerencias de software automatizadas a los editores para agregar datos del cuadro de información. [13] El proyecto iPopulator creó un sistema para agregar un valor al parámetro del cuadro de información de un artículo mediante un análisis automatizado del texto de ese artículo. [11]

DBpedia utiliza contenido estructurado extraído de cuadros de información [2] mediante algoritmos de aprendizaje automático para crear un recurso de datos vinculados en la Web Semántica ; Tim Berners-Lee lo ha descrito como "uno de los componentes más famosos" del proyecto de datos vinculados. [17]

La extracción mecánica crea un triple que consta de un sujeto, predicado o relación y objeto. [1] Cada par atributo-valor del cuadro de información se utiliza para crear una declaración RDF utilizando una ontología . [18] Esto se ve facilitado por la brecha más estrecha entre Wikipedia y una ontología que la que existe entre el texto libre o no estructurado y una ontología. [19]

La relación semántica entre sujeto y objeto la establece el predicado. [1] En el cuadro de información de ejemplo, la tripleta ("crostata", tipo, "tarta") indica que una crostata es un tipo de tarta . El tema del artículo se utiliza como asunto, el nombre del parámetro se utiliza como predicado y el valor del parámetro como objeto. [18] [1] Cada tipo de cuadro de información se asigna a una clase de ontología, y cada propiedad (parámetro) dentro de un cuadro de información se asigna a una propiedad de ontología. [20] Estas asignaciones se utilizan al analizar un artículo de Wikipedia para extraer datos.

Metadatos

Captura de pantalla de un enlace a este artículo publicado en los equipos de aplicaciones de Microsoft
Enlace a la publicación de este artículo en Microsoft Teams y la aplicación utilizando los metadatos del cuadro de información para completar el enlace agregando una imagen y un texto de resumen.

Al presentar los hechos básicos de un artículo dentro de un cuadro de información, también permite que los hechos se presenten de una manera amigable para la máquina, lo que permite una funcionalidad adicional, como cuando se pega un enlace a una Wikipedia en un programa compatible, en lugar de simplemente pegar el enlace en sí. También se publica otra información, como la imagen del artículo.

Citas

  1. ^ abcde Baeza-Yates y King 2009, p. 31.
  2. ^ abcde Liyang 2011, pag. 385.
  3. ^ ab Broughton 2008, pág. 357.
  4. ^ ab Broughton 2008, pág. 17.
  5. ^ a b C Broughton 2008, pag. 18.
  6. ^ Baeza-Yates y King 2009, pag. 30.
  7. ^ Broughton 2008, pag. 234.
  8. ^ ab Broughton 2008, pág. 235.
  9. ^ La política de Wikipedia en inglés sobre accesibilidad se especifica en Wikipedia: Manual de estilo/accesibilidad . La política sobre el diseño de wikitexto se especifica en Wikipedia: Manual de estilo/diseño y Wikipedia: Manual de estilo/sección principal .
  10. ^ ab Baeza-Yates y King 2009, p. 345.
  11. ^ ab Lange, Böhm y Naumann 2010, pág. 7.
  12. ^ "Herramientas Toolserver de Jarry1250: recuento de transclusiones de plantillas". Lista de proyectos de Wikimedia . 7 de junio de 2013 . Consultado el 7 de junio de 2013 .
  13. ^ abc Baeza-Yates y King 2009, p. 28.
  14. ^ Lange, Böhm y Naumann 2010, pág. 5.
  15. ^ Geertman, Reinhardt y Toppen 2011, pág. 493.
  16. ^ El proyecto está alojado en la página de Wikipedia en francés Infobox/V2.
  17. ^ Molinero 2008.
  18. ^ ab Liyang 2011, pág. 387.
  19. ^ Virvou y Matsuura 2012, pág. 315.
  20. ^ Liyang 2011, pag. 395.

Trabajos citados

Otras lecturas