En los sistemas de información , una etiqueta es una palabra clave o término asignado a una pieza de información (como un marcador de Internet , un archivo multimedia , un registro de una base de datos o un archivo informático ). Este tipo de metadatos ayuda a describir un elemento y permite encontrarlo nuevamente mediante una búsqueda o navegación. [1] Las etiquetas generalmente son elegidas de manera informal y personal por el creador del elemento o por su lector, según el sistema, aunque también pueden elegirse de un vocabulario controlado . [2] : 68
El etiquetado se popularizó en los sitios web asociados con la Web 2.0 y es una característica importante de muchos servicios de la Web 2.0. [2] [3] Ahora también es parte de otros sistemas de bases de datos , aplicaciones de escritorio y sistemas operativos . [4]
Las personas utilizan etiquetas para facilitar la clasificación , marcar la propiedad, señalar los límites e indicar la identidad en línea . Las etiquetas pueden adoptar la forma de palabras, imágenes u otras marcas de identificación. Un ejemplo análogo de etiquetas en el mundo físico es el etiquetado de objetos de museo . Las personas utilizaban palabras clave textuales para clasificar información y objetos mucho antes de que existieran las computadoras. Los algoritmos de búsqueda basados en computadoras hicieron que el uso de dichas palabras clave fuera una forma rápida de explorar registros.
El etiquetado ganó popularidad debido al crecimiento de los marcadores sociales , el intercambio de imágenes y los sitios web de redes sociales . [2] Estos sitios permiten a los usuarios crear y administrar etiquetas (o "etiquetas") que categorizan el contenido utilizando palabras clave simples. Los sitios web que incluyen etiquetas a menudo muestran colecciones de etiquetas como nubes de etiquetas , [a] al igual que algunas aplicaciones de escritorio. [b] En los sitios web que agregan las etiquetas de todos los usuarios, las etiquetas de un usuario individual pueden ser útiles tanto para ellos como para la comunidad más grande de usuarios del sitio web.
Los sistemas de etiquetado a veces se han clasificado en dos tipos: de arriba hacia abajo y de abajo hacia arriba . [3] : 142 [4] : 24 Las taxonomías de arriba hacia abajo son creadas por un grupo autorizado de diseñadores (a veces en forma de un vocabulario controlado ), mientras que las taxonomías de abajo hacia arriba (llamadas folksonomías ) son creadas por todos los usuarios. [3] : 142 Esta definición de "arriba hacia abajo" y "abajo hacia arriba" no debe confundirse con la distinción entre una única estructura de árbol jerárquico (en la que hay una forma correcta de clasificar cada elemento) frente a múltiples conjuntos no jerárquicos (en los que hay varias formas de clasificar un elemento); la estructura de las taxonomías de arriba hacia abajo y de abajo hacia arriba puede ser jerárquica, no jerárquica o una combinación de ambas. [3] : 142–143 Algunos investigadores y aplicaciones han experimentado con la combinación de etiquetado jerárquico y no jerárquico para ayudar en la recuperación de información. [7] [8] [9] Otros combinan el etiquetado de arriba hacia abajo y de abajo hacia arriba, [10] incluso en algunos grandes catálogos de bibliotecas ( OPAC ) como WorldCat . [11] [12] : 74 [13] [14]
Cuando las etiquetas u otras taxonomías tienen propiedades adicionales (o semánticas ), como relaciones y atributos , constituyen una ontología . [3] : 56–62
Las etiquetas de metadatos descritas en este artículo no deben confundirse con el uso de la palabra "etiqueta" en algún software para referirse a una referencia cruzada generada automáticamente ; ejemplos de esto último son las tablas de etiquetas en Emacs [15] y las etiquetas inteligentes en Microsoft Office . [16]
El uso de palabras clave como parte de un sistema de identificación y clasificación es muy anterior a la aparición de las computadoras. Los dispositivos de almacenamiento de datos en papel , en particular las tarjetas con muescas en los bordes , que permitían la clasificación y ordenación según múltiples criterios, ya se utilizaban antes del siglo XX, y la clasificación por facetas se ha utilizado en las bibliotecas desde la década de 1930.
A finales de la década de 1970 y principios de la de 1980, Emacs , el editor de texto para sistemas Unix , ofreció un programa de software complementario llamado Tags que podía construir automáticamente una tabla de referencias cruzadas llamada tabla de etiquetas que Emacs podía usar para saltar entre una llamada de función y la definición de esa función. [17] Este uso de la palabra "etiqueta" no se refería a las etiquetas de metadatos, sino que era un uso temprano de la palabra "etiqueta" en el software para referirse a un índice de palabras .
Las bases de datos en línea y los primeros sitios web utilizaban etiquetas de palabras clave como una forma de que los editores ayudaran a los usuarios a encontrar contenido. En los primeros días de la World Wide Web , los diseñadores web utilizaban el keywords
elemento meta para indicar a los motores de búsqueda de qué trataba la página web, pero estas palabras clave solo eran visibles en el código fuente de una página web y los usuarios no podían modificarlas.
En 1997, el portal colaborativo "A Description of the Equator and Some ØtherLands" (Una descripción del Ecuador y algunas otras tierras) producido por documenta X, Alemania, utilizó el término folksonómico Tag (etiqueta) para sus coautores y autores invitados en su página Upload (Cargar contenido). [18] En "The Equator" (El Ecuador), el término Tag (etiqueta) para la entrada del usuario se describió como un literal abstracto o una palabra clave para ayudar al usuario. Sin embargo, los usuarios definieron Tags singulares y no compartieron Tags en ese momento.
En 2003, el sitio web de marcadores sociales Delicious proporcionó una forma para que sus usuarios añadieran "etiquetas" a sus marcadores (como una forma de ayudarlos a encontrarlos más tarde); [2] : 162 Delicious también proporcionó vistas agregadas navegables de los marcadores de todos los usuarios que presentaban una etiqueta en particular. [19] En un par de años, el sitio web para compartir fotografías Flickr permitió a sus usuarios agregar sus propias etiquetas de texto a cada una de sus imágenes, construyendo metadatos flexibles y fáciles que hicieron que las imágenes fueran altamente buscables. [20] El éxito de Flickr y la influencia de Delicious popularizaron el concepto, [21] y otros sitios web de software social , como YouTube , Technorati y Last.fm , también implementaron el etiquetado. [22] En 2005, el estándar de sindicación web Atom proporcionó un elemento de "categoría" para insertar categorías temáticas en los feeds web , y en 2007 Tim Bray propuso una URN de "etiqueta" . [23]
Muchos sistemas (y otros sistemas de gestión de contenido web ) permiten a los autores añadir etiquetas de formato libre a una entrada, junto con (o en lugar de) colocar la entrada en una categoría predeterminada. [a] Por ejemplo, una entrada puede mostrar que ha sido etiquetada con baseball
y tickets
. Cada una de esas etiquetas suele ser un enlace web que conduce a una página de índice que enumera todas las entradas asociadas con esa etiqueta. El blog puede tener una barra lateral que enumera todas las etiquetas en uso en ese blog, y cada etiqueta conduce a una página de índice. Para reclasificar una entrada, un autor edita su lista de etiquetas. Todas las conexiones entre las entradas son rastreadas y actualizadas automáticamente por el software del blog; no hay necesidad de reubicar la página dentro de una jerarquía compleja de categorías.
Algunas aplicaciones de escritorio y aplicaciones web cuentan con sus propios sistemas de etiquetado, como el etiquetado de correo electrónico en Gmail y Mozilla Thunderbird , [12] : 73 etiquetado de marcadores en Firefox , [24] etiquetado de audio en iTunes o Winamp y etiquetado de fotos en varias aplicaciones. [25] Algunas de estas aplicaciones muestran colecciones de etiquetas como nubes de etiquetas . [b]
Existen varios sistemas para aplicar etiquetas a los archivos en el sistema de archivos de una computadora .
En el Mac System 7 de Apple , lanzado en 1991, los usuarios podían asignar una de siete etiquetas de colores editables (con nombres editables como "Esencial", "Activo" y "En progreso") a cada archivo y carpeta. [26] En iteraciones posteriores del sistema operativo Mac desde que se lanzó OS X 10.9 en 2013, los usuarios podían asignar múltiples etiquetas arbitrarias como atributos de archivo extendidos a cualquier archivo o carpeta, [27] y antes de esa fecha, el estándar de código abierto OpenMeta proporcionaba una funcionalidad de etiquetado similar para Mac OS X. [ 28]
Hay varios sistemas de archivos semánticos que implementan etiquetas disponibles para el kernel de Linux , incluido Tagsistant . [29]
Microsoft Windows permite a los usuarios establecer etiquetas sólo en documentos de Microsoft Office y algunos tipos de archivos de imágenes. [30]
Los estándares de etiquetado de archivos multiplataforma incluyen Extensible Metadata Platform (XMP), un estándar ISO para incrustar metadatos en formatos de archivos de imágenes, videos y documentos populares, como JPEG y PDF , sin afectar su legibilidad por parte de aplicaciones que no admiten XMP. [31] XMP reemplaza en gran medida al anterior IPTC Information Interchange Model . Exif es un estándar que especifica los formatos de archivos de imagen y audio utilizados por las cámaras digitales , incluidas algunas etiquetas de metadatos. [32] TagSpaces es una aplicación multiplataforma de código abierto para etiquetar archivos; inserta etiquetas en el nombre del archivo . [33]
Una etiqueta oficial es una palabra clave adoptada por los eventos y conferencias para que los participantes la utilicen en sus publicaciones web, como entradas de blog, fotos del evento y diapositivas de presentaciones. [34] Los motores de búsqueda pueden indexarlas para que los materiales relevantes relacionados con el evento se puedan buscar de manera uniforme. En este caso, la etiqueta es parte de un vocabulario controlado .
Un investigador puede trabajar con una gran colección de elementos (por ejemplo, citas de prensa, una bibliografía, imágenes) en formato digital. Si desea asociar cada uno de ellos con un pequeño número de temas (por ejemplo, capítulos de un libro o subtemas del tema general), puede adjuntar un grupo de etiquetas para estos temas a cada uno de los elementos de la colección más grande. [35] De esta manera, la clasificación de formato libre permite al autor gestionar cantidades de información que de otro modo serían difíciles de manejar. [36]
Una etiqueta triple o etiqueta de máquina utiliza una sintaxis especial para definir información semántica adicional sobre la etiqueta, lo que hace que sea más fácil o más significativa para su interpretación por parte de un programa informático. [37] Las etiquetas triples comprenden tres partes: un espacio de nombres , un predicado y un valor. Por ejemplo, es una etiqueta para la coordenada de longitudgeo:long=50.123456
geográfica cuyo valor es 50.123456. Esta estructura triple es similar al modelo de Resource Description Framework para la información.
El formato de triple etiqueta fue ideado por primera vez para geolicious en noviembre de 2004, [38] para mapear los marcadores de Delicious , y ganó una mayor aceptación después de su adopción por Mappr y GeoBloggers para mapear las fotos de Flickr . [39] En enero de 2007, Aaron Straup Cope en Flickr introdujo el término etiqueta de máquina como un nombre alternativo para la triple etiqueta, agregando algunas preguntas y respuestas sobre el propósito, la sintaxis y el uso. [40]
Los metadatos especializados para la identificación geográfica se conocen como geoetiquetado ; las etiquetas de máquina también se utilizan para otros fines, como identificar fotos tomadas en un evento específico o nombrar especies utilizando nomenclatura binomial . [41]
Un hashtag es un tipo de etiqueta de metadatos marcada con el prefijo #
, a veces conocido como símbolo "hash". Esta forma de etiquetado se utiliza en servicios de microblogging y redes sociales como Twitter , Facebook , Google+ , VK e Instagram . El hash se utiliza para distinguir el texto de la etiqueta, como algo distinto, de otro texto en la publicación.
Una etiqueta de conocimiento es un tipo de metainformación que describe o define algún aspecto de una pieza de información (como un documento , una imagen digital , una tabla de base de datos o una página web ). [42] Las etiquetas de conocimiento son más que palabras clave o términos no jerárquicos tradicionales ; son un tipo de metadatos que capturan el conocimiento en forma de descripciones, categorizaciones, clasificaciones, semántica , comentarios, notas, anotaciones, hiperdatos , hipervínculos o referencias que se recopilan en perfiles de etiquetas (una especie de ontología ). [42] Estos perfiles de etiquetas hacen referencia a un recurso de información que reside en un repositorio de almacenamiento distribuido y, a menudo, heterogéneo. [42]
Las etiquetas de conocimiento son parte de una disciplina de gestión del conocimiento que aprovecha las metodologías Enterprise 2.0 para que los usuarios capturen información, experiencia, atributos, dependencias o relaciones asociadas con un recurso de datos. [3] : 251 [43] Se pueden capturar diferentes tipos de conocimiento en las etiquetas de conocimiento, incluido el conocimiento fáctico (que se encuentra en libros y datos), el conocimiento conceptual (que se encuentra en perspectivas y conceptos), el conocimiento expectacional (necesario para hacer juicios e hipótesis) y el conocimiento metodológico (derivado del razonamiento y las estrategias). [43] Estas formas de conocimiento a menudo existen fuera de los datos en sí y se derivan de la experiencia personal, la percepción o la experiencia. Las etiquetas de conocimiento se consideran una expansión de la información en sí que agrega valor, contexto y significado adicionales a la información. Las etiquetas de conocimiento son valiosas para preservar la inteligencia organizacional que a menudo se pierde debido a la rotación , para compartir el conocimiento almacenado en las mentes de las personas que normalmente está aislado y no aprovechado por la organización, y para conectar el conocimiento que a menudo se pierde o se desconecta de un recurso de información. [44]
En un sistema de etiquetado típico, no hay información explícita sobre el significado o la semántica de cada etiqueta, y un usuario puede aplicar nuevas etiquetas a un elemento con la misma facilidad con la que aplicaba etiquetas antiguas. [2] Los sistemas de clasificación jerárquica pueden cambiar lentamente y tienen sus raíces en la cultura y la era que los crearon; por el contrario, la flexibilidad del etiquetado permite a los usuarios clasificar sus colecciones de elementos de la manera que les resulte útil, pero la variedad personalizada de términos puede presentar desafíos al buscar y navegar.
Cuando los usuarios pueden elegir libremente las etiquetas (creando una folksonomía , en lugar de seleccionar términos de un vocabulario controlado ), los metadatos resultantes pueden incluir homónimos (las mismas etiquetas utilizadas con diferentes significados) y sinónimos (múltiples etiquetas para el mismo concepto), lo que puede llevar a conexiones inapropiadas entre elementos y búsquedas ineficientes de información sobre un tema. [45] Por ejemplo, la etiqueta "naranja" puede referirse a la fruta o al color , y los elementos relacionados con una versión del núcleo de Linux pueden etiquetarse como "Linux", "núcleo", "pingüino", "software" o una variedad de otros términos. Los usuarios también pueden elegir etiquetas que sean diferentes inflexiones de palabras (como singular y plural), [46] lo que puede contribuir a dificultades de navegación si el sistema no incluye la derivación de etiquetas al buscar o navegar. Las folksonomías a mayor escala abordan algunos de los problemas del etiquetado, en el sentido de que los usuarios de los sistemas de etiquetado tienden a notar el uso actual de "términos de etiqueta" dentro de estos sistemas y, por lo tanto, usan las etiquetas existentes para formar fácilmente conexiones con elementos relacionados. De este modo, las folksonomías pueden desarrollar colectivamente un conjunto parcial de convenciones de etiquetado.
A pesar de la aparente falta de control, las investigaciones han demostrado que en los sistemas de marcadores sociales surge una forma simple de vocabulario compartido. El etiquetado colaborativo exhibe una forma de dinámica de sistemas complejos (o dinámica de autoorganización ). [47] Por lo tanto, incluso si no hay un vocabulario central controlado que restrinja las acciones de los usuarios individuales, la distribución de etiquetas converge con el tiempo hacia distribuciones estables de ley de potencia . [47] Una vez que se forman tales distribuciones estables, se pueden extraer vocabularios folksonómicos simples examinando las correlaciones que se forman entre diferentes etiquetas. Además, las investigaciones han sugerido que es más fácil para los algoritmos de aprendizaje automático aprender la semántica de las etiquetas cuando los usuarios etiquetan "verbosamente", es decir, cuando anotan recursos con una gran cantidad de palabras clave descriptivas libremente asociadas. [48]
Los sistemas de etiquetado abiertos al público también están expuestos al spam de etiquetas, en el que las personas aplican una cantidad excesiva de etiquetas o etiquetas no relacionadas a un elemento (como un video de YouTube ) con el fin de atraer espectadores. Este abuso se puede mitigar mediante la identificación humana o estadística de elementos de spam. [49] La cantidad de etiquetas permitidas también se puede limitar para reducir el spam.
Algunos sistemas de etiquetado proporcionan un único cuadro de texto para introducir etiquetas, por lo que para poder convertir la cadena en tokens , se debe utilizar un separador. Dos separadores populares son el carácter de espacio y la coma . Para permitir el uso de separadores en las etiquetas, un sistema puede permitir separadores de nivel superior (como comillas ) o caracteres de escape . Los sistemas pueden evitar el uso de separadores permitiendo que solo se agregue una etiqueta a cada widget de entrada a la vez, aunque esto hace que agregar varias etiquetas lleve más tiempo.
Una sintaxis para usar dentro de HTML es utilizar el microformato rel-tag que utiliza el atributo rel con valor "tag" (es decir, ) para indicar que la página vinculada actúa como una etiqueta para el contexto actual. [50]rel="tag"
Al igual que con todas las demás opciones aquí, se pueden agregar metadatos a archivos individuales para ayudar a mejorar su capacidad de búsqueda y, de manera única, el campo de nube de etiquetas dentro de la interfaz de Leap le permite explorar rápidamente los archivos etiquetados individualmente sin problemas.
Llamar a una función definida en una unidad de compilación desde otra es análogo a las referencias cruzadas en documentos de hipertexto de gran tamaño. Mediante el uso de tablas de etiquetas, el entorno Emacs permite al usuario convertir el código fuente del programa en potentes documentos de hipertexto.
Puede activar etiquetas inteligentes para un campo a fin de facilitar la referencia cruzada de datos entre la base de datos de Access y Microsoft Outlook (u otro programa de información personal y correo electrónico) y la Web.
EMACS es un editor de pantalla del MIT diseñado para ser "extensible, personalizable y autodocumentado" [...] Otra función interesante para la edición de programas es el paquete TAGS. El programa independiente TAGS crea una tabla TAGS que contiene el nombre del archivo y la posición en ese archivo en el que se define cada función del programa de aplicación. Esta tabla se carga en EMACS; al especificar el comando Meta,
nombre de función
, EMACS selecciona el archivo apropiado y va a la definición de función adecuada dentro de ese archivo.
Stewart Butterfield quería agregarlas. Le gustaba la forma en que funcionaban en del.icio.us, la aplicación de marcadores sociales. Agregamos una funcionalidad de etiquetado muy simple, de modo que pudieras etiquetar tus fotos y luego ver todas tus fotos con una etiqueta en particular, o las fotos de cualquier persona con una etiqueta en particular. Poco después, los usuarios comenzaron a decirnos que lo realmente interesante sobre el etiquetado no era solo cómo habías etiquetado tus fotos, sino cómo toda la comunidad de Flickr había estado etiquetando fotos. Entonces comenzamos a ver muchas solicitudes de los usuarios para poder ver una vista global del paisaje de etiquetas.