Una anotación es información adicional asociada a un punto particular de un documento u otra pieza de información. Puede ser una nota que incluye un comentario o una explicación. [1] Las anotaciones a veces se presentan en el margen de las páginas de los libros . Para anotaciones de diferentes medios digitales, consulte anotación web y anotación de texto .
Se dan cinco tipos de anotación: anotación LIDAR, anotación de imagen, anotación de texto, anotación de video, anotación de audio [2]
Las prácticas de anotación consisten en resaltar una frase u oración e incluir un comentario, encerrar en un círculo una palabra que necesita una definición, plantear una pregunta cuando algo no se entiende completamente y escribir un breve resumen de una sección clave. [3] También invita a los estudiantes a "(re)construir una historia a través de la participación en materiales y emocionantes prácticas de anotación DIY (Do-It-Yourself)". [4] Las prácticas de anotación que están disponibles en la actualidad ofrecen un conjunto notable de herramientas para que los estudiantes comiencen a trabajar, y de una manera más colaborativa y conectada de lo que había sido posible anteriormente. [5]
La anotación de textos y películas es una técnica que implica el uso de comentarios y textos dentro de una película. Analizar vídeos es una tarea que nunca está completamente libre de nociones preconcebidas, y el primer paso para los investigadores es orientarse dentro del campo de posibles enfoques de investigación y, por lo tanto, reflexionar sobre sus propias suposiciones básicas. [6] Las anotaciones pueden participar en el vídeo y pueden usarse cuando se graban los datos del vídeo. Se utilizan como una herramienta en textos y películas para escribir los pensamientos y emociones de uno en las marcas. [3] En cualquier número de pasos de análisis, también se puede complementar con más anotaciones. El antropólogo Clifford Geertz lo llama una "descripción densa". Esto puede dar una idea de lo útil que es la anotación, especialmente al agregar una descripción de cómo se puede implementar en una película. [6]
El término marginalia hace referencia a la escritura o decoración que se encuentra en los márgenes de un manuscrito. Los marginalia medievales son tan conocidos que los ejemplos divertidos o desconcertantes de ellos son el material de recopilación viral de agregadores como Buzzfeed y Brainpickings, y la fascinación por la lectura de otros lectores se manifiesta en sitios como Melville's Marginalia Online o la exhibición en línea de Harvard de marginalia de seis bibliotecas personales. [5] También puede ser parte de otros sitios web como Pinterest, o incluso de generadores de memes y herramientas de GIF.
La textualidad es una disciplina que a menudo utiliza la técnica de la anotación para describir o añadir contexto histórico adicional a textos y documentos físicos para facilitar su comprensión. [7]
Los estudiantes suelen resaltar pasajes de los libros para interactuar activamente con el texto. Pueden usar anotaciones para volver a consultar frases clave fácilmente o agregar notas al margen para ayudar a estudiar y encontrar conexiones entre el texto y conocimientos previos o temas recurrentes. [8]
Las bibliografías anotadas agregan comentarios sobre la relevancia o calidad de cada fuente, además de la información bibliográfica habitual que simplemente identifica la fuente.
Los estudiantes usan Annotation no solo con fines académicos, sino también para interpretar sus propios pensamientos, sentimientos y emociones. [3] Sitios como Scalar y Omeka son sitios que los estudiantes usan. Hay múltiples géneros con Annotation, como matemáticas, cine, lingüística y teoría literaria, que los estudiantes encuentran más útiles de usar. La mayoría de los estudiantes informaron que el proceso de anotación fue útil para mejorar la capacidad general de escritura, la gramática y el conocimiento del vocabulario académico.
Las expresiones matemáticas (símbolos y fórmulas) pueden anotarse con su significado en lenguaje natural. Esto es esencial para la desambiguación, ya que los símbolos pueden tener diferentes significados (por ejemplo, "E" puede ser "energía" o "valor esperado", etc.). [9] [10] El proceso de anotación puede facilitarse y acelerarse mediante recomendaciones, por ejemplo, utilizando el sistema "AnnoMathTeX" alojado por Wikimedia. [11] [12] [13]
Desde una perspectiva cognitiva, la anotación tiene un papel importante en el aprendizaje y la instrucción. Como parte de la observación guiada, implica resaltar, nombrar o etiquetar y comentar aspectos de las representaciones visuales para ayudar a centrar la atención de los estudiantes en aspectos visuales específicos. En otras palabras, significa la asignación de representaciones tipológicas (categorías culturalmente significativas) a representaciones topológicas (por ejemplo, imágenes). [14] Esto es especialmente importante cuando los expertos, como los médicos, interpretan las visualizaciones en detalle y explican sus interpretaciones a otros, por ejemplo, mediante tecnología digital. [15] En este caso, la anotación puede ser una forma de establecer un terreno común entre interactuantes con diferentes niveles de conocimiento. [16] El valor de la anotación se ha confirmado empíricamente, por ejemplo, en un estudio que muestra que en las teleconsultas basadas en computadora, la integración de la anotación de imágenes y el habla conduce a un intercambio de conocimiento significativamente mejorado en comparación con el uso de imágenes y habla sin anotación. [17]
Las anotaciones se eliminaron de YouTube el 15 de enero de 2019 después de aproximadamente una década de servicio. [18] Habían permitido a los usuarios proporcionar información que aparecía durante los videos, pero YouTube indicó que no funcionaban bien en pantallas móviles pequeñas y que se estaban abusando de ellas.
Los lenguajes de marcado como XML y HTML anotan texto de una manera que es sintácticamente distinguible de ese texto. Pueden usarse para agregar información sobre la presentación visual deseada o información semántica legible por máquina, como en la web semántica . [19]
Esto incluye CSV y XLS . El proceso de asignación de anotaciones semánticas a datos tabulares se conoce como etiquetado semántico. El etiquetado semántico es el proceso de asignar anotaciones de ontologías a datos tabulares. [20] [21] [22] [23] Este proceso también se conoce como anotación semántica. [24] [23] El etiquetado semántico a menudo se realiza de forma (semiautomática). Las técnicas de etiquetado semántico funcionan en columnas de entidad, [23] columnas numéricas, [20] [22] [25] [26] coordenadas, [27] y más. [27] [26]
Existen varios tipos de etiquetado semántico que utilizan técnicas de aprendizaje automático. Estas técnicas se pueden clasificar siguiendo el trabajo de Flach [28] [29] de la siguiente manera: geométricas (que utilizan líneas y planos, como la máquina de vectores de soporte o la regresión lineal ), probabilísticas (por ejemplo, el campo aleatorio condicional ), lógicas (por ejemplo, el aprendizaje de árboles de decisión ) y técnicas que no son de aprendizaje automático (por ejemplo, que equilibran la cobertura y la especificidad [23] ). Tenga en cuenta que los modelos de aprendizaje automático geométrico, probabilístico y lógico no son mutuamente excluyentes. [28]
Pham et al. [30] utilizan el índice de Jaccard y la similitud TF-IDF para los datos textuales y la prueba de Kolmogorov-Smirnov para los numéricos. Alobaid y Corcho [22] utilizan agrupamiento difuso (c-means [31] [32] ) para etiquetar columnas numéricas.
Limaye et al. [33] utiliza modelos gráficos y de similitud TF-IDF . También utilizan una máquina de vectores de soporte para calcular los pesos. Venetis et al. [34] construyen una base de datos isA que consta de pares (instancia, clase) y luego calculan la máxima verosimilitud utilizando estos pares. Alobaid y Corcho [35] aproximaron el gráfico qq para predecir las propiedades de las columnas numéricas.
Syed et al. [36] crearon Wikitology, que es "una base de conocimiento híbrida de información estructurada y no estructurada extraída de Wikipedia aumentada con datos RDF de DBpedia y otros recursos de Linked Data". [36] Para el índice de Wikitology, utilizan PageRank para la vinculación de entidades , que es una de las tareas que se utilizan a menudo en el etiquetado semántico. Como no pudieron consultar en Google todos los artículos de Wikipedia para obtener el PageRank , utilizaron un árbol de decisiones para aproximarlo. [36]
Alobaid y Corcho [23] presentaron un enfoque para anotar columnas de entidades. La técnica comienza anotando las celdas en la columna de entidades con las entidades del gráfico de conocimiento de referencia (por ejemplo, DBpedia ). Luego se reúnen las clases y se puntúa cada una de ellas en función de varias fórmulas que presentaron teniendo en cuenta la frecuencia de cada clase y su profundidad de acuerdo con la jerarquía de subclases. [37]
A continuación se presentan algunas de las tareas de etiquetado semántico más comunes presentadas en la literatura:
Esta es la tarea más común en el etiquetado semántico. Dado un texto de una celda y una fuente de datos, el enfoque predice la entidad y la vincula con la identificada en la fuente de datos dada. Por ejemplo, si la entrada al enfoque fuera el texto "Richard Feynman" y una URL al punto final SPARQL de DBpedia, el enfoque devolvería "http://dbpedia.org/resource/Richard_Feynman", que es la entidad de DBpedia. Algunos enfoques utilizan la coincidencia exacta [23] , mientras que otros utilizan métricas de similitud como la similitud de coseno [33].
La columna de asunto de una tabla es la columna que contiene los principales sujetos/entidades de la tabla. [20] [29] [34] [38] [39] Algunos enfoques esperan la columna de asunto como entrada [23] mientras que otros predicen la columna de asunto como TableMiner+. [39]
Los tipos de columnas se dividen de forma diferente según los distintos enfoques. [29] Algunos los dividen en cadenas/texto y números [22] [30] [40] [26] mientras que otros los dividen aún más [29] (por ejemplo, tipología de números, [20] fecha, [36] [34] coordenadas [41] ).
La relación entre Madrid y España es "capitalOf". [42] Estas relaciones se pueden encontrar fácilmente en ontologías, como DBpedia . Venetis et al. [34] utilizan TextRunner [43] para extraer la relación entre dos columnas. Syed et al. [36] utilizan la relación entre las entidades de las dos columnas y se selecciona la relación más frecuente.
T2D [44] es el estándar de oro más común para el etiquetado semántico. Existen dos versiones de T2D: T2Dv1 (a veces también se las denomina T2D) y T2Dv2. [44] Otros puntos de referencia conocidos se publican con el SemTab Challenge. [45]
La función "anotar" (también conocida como "culpar" o "elogiar") utilizada en sistemas de control de código fuente como Git , Team Foundation Server y Subversion determina quién realizó cambios en el código fuente en el repositorio. Esto genera una copia del código fuente donde cada línea está anotada con el nombre del último colaborador que editó esa línea (y posiblemente un número de revisión). Esto puede ayudar a establecer la culpa en caso de que un cambio haya causado un mal funcionamiento o identificar al autor de un código brillante.
Un caso especial es el lenguaje de programación Java , donde las anotaciones se pueden utilizar como una forma especial de metadatos sintácticos en el código fuente. [46] Las clases, métodos, variables, parámetros y paquetes se pueden anotar. Las anotaciones se pueden incrustar en archivos de clase generados por el compilador y pueden ser retenidas por la máquina virtual Java y, por lo tanto, influir en el comportamiento en tiempo de ejecución de una aplicación. Es posible crear metaanotaciones a partir de las existentes en Java. [47]
La anotación automática de imágenes se utiliza para clasificar imágenes para sistemas de recuperación de imágenes . [48]
Desde la década de 1980, la biología molecular y la bioinformática han creado la necesidad de la anotación del ADN . La anotación del ADN o anotación del genoma es el proceso de identificar las ubicaciones de los genes y todas las regiones codificantes de un genoma y determinar qué hacen esos genes. Una anotación (independientemente del contexto) es una nota añadida a modo de explicación o comentario. Una vez que se secuencia un genoma, es necesario anotarlo para que tenga sentido. [49]
En la comunidad de imágenes digitales , el término anotación se utiliza comúnmente para los metadatos visibles superpuestos en una imagen sin cambiar la imagen maestra subyacente, como notas adhesivas , punteros láser virtuales, círculos, flechas y oscurecimientos (cf. redacción ). [50]
En la comunidad de imágenes médicas , una anotación a menudo se denomina región de interés y está codificada en formato DICOM .
En los Estados Unidos, editoriales jurídicas como Thomson West y Lexis Nexis publican versiones anotadas de los estatutos , que proporcionan información sobre casos judiciales que han interpretado los estatutos. Tanto el Código federal de los Estados Unidos como los estatutos estatales están sujetos a la interpretación de los tribunales , y los estatutos anotados son herramientas valiosas en la investigación jurídica . [51]
Uno de los propósitos de la anotación es transformar los datos en una forma adecuada para el análisis asistido por computadora. Antes de la anotación, se define un esquema de anotación que generalmente consta de etiquetas. Durante el etiquetado, los transcriptores agregan manualmente etiquetas en las transcripciones donde se identifican las características lingüísticas requeridas en un editor de anotaciones. El esquema de anotación garantiza que las etiquetas se agreguen de manera consistente en todo el conjunto de datos y permite la verificación de datos etiquetados previamente. [52] Además de las etiquetas, las formas más complejas de anotación lingüística incluyen la anotación de frases y relaciones, por ejemplo, en treebanks . Se han desarrollado muchas formas diferentes de anotación lingüística, así como diferentes formatos y herramientas para crear y administrar anotaciones lingüísticas, como se describe, por ejemplo, en Linguistic Annotation Wiki. [53]
{{cite web}}
: CS1 maint: varios nombres: lista de autores ( enlace )