stringtranslate.com

marconet

FrameNet es un grupo de bases de datos léxicas en línea basadas en la teoría del significado conocida como semántica de Frame , desarrollada por el lingüista Charles J. Fillmore . La noción fundamental del proyecto es simple: la mayoría de los significados de las palabras pueden entenderse mejor en términos de un marco semántico, que es una descripción de cierto tipo de evento, conexión o elemento y sus actores.

A modo de ilustración, el acto de cocinar generalmente requiere lo siguiente: un cocinero, los alimentos que se cocinan, un recipiente para contener los alimentos mientras se cocinan y un instrumento para calentar. [1] Dentro de FrameNet, este acto está representado por un marco llamado Apply_heat , y sus componentes ( Cook , Food , Container y Heating_instrument ) se denominan elementos de marco (FE). El marco Apply_heat también enumera una serie de palabras que lo representan, conocidas como unidades léxicas (LU), como freír , hornear , hervir y asar .

Otros marcos son más simples. Por ejemplo, Colocar sólo tiene un agente o causa, un tema —algo que se coloca— y el lugar donde se coloca. Algunos marcos son más complejos, como Venganza , que contiene más FE (infractor, lesión, parte perjudicada, vengador y castigo). [ cita necesaria ] Como en los ejemplos de Apply_heat y Revenge a continuación, la función de FrameNet es definir los marcos y anotar oraciones para demostrar cómo los FE encajan sintácticamente alrededor de la palabra que genera el marco. [1]

Conceptos

Marcos

Un marco es una representación esquemática de una situación que involucra a varios participantes, accesorios y otros roles conceptuales. Ejemplos de nombres de cuadros son Being_born y Locative_relation . Un marco en FrameNet contiene una descripción textual de lo que representa (una definición de marco), elementos de marco asociados, unidades léxicas, oraciones de ejemplo y relaciones de marco a marco.

Elementos del marco

Los elementos de marco (FE) proporcionan información adicional a la estructura semántica de una oración. Cada marco tiene una serie de FE centrales y no centrales que pueden considerarse roles semánticos. Las FE centrales son esenciales para el significado del marco, mientras que las FE no centrales son generalmente descriptivas (como tiempo, lugar, manera, etc.) [2] Por ejemplo:

FrameNet incluye datos superficiales sobre las funciones sintácticas que desempeñan los elementos del marco en las oraciones de ejemplo. Por ejemplo, para una oración como "Ella nació alrededor del 460 d. C.", FrameNet marcaría Ella como una frase nominal que se refiere al elemento del marco Niño y "alrededor del 460 d. C." como una frase nominal correspondiente al elemento del marco temporal . Los detalles de cómo se pueden realizar los elementos del marco en una oración son importantes porque revelan información importante sobre los marcos de subcategorización, así como posibles alternancias de diátesis (por ejemplo, "John rompió la ventana" frente a "La ventana se rompió") de un verbo.

Unidades léxicas

Las unidades léxicas (LU) son lemas, con su parte léxica, que evocan un marco específico. En otras palabras, cuando se identifica una LU en una oración, esa LU específica se puede asociar con sus marcos específicos. Para cada trama, puede haber muchas LU asociadas a esa trama y también puede haber muchas tramas que compartan una LU específica; Este suele ser el caso de las LU que tienen varios sentidos de palabras. [2] Además del marco, cada unidad léxica se asocia con elementos específicos del marco mediante frases de ejemplo anotadas.

Por ejemplo, las unidades léxicas que evocan el marco quejoso (o versiones perspectivizadas más específicas del mismo, para ser precisos), incluyen los verbos quejarse , quejarse , lamentarse y otros. [5]

Oraciones de ejemplo

Los marcos están asociados con oraciones de ejemplo y los elementos del marco están marcados dentro de las oraciones. Así, la sentencia

Nació alrededor del año 460 d.C.

está asociado con el marco Being_born , mientras que Ella está marcada como el elemento del marco Niño y "alrededor del 460 d. C." está marcado como Tiempo . [3]

Desde el principio, el proyecto FrameNet se ha comprometido a analizar evidencia del uso real del lenguaje tal como se encuentra en colecciones de textos como el British National Corpus . Basándose en estas oraciones de ejemplo, las herramientas automáticas de etiquetado de roles semánticos pueden determinar marcos y marcar elementos del marco en oraciones nuevas.

valencias

FrameNet también expone estadísticas sobre la valencia de cada cuadro; es decir, el número y la posición de los elementos del marco dentro de oraciones de ejemplo. La frase

Nació alrededor del año 460 d.C.

cae en el patrón de valencia

NP Ext, INI --, NP Dep

que ocurre dos veces en el informe de anotaciones de FrameNet para la unidad léxica born.v , [3] a saber:

Nació alrededor del año 460 d. C. , hija y nieta de emperadores romanos y bizantinos, cuya familia había sido prominente en la política romana durante más de 700 años.
Pronto fue destinado al norte de África y nunca conoció a su única hija, una hija nacida el 8 de junio de 1941 .

Relaciones de marco

FrameNet además captura relaciones entre diferentes marcos utilizando relaciones. Estos incluyen lo siguiente:

Aplicaciones

FrameNet ha demostrado ser útil en varias aplicaciones computacionales, porque las computadoras necesitan conocimiento adicional para reconocer que "John vendió un auto a Mary" y "Mary le compró un auto a John" describen esencialmente la misma situación, a pesar de usar dos diferentes verbos, diferentes preposiciones y un orden de palabras diferente. FrameNet se ha utilizado en aplicaciones como respuesta a preguntas , parafraseo , reconocimiento de implicaciones textuales y extracción de información , ya sea directamente o mediante herramientas de etiquetado de roles semánticos . El primer sistema automático para el etiquetado de roles semánticos (SRL, a veces también denominado "análisis semántico superficial") fue desarrollado por Daniel Gildea y Daniel Jurafsky basándose en FrameNet en 2002. [6] Desde entonces, el etiquetado de roles semánticos se ha convertido en una de las tareas estándar. en el procesamiento del lenguaje natural, con la última versión (1.7) de FrameNet ahora totalmente compatible con Natural Language Toolkit . [7]

Dado que los marcos son esencialmente descripciones semánticas, son similares en todos los idiomas, y a lo largo de los años han surgido varios proyectos que se han basado en el FrameNet original como base para FrameNets adicionales que no están en inglés, para español, japonés, alemán y polaco, entre otros. .

Ver también

Referencias

  1. ^ ab "¿Qué es FrameNet?". MarcoNet . Archivado desde el original el 3 de agosto de 2023 . Consultado el 9 de septiembre de 2023 .
  2. ^ ab "Glosario". MarcoNet . Archivado desde el original el 3 de agosto de 2023 . Consultado el 9 de septiembre de 2023 .
  3. ^ abc "Being_born.born.v (Anotación)". MarcoNet . Archivado desde el original el 9 de septiembre de 2023 . Consultado el 9 de septiembre de 2023 .
  4. ^ "Comercio_transferencia de bienes". MarcoNet . Archivado desde el original el 9 de septiembre de 2023 . Consultado el 9 de septiembre de 2023 .
  5. ^ "Quejarse". MarcoNet . Archivado desde el original el 9 de septiembre de 2023 . Consultado el 9 de septiembre de 2023 .
  6. ^ Gildea, Daniel; Jurafsky, Daniel (2002). "Etiquetado automático de roles semánticos" (PDF) . Ligüística computacional . 28 (3): 245–288. doi : 10.1162/089120102760275983 . S2CID  207747200.
  7. ^ Schneider, Nathan; Wooters, Chuck (2017). "La API NLTK FrameNet: diseño para la visibilidad con un rico recurso lingüístico". EMNLP 2017: Conferencia sobre Métodos Empíricos en Procesamiento del Lenguaje Natural . arXiv : 1703.07438 . Código Bib : 2017arXiv170307438S.

Otras lecturas

enlaces externos