stringtranslate.com

Marco Net

FrameNet es un grupo de bases de datos léxicas en línea basadas en la teoría del significado conocida como Frame semantics (semántica de marcos) , desarrollada por el lingüista Charles J. Fillmore . La noción fundamental del proyecto es simple: el significado de la mayoría de las palabras se puede entender mejor en términos de un marco semántico, que es una descripción de un determinado tipo de evento, conexión o elemento y sus actores.

A modo de ejemplo, el acto de cocinar normalmente requiere lo siguiente: un cocinero, la comida que se está cocinando, un recipiente para contener la comida mientras se cocina y un instrumento para calentar. [1] Dentro de FrameNet, este acto está representado por un marco llamado Apply_heat , y sus componentes ( Cook , Food , Container y Heating_instrument ) se conocen como elementos del marco (FEs). El marco Apply_heat también enumera una serie de palabras que lo representan, conocidas como unidades léxicas (LUs), como fry , bake , boiling y broil .

Otros marcos son más simples. Por ejemplo, Colocar solo tiene un agente o causa, un tema (algo que se coloca) y la ubicación donde se coloca. Algunos marcos son más complejos, como Venganza , que contiene más EF (infractor, lesión, parte lesionada, vengador y castigo). [ cita requerida ] Como en los ejemplos de Apply_heat y Venganza a continuación, el papel de FrameNet es definir los marcos y anotar oraciones para demostrar cómo las EF encajan sintácticamente alrededor de la palabra que genera el marco. [1]

Conceptos

Marcos

Un marco es una representación esquemática de una situación que involucra a varios participantes, elementos y otros roles conceptuales. Algunos ejemplos de nombres de marcos son Being_born y Locative_relation . Un marco en FrameNet contiene una descripción textual de lo que representa (una definición de marco), elementos de marco asociados, unidades léxicas, oraciones de ejemplo y relaciones de marco a marco.

Elementos del marco

Los elementos marco (EF) aportan información adicional a la estructura semántica de una oración. Cada marco tiene una serie de EF centrales y no centrales que pueden considerarse funciones semánticas. Los EF centrales son esenciales para el significado del marco, mientras que los no centrales son generalmente descriptivos (como el tiempo, el lugar, la manera, etc.) [2] Por ejemplo:

FrameNet incluye datos superficiales sobre los roles sintácticos que desempeñan los elementos de marco en las oraciones de ejemplo. Por ejemplo, para una oración como "Ella nació alrededor del año 460 d. C.", FrameNet marcaría " Ella " como una frase nominal que hace referencia al elemento de marco Niño , y "alrededor del año 460 d. C." como una frase nominal que corresponde al elemento de marco Tiempo . Los detalles de cómo se pueden realizar los elementos de marco en una oración son importantes porque esto revela información importante sobre los marcos de subcategorización, así como posibles alternancias de diátesis (por ejemplo, "Juan rompió la ventana" frente a "La ventana se rompió") de un verbo.

Unidades léxicas

Las unidades léxicas (UL) son lemas, con su parte gramatical, que evocan un marco específico. En otras palabras, cuando se identifica una UL en una oración, esa UL específica se puede asociar con su(s) marco(s) específico(s). Para cada marco, puede haber muchas UL asociadas a ese marco, y también puede haber muchos marcos que compartan una UL específica; este es típicamente el caso de las UL que tienen múltiples sentidos de palabras. [2] Junto con el marco, cada unidad léxica se asocia con elementos de marco específicos por medio de las oraciones de ejemplo anotadas.

Por ejemplo, las unidades léxicas que evocan el marco de queja (o versiones perspectivizadas más específicas de este, para ser precisos) incluyen los verbos quejarse , quejarse , lamentar y otros. [5]

Frases de ejemplo

Los marcos se asocian con oraciones de ejemplo y los elementos del marco se marcan dentro de las oraciones. Por lo tanto, la oración

Nació alrededor del año 460 d.C.

está asociado con el marco Being_born , mientras que She está marcada como el elemento de marco Child y "about AD 460" está marcado como Time . [3]

Desde el principio, el proyecto FrameNet se ha comprometido a analizar la evidencia del uso real del lenguaje que se encuentra en colecciones de textos como el Corpus Nacional Británico . Basándose en esas oraciones de ejemplo, las herramientas de etiquetado automático de roles semánticos pueden determinar marcos y marcar elementos de marco en oraciones nuevas.

Valencias

FrameNet también expone estadísticas sobre la valencia de cada marco, es decir, el número y la posición de los elementos del marco dentro de las oraciones de ejemplo. La oración

Nació alrededor del año 460 d.C.

cae en el patrón de valencia

NP Ext, INI --, NP Dep

que aparece dos veces en el informe de anotación de FrameNet para la unidad léxica born.v , [3] a saber:

Nació alrededor del año 460 d. C. , hija y nieta de emperadores romanos y bizantinos, cuya familia había sido prominente en la política romana durante más de 700 años.
Pronto fue destinado al norte de África y nunca conoció a su única hija, nacida el 8 de junio de 1941 .

Relaciones de marco

FrameNet también captura relaciones entre diferentes marcos mediante relaciones. Entre ellas se incluyen las siguientes:

Aplicaciones

FrameNet ha demostrado ser útil en varias aplicaciones computacionales, porque las computadoras necesitan conocimiento adicional para reconocer que "Juan vendió un auto a María" y "María le compró un auto a Juan" describen esencialmente la misma situación, a pesar de usar dos verbos bastante diferentes, preposiciones diferentes y un orden de palabras diferente. FrameNet se ha utilizado en aplicaciones como respuesta a preguntas , paráfrasis , reconocimiento de implicación textual y extracción de información , ya sea directamente o por medio de herramientas de etiquetado de roles semánticos . El primer sistema automático para el etiquetado de roles semánticos (SRL, a veces también denominado "análisis semántico superficial") fue desarrollado por Daniel Gildea y Daniel Jurafsky basado en FrameNet en 2002. [6] Desde entonces, el etiquetado de roles semánticos se ha convertido en una de las tareas estándar en el procesamiento del lenguaje natural, y la última versión (1.7) de FrameNet ahora es totalmente compatible con el kit de herramientas de lenguaje natural . [7]

Dado que los marcos son esencialmente descripciones semánticas, son similares en todos los idiomas, y a lo largo de los años han surgido varios proyectos que se han basado en el FrameNet original como base para FrameNets adicionales en otros idiomas, como español, japonés, alemán y polaco, entre otros.

Véase también

Referencias

  1. ^ ab "¿Qué es FrameNet?". FrameNet . Archivado desde el original el 2023-08-03 . Consultado el 2023-09-09 .
  2. ^ ab "Glosario". FrameNet . Archivado desde el original el 2023-08-03 . Consultado el 2023-09-09 .
  3. ^ abc "Being_born.born.v (Anotación)". FrameNet . Archivado desde el original el 2023-09-09 . Consultado el 2023-09-09 .
  4. ^ "Transferencia de bienes comerciales". FrameNet . Archivado desde el original el 2023-09-09 . Consultado el 2023-09-09 .
  5. ^ "Quejas". FrameNet . Archivado desde el original el 2023-09-09 . Consultado el 2023-09-09 .
  6. ^ Gildea, Daniel; Jurafsky, Daniel (2002). "Etiquetado automático de roles semánticos" (PDF) . Computational Linguistics . 28 (3): 245–288. doi : 10.1162/089120102760275983 . S2CID  207747200.
  7. ^ Schneider, Nathan; Wooters, Chuck (2017). "La API FrameNet de NLTK: diseño para la capacidad de descubrimiento con un recurso lingüístico enriquecido". EMNLP 2017: Conferencia sobre métodos empíricos en el procesamiento del lenguaje natural . arXiv : 1703.07438 . Código Bibliográfico :2017arXiv170307438S.

Lectura adicional

Enlaces externos