stringtranslate.com

Recurso léxico

En lexicografía digital , procesamiento del lenguaje natural y humanidades digitales , un recurso léxico es un recurso lingüístico que consiste en datos sobre los lexemas del léxico de uno o más idiomas , por ejemplo, en forma de base de datos . [1]

Características

Existen diferentes estándares para la edición legible por máquina de recursos léxicos, por ejemplo, Lexical Markup Framework (LMF), un estándar ISO para codificar recursos léxicos, que comprende un modelo de datos abstracto y una serialización XML , [2] y OntoLex-Lemon , un vocabulario RDF para publicar recursos léxicos como gráficos de conocimiento en la web, por ejemplo, como Linguistic Linked Open Data . [3]

Dependiendo del tipo de idiomas al que se dirige, un recurso léxico puede ser calificado como monolingüe , bilingüe o multilingüe . Para los recursos léxicos bilingües y multilingües, las palabras pueden estar conectadas o no de un idioma a otro. Cuando están conectadas, la equivalencia de un idioma a otro se realiza a través de un enlace bilingüe (para recursos léxicos bilingües, p. ej., utilizando la relación vartrans:translatable, como en OntoLex-Lemon ) o a través de notaciones multilingües (para recursos léxicos multilingües, p. ej., por referencia al mismo ontolex:Concept en OntoLex-Lemon). [4]

También es posible construir y gestionar un recurso léxico formado por diferentes léxicos del mismo idioma, por ejemplo, un diccionario para palabras generales y uno o varios diccionarios para diferentes dominios especializados.

Diccionario legible por máquina vs. diccionario NLP

Los recursos léxicos en la lexicografía digital suelen denominarse diccionarios legibles por máquina ( MRD , por sus siglas en inglés), un diccionario almacenado como datos de una máquina (computadora) en lugar de estar impreso en papel. Es un diccionario electrónico y una base de datos léxica. El término MRD se contrasta a menudo con el término diccionario NLP , en el sentido de que un MRD es la forma electrónica de un diccionario que se imprimió previamente en papel. Aunque ambos son utilizados por programas, en cambio, se prefiere el término diccionario NLP cuando el diccionario se creó desde cero teniendo en cuenta el NLP. [5]

Base de datos léxica

Una base de datos léxica es un recurso léxico que tiene asociada una base de datos de entorno de software que permite acceder a su contenido. La base de datos puede estar diseñada a medida para la información léxica o puede ser una base de datos de uso general en la que se ha introducido información léxica.

La información que normalmente se almacena en una base de datos léxica incluye la ortografía , la categoría léxica y los sinónimos de las palabras, así como las relaciones semánticas y fonológicas entre diferentes palabras o conjuntos de palabras.

Véase también

Referencias

  1. ^ SARMA, Shikhar Kr, et al. Creación de recursos léxicos multilingües utilizando Wordnets: Estructura, diseño e implementación. En: Actas del 3.er Taller sobre Aspectos Cognitivos del Léxico . 2012. Págs. 161-170.
  2. ^ Francopoulo, Gil; Bel, Nuria; George, Monte; Calzolari, Nicoletta; Monachini, Monica; Pet, Mandy; Soria, Claudia (2009-03-01). "Recursos multilingües para PNL en el marco de marcado léxico (LMF)" (PDF) . Recursos lingüísticos y evaluación . 43 (1): 57–70. doi :10.1007/s10579-008-9077-5. ISSN  1574-0218. S2CID  7697316.
  3. ^ Cimiano, Philipp; Chiarcos, Christian; McCrae, John P.; Gracia, Jorge (2020), Datos vinculados lingüísticos: representación, generación y aplicaciones , Springer International Publishing, págs. 45–59, doi :10.1007/978-3-030-30225-2_4, ISBN 978-3-030-30225-2, Número de identificación del sujeto  214148590
  4. ^ Cimiano, Phillip; McCrae, John P.; Buitelaar, Paul. "Lexicon Model for Ontologies: Community Report, 10 May 2016 Final Community Group Report 10 May 2016". W3C . Consultado el 6 de diciembre de 2019 .
  5. ^ Gil Francopoulo (editado por) LMF Lexical Markup Framework, ISTE / Wiley 2013 ( ISBN 978-1-84821-430-9

Enlaces externos