En lexicografía digital , procesamiento del lenguaje natural y humanidades digitales , un recurso léxico es un recurso lingüístico que consiste en datos sobre los lexemas del léxico de uno o más idiomas , por ejemplo, en forma de base de datos . [1]
Existen diferentes estándares para la edición legible por máquina de recursos léxicos, por ejemplo, Lexical Markup Framework (LMF), un estándar ISO para codificar recursos léxicos, que comprende un modelo de datos abstracto y una serialización XML , [2] y OntoLex-Lemon , un vocabulario RDF para publicar recursos léxicos como gráficos de conocimiento en la web, por ejemplo, como Linguistic Linked Open Data . [3]
Dependiendo del tipo de idiomas al que se dirige, un recurso léxico puede ser calificado como monolingüe , bilingüe o multilingüe . Para los recursos léxicos bilingües y multilingües, las palabras pueden estar conectadas o no de un idioma a otro. Cuando están conectadas, la equivalencia de un idioma a otro se realiza a través de un enlace bilingüe (para recursos léxicos bilingües, p. ej., utilizando la relación vartrans:translatable, como en OntoLex-Lemon ) o a través de notaciones multilingües (para recursos léxicos multilingües, p. ej., por referencia al mismo ontolex:Concept en OntoLex-Lemon). [4]
También es posible construir y gestionar un recurso léxico formado por diferentes léxicos del mismo idioma, por ejemplo, un diccionario para palabras generales y uno o varios diccionarios para diferentes dominios especializados.
Los recursos léxicos en la lexicografía digital suelen denominarse diccionarios legibles por máquina ( MRD , por sus siglas en inglés), un diccionario almacenado como datos de una máquina (computadora) en lugar de estar impreso en papel. Es un diccionario electrónico y una base de datos léxica. El término MRD se contrasta a menudo con el término diccionario NLP , en el sentido de que un MRD es la forma electrónica de un diccionario que se imprimió previamente en papel. Aunque ambos son utilizados por programas, en cambio, se prefiere el término diccionario NLP cuando el diccionario se creó desde cero teniendo en cuenta el NLP. [5]
Una base de datos léxica es un recurso léxico que tiene asociada una base de datos de entorno de software que permite acceder a su contenido. La base de datos puede estar diseñada a medida para la información léxica o puede ser una base de datos de uso general en la que se ha introducido información léxica.
La información que normalmente se almacena en una base de datos léxica incluye la ortografía , la categoría léxica y los sinónimos de las palabras, así como las relaciones semánticas y fonológicas entre diferentes palabras o conjuntos de palabras.