stringtranslate.com

Recurso léxico

En lexicografía digital , procesamiento del lenguaje natural y humanidades digitales , un recurso léxico es un recurso lingüístico que consta de datos sobre los lexemas del léxico de una o más lenguas , por ejemplo, en forma de una base de datos . [1]

Características

Existen diferentes estándares para la edición legible por máquina de recursos léxicos, por ejemplo, Lexical Markup Framework (LMF), un estándar ISO para codificar recursos léxicos, que comprende un modelo de datos abstracto y una serialización XML , [2] y OntoLex-Lemon , un vocabulario RDF. para publicar recursos léxicos como gráficos de conocimiento en la web, por ejemplo, como datos abiertos vinculados lingüísticos . [3]

Dependiendo del tipo de lenguas que se aborden, un recurso léxico puede calificarse como monolingüe , bilingüe o multilingüe . Para recursos léxicos bilingües y multilingües, las palabras pueden estar conectadas o no de un idioma a otro. Cuando está conectado, la equivalencia de un idioma a otro se realiza a través de un enlace bilingüe (para recursos léxicos bilingües, por ejemplo, usando la relación vartrans:translatable como en OntoLex-Lemon ) o mediante notaciones multilingües (para recursos léxicos multilingües, por ejemplo, por referencia a el mismo ontolex:Concepto en OntoLex-Lemon). [4]

También es posible crear y gestionar un recurso léxico que consta de diferentes léxicos del mismo idioma, por ejemplo, un diccionario para palabras generales y uno o varios diccionarios para diferentes dominios especializados.

Diccionario legible por máquina versus diccionario PNL

Los recursos léxicos en lexicografía digital a menudo se denominan diccionario legible por máquina ( MRD ), un diccionario almacenado como datos de máquina (computadora) en lugar de imprimirse en papel. Es un diccionario electrónico y una base de datos léxica. El término MRD a menudo se contrasta con el diccionario de PNL , en el sentido de que un MRD es la forma electrónica de un diccionario que antes se imponía en papel. Aunque ambos son utilizados por programas, por el contrario, se prefiere el término diccionario de PNL cuando el diccionario se creó desde cero teniendo en cuenta la PNL. [5]

Base de datos léxica

Una base de datos léxica es un recurso léxico que tiene asociada una base de datos de entorno de software que permite el acceso a su contenido. La base de datos puede diseñarse a medida para la información léxica o una base de datos de propósito general en la que se ha ingresado información léxica.

La información típicamente almacenada en una base de datos léxica incluye ortografía , categoría léxica y sinónimos de palabras, así como relaciones semánticas y fonológicas entre diferentes palabras o conjuntos de palabras.

Ver también

Referencias

  1. ^ SARMA, Shikhar Kr y otros. Construcción de recursos léxicos multilingües utilizando wordnets: estructura, diseño e implementación. En: Actas del 3er Taller sobre Aspectos Cognitivos del Léxico . 2012. S. 161-170.
  2. ^ Francopoulo, Gil; Bel, Nuria; Jorge, Monte; Calzolari, Nicoletta; Monachini, Mónica; Mascota, Mandy; Soria, Claudia (1 de marzo de 2009). "Recursos multilingües para PNL en el marco de marcado léxico (LMF)" (PDF) . Evaluación y recursos lingüísticos . 43 (1): 57–70. doi :10.1007/s10579-008-9077-5. ISSN  1574-0218. S2CID  7697316.
  3. ^ Cimiano, Philipp; Chiarcos, Cristiano; McCrae, John P.; Gracia, Jorge (2020), Datos vinculados lingüísticos: representación, generación y aplicaciones , Springer International Publishing, págs. 45–59, doi :10.1007/978-3-030-30225-2_4, ISBN 978-3-030-30225-2, S2CID  214148590
  4. ^ Cimiano, Felipe; McCrae, John P.; Buitelaar, Pablo. "Modelo Lexicon para ontologías: Informe de la comunidad, 10 de mayo de 2016 Informe final del grupo comunitario 10 de mayo de 2016". W3C . Consultado el 6 de diciembre de 2019 .
  5. ^ Gil Francopoulo (editado por) LMF Lexical Markup Framework, ISTE / Wiley 2013 ( ISBN 978-1-84821-430-9

enlaces externos