BulNet ( BulNet ) es un diccionario electrónico multilingüe de conjuntos de sinónimos junto con sus definiciones explicativas y conjuntos de relaciones semánticas con otras palabras del idioma. [1] [2]
Sigue el marco Princeton WordNet (PWN) que implementa las redes semánticas tradicionales cuya estructura consiste en nodos y relaciones entre los nodos. [3] [4] [5]
BulNet se inició en el marco del proyecto financiado por la UE BalkaNet - Red semántica multilingüe de las lenguas de los Balcanes. Tras la finalización de BalkaNet, el desarrollo de BulNet continuó con el apoyo del gobierno búlgaro.
En 2015, BulNet contenía más de 80.000 conjuntos de sinónimos distribuidos en nueve partes del discurso: sustantivos, verbos, adjetivos, adverbios, pronombres, preposiciones , conjunciones , partículas e interjecciones .
Las palabras incluidas en BulNet han sido seleccionadas según diferentes criterios. Los criterios principales son el análisis de frecuencia de las apariciones de palabras en grandes corpus de texto y la inclusión de synsets . Los synsets incluyen aquellos que ya aparecen en las redes de palabras de otros idiomas y synsets que corresponden a significados de palabras de alta frecuencia que se encuentran en corpus paralelos.
Cada synset codifica la relación de equivalencia entre un número de elementos léxicos —LITERALES (al menos uno debe estar representado explícitamente en el SYNSET), cada uno de ellos con un significado único (especificado por el valor de SENSE) — que pertenecen a una misma parte del discurso (especificado como el valor de POS) y representan un mismo significado léxico (especificado como el valor de DEF). Cada synset está vinculado a su homólogo en PWN 3.0 por medio de un número de identificación único —ID—. Los synsets comunes en las lenguas balcánicas están marcados como subconjuntos de conceptos comunes —BCS— .
En una base de datos monolingüe , un synset debe estar vinculado a al menos otro synset mediante una relación intralingüística. También se puede codificar información no obligatoria, como ejemplos de uso, peculiaridades estilísticas, propiedades morfológicas o sintácticas, autor y detalles de la última edición.
La gran cantidad de relaciones codificadas en BulNet ilustra de manera efectiva la riqueza semántica y derivativa del lenguaje, que ofrece diversas oportunidades para numerosas aplicaciones de la base de datos multilingüe. BulNet ofrece soluciones lingüísticas a nivel semántico, como opciones para la selección de sinónimos, consultas de relaciones semánticas de una palabra en el sistema léxico del idioma ( antonimia , holonimia , etc.), consultas de definición explicativa y equivalentes de traducción para un elemento léxico.
BulNet es un diccionario electrónico multilingüe de conjuntos de sinónimos junto con sus definiciones explicativas y conjuntos de relaciones semánticas con otras palabras del idioma. [1] [2]
Hydra es un sistema independiente del sistema operativo diseñado para el desarrollo, validación y exploración de WordNet. El programa permite a los usuarios explorar y editar cualquier cantidad de WordNet monolingües a la vez. Las WordNet individuales están sincronizadas, de modo que se pueden ver y explorar conjuntos de sinónimos equivalentes, o synsets, en paralelo. [6]
{{cite web}}
: CS1 maint: copia archivada como título ( enlace )