Red de palabras

WordNet es una base de datos léxica de relaciones semánticas entre palabras que vincula las palabras en relaciones semánticas, incluyendo sinónimos , hipónimos y merónimos . Los sinónimos se agrupan en synsets con definiciones breves y ejemplos de uso. Por lo tanto, puede verse como una combinación y extensión de un diccionario y un tesauro . Si bien es accesible para usuarios humanos a través de un navegador web , ^[2] su uso principal es en análisis de texto automático y aplicaciones de inteligencia artificial . Se creó por primera vez en el idioma inglés ^[3] y la base de datos y las herramientas de software de WordNet en inglés se han publicado bajo una licencia de estilo BSD y están disponibles de forma gratuita para su descarga desde ese sitio web de WordNet. Ahora hay WordNets en más de 200 idiomas. ^[4]

Historia y miembros del equipo

WordNet fue creado por primera vez en 1985, sólo en inglés, en el Laboratorio de Ciencias Cognitivas de la Universidad de Princeton bajo la dirección del profesor de psicología George Armitage Miller . Más tarde fue dirigido por Christiane Fellbaum . El proyecto fue financiado inicialmente por la Oficina de Investigación Naval de los EE. UU., y más tarde también por otras agencias gubernamentales de los EE. UU., incluyendo la DARPA , la Fundación Nacional de la Ciencia , la Oficina de Tecnología Disruptiva (anteriormente la Actividad de Investigación y Desarrollo Avanzado) y REFLEX. George Miller y Christiane Fellbaum recibieron el Premio Antonio Zampolli 2006 por su trabajo con WordNet.

La Asociación Global WordNet es una organización sin fines de lucro que ofrece una plataforma para debatir, compartir y conectar WordNets de todos los idiomas del mundo. Christiane Fellbaum y Piek Th.JM Vossen son sus copresidentes. ^[5]

Contenido de la base de datos

La base de datos contiene 155.327 palabras organizadas en 175.979 conjuntos de sinónimos para un total de 207.016 pares de palabras-sentidos; en forma comprimida , tiene un tamaño de aproximadamente 12 megabytes . ^[6]

Incluye las categorías léxicas sustantivos , verbos , adjetivos y adverbios, pero ignora preposiciones , determinantes y otras palabras funcionales.

Las palabras de la misma categoría léxica que son aproximadamente sinónimas se agrupan en synsets , que incluyen palabras simples y colocaciones como "eat out" y "car pool". Los diferentes sentidos de una forma de palabra polisémica se asignan a diferentes synsets. El significado de un synset se aclara aún más con una breve glosa definitoria y uno o más ejemplos de uso. Un ejemplo de synset de adjetivos es:

bueno, correcto, maduro – (más adecuado o correcto para un propósito particular; "un buen momento para plantar tomates"; "el momento adecuado para actuar"; "el momento está maduro para grandes cambios sociológicos")

Todos los synsets están conectados por medio de relaciones semánticas. Estas relaciones, que no son compartidas por todas las categorías léxicas, incluyen:

Sustantivos
- Hiperónimo : Y es un hiperónimo de X si cada X es un (tipo de) Y ( canino es un hiperónimo de perro )
- hipónimo : Y es un hipónimo de X si cada Y es un (tipo de) X ( perro es un hipónimo de canino )
- término coordinado : Y es un término coordinado de X si X e Y comparten un hiperónimo ( lobo es un término coordinado de perro , y perro es un término coordinado de lobo )
- holónimo : Y es un holónimo de X si X es parte de Y ( edificio es un holónimo de ventana )
- merónimo : Y es un merónimo de X si Y es parte de X ( ventana es un merónimo de edificio )
Verbos
- hiperónimo : el verbo Y es un hiperónimo del verbo X si la actividad X es una (especie de) Y ( percibir es un hiperónimo de escuchar )
- tropónimo : el verbo Y es un tropónimo del verbo X si la actividad Y es hacer X de alguna manera ( cecear es un tropónimo de hablar )
- implicación : el verbo Y está implicado por el verbo X si al hacer X debes estar haciendo Y ( dormir está implicado por roncar )
- término coordinado : el verbo Y es un término coordinado del verbo X si X e Y comparten un hiperónimo ( cecear es un término coordinado de gritar , y gritar es un término coordinado de cecear )

Estas relaciones semánticas se mantienen entre todos los miembros de los synsets enlazados. Los miembros individuales de los synsets (palabras) también pueden estar conectados con relaciones léxicas. Por ejemplo, (un sentido del) sustantivo "director" está enlazado con (un sentido del) verbo "dirigir" del que se deriva a través de un enlace "morfosemántico".

Las funciones de morfología del software distribuido con la base de datos intentan deducir el lema o la forma de la raíz de una palabra a partir de la entrada del usuario. Las formas irregulares se almacenan en una lista y, por ejemplo, al buscar "ate" se obtendrá "eat".

Estructura del conocimiento

Tanto los sustantivos como los verbos se organizan en jerarquías, definidas por relaciones de hiperónimos o IS A. Por ejemplo, un sentido de la palabra dog se encuentra siguiendo la jerarquía de hiperónimos; las palabras del mismo nivel representan miembros del conjunto de sinónimos. Cada conjunto de sinónimos tiene un índice único.

perro, perro doméstico, Canis familiaris
- canino, cánido
  - carnívoro
    - placentario, mamífero placentario, euterio, mamífero euterio
      - mamífero
        vertebrado, craneal
        cordado
        animal, ser animado, bestia, bruto, criatura, fauna
        ...

En el nivel superior, estas jerarquías están organizadas en 25 "árboles" para principiantes para sustantivos y 15 para verbos (llamados archivos lexicográficos en un nivel de mantenimiento). Todos están vinculados a un conjunto de sinónimos para principiantes único, "entidad". Las jerarquías de sustantivos son mucho más profundas que las de verbos.

Los adjetivos no se organizan en árboles jerárquicos, sino que dos antónimos "centrales" como "caliente" y "frío" forman polos binarios, mientras que los sinónimos "satélites" como "humeante" y "frío" se conectan a sus respectivos polos a través de relaciones de "similitud". Los adjetivos pueden visualizarse de esta manera como "mancuernas" en lugar de como "árboles".

Aspectos psicolingüísticos

El objetivo inicial del proyecto WordNet era construir una base de datos léxica que fuera coherente con las teorías de la memoria semántica humana desarrolladas a finales de los años 1960. Los experimentos psicológicos indicaban que los hablantes organizaban su conocimiento de conceptos de una manera económica y jerárquica. El tiempo de recuperación necesario para acceder al conocimiento conceptual parecía estar directamente relacionado con el número de jerarquías que el hablante necesitaba "atravesar" para acceder al conocimiento. Así, los hablantes podían verificar más rápidamente que los canarios pueden cantar porque un canario es un pájaro cantor, pero necesitaban un poco más de tiempo para verificar que los canarios pueden volar (donde tenían que acceder al concepto "pájaro" en el nivel superordinado) e incluso más tiempo para verificar que los canarios tienen piel (requiriendo una búsqueda en múltiples niveles de hiponimia, hasta "animal"). ^[7] Si bien estos experimentos psicolingüísticos y las teorías subyacentes han sido objeto de críticas, parte de la organización de WordNet es coherente con la evidencia experimental. Por ejemplo, la afasia anómica afecta selectivamente la capacidad de los hablantes para producir palabras de una categoría semántica específica, una jerarquía de WordNet. Se ha descubierto que los adjetivos antónimos (los adjetivos centrales de WordNet en la estructura de mancuernas) aparecen juntos con mucha más frecuencia que el azar, un hecho que se ha demostrado que es válido para muchos idiomas.

Como ontología léxica

WordNet se denomina a veces una ontología, una afirmación persistente que sus creadores no hacen. Las relaciones de hiperónimo/hipónimo entre los conjuntos de sinónimos de los nombres pueden interpretarse como relaciones de especialización entre categorías conceptuales. En otras palabras, WordNet puede interpretarse y utilizarse como una ontología léxica en el sentido de la informática . Sin embargo, una ontología de este tipo debe corregirse antes de utilizarse, porque contiene cientos de inconsistencias semánticas básicas; por ejemplo, existen (i) especializaciones comunes para categorías exclusivas y (ii) redundancias en la jerarquía de especialización. Además, transformar WordNet en una ontología léxica utilizable para la representación del conocimiento normalmente también debería implicar (i) distinguir las relaciones de especialización en relaciones subtypeOf e instanceOf , y (ii) asociar identificadores únicos intuitivos a cada categoría. Aunque dichas correcciones y transformaciones se han realizado y documentado como parte de la integración de WordNet 1.7 en la base de conocimiento actualizable de forma cooperativa de WebKB-2, ^[8] la mayoría de los proyectos que afirman reutilizar WordNet para aplicaciones basadas en el conocimiento (normalmente, recuperación de información orientada al conocimiento) simplemente lo reutilizan directamente.

WordNet también se ha convertido en una especificación formal, mediante una metodología híbrida de abajo a arriba y de arriba a abajo para extraer automáticamente relaciones de asociación e interpretar estas asociaciones en términos de un conjunto de relaciones conceptuales, definidas formalmente en la ontología fundacional DOLCE . ^[9]

En la mayoría de los trabajos que afirman haber integrado WordNet en ontologías, el contenido de WordNet no se ha corregido simplemente cuando parecía necesario, sino que se ha reinterpretado y actualizado en gran medida cuando era necesario. Este fue el caso cuando, por ejemplo, se reestructuró la ontología de nivel superior de WordNet ^[10] según el enfoque basado en OntoClean , o cuando se utilizó como fuente primaria para construir las clases inferiores de la ontología SENSUS.

Limitaciones

La limitación más ampliamente discutida de WordNet (y recursos relacionados como ImageNet ) es que algunas de las relaciones semánticas son más adecuadas para conceptos concretos que para conceptos abstractos. ^[11] Por ejemplo, es fácil crear relaciones hipónimos/hiperónimos para capturar que una " conífera " es un tipo de " árbol ", un "árbol" es un tipo de " planta " y una "planta" es un tipo de " organismo ", pero es difícil clasificar emociones como "miedo" o "felicidad" en relaciones hipónimos/hiperónimos igualmente profundas y bien definidas.

Muchos de los conceptos de WordNet son específicos de ciertos idiomas y la correlación más precisa entre idiomas es del 94 %. ^[12] Los sinónimos, hipónimos, merónimos y antónimos aparecen en todos los idiomas con WordNet hasta el momento, pero otras relaciones semánticas son específicas de cada idioma. ^[13] Esto limita la interoperabilidad entre idiomas. Sin embargo, también convierte a WordNet en un recurso para destacar y estudiar las diferencias entre idiomas, por lo que no es necesariamente una limitación para todos los casos de uso.

WordNet no incluye información sobre la etimología o la pronunciación de las palabras y solo contiene información limitada sobre su uso. WordNet tiene como objetivo cubrir la mayoría de las palabras de uso cotidiano y no incluye mucha terminología específica del dominio.

WordNet es el léxico computacional del inglés más utilizado para la desambiguación de sentido de palabras (WSD), una tarea destinada a asignar significados apropiados al contexto (es decir, miembros del synset) a las palabras de un texto. ^[14] Sin embargo, se ha argumentado que WordNet codifica distinciones de sentido que son demasiado granulares. Este problema impide que los sistemas WSD alcancen un nivel de rendimiento comparable al de los humanos, que no siempre están de acuerdo cuando se enfrentan a la tarea de seleccionar un sentido de un diccionario que coincida con una palabra en un contexto. El problema de la granularidad se ha abordado proponiendo métodos de agrupamiento que agrupan automáticamente sentidos similares de la misma palabra. ^[15]^[16]^[17]

Contenido ofensivo

WordNet incluye palabras que pueden percibirse como peyorativas u ofensivas. ^[18] La interpretación de una palabra puede cambiar con el tiempo y entre grupos sociales , por lo que no siempre es posible que WordNet defina una palabra como " peyorativa " u "ofensiva" de forma aislada. Por lo tanto, las personas que utilizan WordNet deben aplicar sus propios métodos para identificar palabras ofensivas o peyorativas.

Sin embargo, esta limitación se aplica a otros recursos léxicos como diccionarios y tesauros , que también contienen palabras peyorativas y ofensivas. Algunos diccionarios indican palabras que son peyorativas , pero no incluyen todos los contextos en los que las palabras podrían ser aceptables u ofensivas para diferentes grupos sociales. Por lo tanto, las personas que utilizan diccionarios deben aplicar sus propios métodos para identificar todas las palabras ofensivas.

WordNets con licencia y WordNets abiertos

Posteriormente se crearon algunas WordNets para otros idiomas. Una encuesta de 2012 enumera las WordNets y su disponibilidad. ^[19] En un esfuerzo por propagar el uso de WordNets, la comunidad global de WordNet ha estado renovando lentamente la licencia de sus WordNets para un dominio abierto donde los investigadores y desarrolladores pueden acceder y usar WordNets fácilmente como recursos lingüísticos para proporcionar conocimiento ontológico y léxico en tareas de procesamiento del lenguaje natural (PLN).

Open Multilingual WordNet ^[20] proporciona acceso a redes de palabras con licencia abierta en una variedad de idiomas, todas vinculadas a Princeton Wordnet of English (PWN). El objetivo es facilitar el uso de redes de palabras en varios idiomas.

Aplicaciones

WordNet se ha utilizado para diversos propósitos en sistemas de información, entre ellos la desambiguación del sentido de palabras , la recuperación de información , la clasificación automática de textos , el resumen automático de textos , la traducción automática e incluso la generación automática de crucigramas.

Un uso común de WordNet es determinar la similitud entre palabras. Se han propuesto varios algoritmos, incluida la medición de la distancia entre palabras y synsets en la estructura gráfica de WordNet, por ejemplo contando el número de aristas entre synsets. La intuición es que cuanto más cercanas estén dos palabras o synsets, más cercano será su significado. Varios algoritmos de similitud de palabras basados en WordNet se implementan en un paquete de Perl llamado WordNet::Similarity, ^[21] y en un paquete de Python llamado NLTK . ^[22] Otras técnicas de similitud basadas en WordNet más sofisticadas incluyen ADW, ^[23] cuya implementación está disponible en Java . WordNet también se puede utilizar para interconectar otros vocabularios. ^[24]

Interfaces

Princeton mantiene una lista de proyectos relacionados ^[25] que incluye enlaces a algunas de las interfaces de programación de aplicaciones ampliamente utilizadas disponibles para acceder a WordNet utilizando varios lenguajes y entornos de programación.

Proyectos y ampliaciones relacionados

WordNet está conectado a varias bases de datos de la Web semántica . WordNet también se reutiliza habitualmente a través de asignaciones entre los conjuntos de sinónimos de WordNet y las categorías de las ontologías. La mayoría de las veces, solo se asignan las categorías de nivel superior de WordNet.

Asociación Global WordNet

La Asociación Global WordNet (GWA) ^[26] es una organización pública y no comercial que ofrece una plataforma para debatir, compartir y conectar redes de palabras para todos los idiomas del mundo. La GWA también promueve la estandarización de las redes de palabras en todos los idiomas, para asegurar su uniformidad en la enumeración de los conjuntos de sinónimos en los idiomas humanos. La GWA mantiene una lista de las redes de palabras desarrolladas en todo el mundo. ^[27]

Otros idiomas

WordNet árabe : ^[28]^[29] WordNet para idioma árabe.
Ontología árabe , una ontología lingüística que tiene la misma estructura que WordNet y está asignada a ella.
El proyecto BalkaNet ^[30] ha producido WordNets para seis idiomas europeos (búlgaro, checo, griego, rumano, turco y serbio). Para este proyecto se desarrolló un editor de WordNet basado en XML disponible gratuitamente. Este editor, VisDic, ya no se encuentra en desarrollo, pero todavía se utiliza para la creación de varios WordNets. Su sucesor, DEBVisDic, es una aplicación cliente-servidor y actualmente se utiliza para la edición de varios WordNets (holandés en el proyecto Cornetto, polaco, húngaro, varios idiomas africanos, chino).
BulNet es una versión búlgara de WordNet desarrollada en el Departamento de Lingüística Computacional del Instituto de Lengua Búlgara , Academia Búlgara de Ciencias. ^[31]
CWN (Wordnet chino o 中文詞彙網路) apoyado por la Universidad Nacional de Taiwán . ^[32]
El proyecto EuroWordNet ^[33] ha producido WordNets para varios idiomas europeos y los ha vinculado entre sí; sin embargo, no están disponibles de forma gratuita. El proyecto Global Wordnet intenta coordinar la producción y vinculación de "wordnets" para todos los idiomas. ^[34] Oxford University Press , la editorial del Oxford English Dictionary , ha anunciado sus planes de producir su propio competidor en línea de WordNet. ^{[ cita requerida ]}
FinnWordNet es una versión finlandesa de WordNet donde se tradujeron todas las entradas del WordNet original en inglés. ^[35]
GermaNet es una versión alemana de WordNet desarrollada por la Universidad de Tübingen. ^[36]
IndoWordNet ^[37] es una base de conocimiento léxico vinculada de wordnets de 18 idiomas programados de la India, a saber, asamés , bengalí , bodo , gujarati , hindi , kannada , cachemir , konkani , malayalam , meitei ( Manipuri), marathi , nepalí , odia. , punjabi , sánscrito , tamil , telugu y urdu .
JAWS (Just Another WordNet Subset), otra versión francesa de WordNet ^[38] creada utilizando el Wikcionario y los espacios semánticos
WordNet Bahasa: WordNet para los idiomas malayo e indonesio, desarrollado por la Universidad Tecnológica de Nanyang .
Malayalam WordNet , desarrollado por la Universidad de Ciencia y Tecnología de Cochin . ^[39]
El Repositorio Central Multilingüe (MCR) integra en el mismo marco EuroWordNet redes de palabras del español, catalán, euskera, gallego y portugués, así como del inglés. ^[40]
El proyecto MultiWordNet, ^[41] un WordNet multilingüe cuyo objetivo era producir un WordNet italiano fuertemente alineado con el WordNet de Princeton.
OpenDutchWordNet, ^[42] es una base de datos semántica léxica holandesa.
OpenWN-PT es una versión en portugués brasileño del WordNet original disponible gratuitamente para descarga bajo licencia CC-BY-SA. ^[43]
plWordNet ^[44] es una versión en polaco de WordNet desarrollada por la Universidad Tecnológica de Wrocław .
PolNet ^[45] es una versión en polaco de WordNet desarrollada por la Universidad Adam Mickiewicz en Poznań (distribuida bajo la licencia CC BY-NC-ND 3.0).

Proyectos como BalkaNet y EuroWordNet hicieron posible la creación de redes de palabras independientes vinculadas a la original. Dos de estos proyectos fueron Russian WordNet, patrocinado por la Universidad Estatal de Medios de Comunicación de San Petersburgo ^[46] y dirigido por SA Yablonsky, ^[47] y Russnet, ^[48] de la Universidad Estatal de San Petersburgo .

UWN es una base de conocimiento léxico multilingüe construida automáticamente que extiende WordNet para cubrir más de un millón de palabras en muchos idiomas diferentes. ^[49]
WOLF (WordNet Libre du Français), una versión francesa de WordNet. ^[50]

Datos vinculados

BabelNet , ^[51] una red semántica multilingüe muy grande con millones de conceptos obtenidos mediante la integración de WordNet y Wikipedia utilizando un algoritmo de mapeo automático.
La ontología SUMO ^[52] tiene un mapeo manual completo [1] ^[53] entre todos los synsets de WordNet y todo SUMO (incluyendo sus ontologías de dominio, cuando WordNet contiene un sentido de palabra para un término SUMO dado) que se puede explorar en, por ejemplo, [2].
OpenCyc , ^[54] una ontología abierta y base de conocimiento de sentido común cotidiano, tiene 12.000 términos vinculados a conjuntos de sinónimos de WordNet.
DOLCE ^[55] es el primer módulo de la WonderWeb Foundational Ontologies Library (WFOL). Esta ontología superior se ha desarrollado a la luz de principios ontológicos rigurosos inspirados en la tradición filosófica, con una clara orientación hacia el lenguaje y la cognición. OntoWordNet ^[56] es el resultado de una alineación experimental del nivel superior de WordNet con DOLCE. Se sugiere que dicha alineación podría conducir a una WordNet "ontológicamente endulzada", destinada a ser conceptualmente más rigurosa, cognitivamente transparente y eficientemente explotable en varias aplicaciones.
DBpedia , ^[57] una base de datos de información estructurada, está vinculada a WordNet.
El eXtended WordNet ^[58] es un proyecto de la Universidad de Texas en Dallas que pretende mejorar WordNet mediante el análisis semántico de las glosas, con lo que la información contenida en estas definiciones estará disponible para sistemas de procesamiento automático de conocimientos. Está disponible de forma gratuita bajo una licencia similar a la de WordNet.
El proyecto GCIDE produjo un diccionario combinando un diccionario Webster de dominio público de 1913 con algunas definiciones de WordNet y material proporcionado por voluntarios. Fue publicado bajo la licencia copyleft GPL .
ImageNet es una base de datos de imágenes organizada según la jerarquía de WordNet (actualmente solo los sustantivos), en la que cada nodo de la jerarquía está representado por millones de imágenes. ^[59] Actualmente, tiene más de 500 imágenes por nodo en promedio.
BioWordnet, una extensión biomédica de Wordnet, fue abandonada debido a problemas de estabilidad entre versiones. ^[60]
WikiTax2WordNet, un mapeo entre conjuntos sintéticos de WordNet y categorías de Wikipedia . ^[61]
WordNet++, un recurso que incluye millones de aristas semánticas extraídas de Wikipedia y que conecta pares de conjuntos de sinónimos de WordNet. ^[62]
SentiWordNet, un recurso para respaldar aplicaciones de minería de opiniones obtenidas al etiquetar todos los synsets de WordNet 3.0 según sus grados estimados de positividad, negatividad y neutralidad. ^[63]
ColorDict, es una aplicación Android para teléfonos móviles que utilizan bases de datos Wordnet y otras, como Wikipedia.
UBY-LMF una base de datos de 10 recursos incluyendo WordNet.

Proyectos relacionados

FrameNet es una base de datos léxica que comparte algunas similitudes con WordNet y hace referencia a él.
El marco de marcado léxico (LMF) es una norma ISO especificada en el marco ISO/TC37 para definir un marco estandarizado común para la construcción de léxicos, incluido WordNet. El subconjunto de LMF para Wordnet se denomina Wordnet-LMF. Se ha realizado una instanciación dentro del proyecto KYOTO. ^[64]
El Programa UNL es un proyecto auspiciado por la ONU cuyo objetivo es consolidar datos lexicosemánticos de muchos idiomas para ser utilizados en sistemas de traducción automática y extracción de información .
Meaning Monkey es un diccionario en línea gratuito basado en la base de datos WordNet.
Dictionary.video es un diccionario en vídeo centrado en la pronunciación. Su parte de texto es una extensión de WordNet.

Distribuciones

La base de datos de WordNet se distribuye como un paquete de diccionario (generalmente un solo archivo) para el siguiente software:

Babilonia ^[65]
Diccionario dorado ^[66]
Jergas ^[67]
LexSemantic: Plataforma digital para la publicación de obras de referencia (diccionarios, enciclopedias, etc.). Incluye WordnetPlus.

Véase también

Referencias

^ "Noticias de WordNet".
^ "Búsqueda en WordNet - 3.1".
^ GA Miller, R. Beckwith, CD Fellbaum, D. Gross, K. Miller. 1990. WordNet: una base de datos léxica en línea. Int. J. Lexicograph. 3, 4, págs. 235–244.
^ "WordNets en el mundo". Asociación Global WordNet . Consultado el 19 de enero de 2020 .
^ "Acerca de Global WordNet Association". Global WordNet . Consultado el 19 de enero de 2020 .
^ "Estadísticas de WordNet". Wordnet.princeton.edu . Consultado el 22 de junio de 2018 .
^ Collins A., Quillian MR 1972. Experimentos sobre memoria semántica y comprensión del lenguaje. En Cognición en el aprendizaje y la memoria . Wiley, Nueva York.
^ "Integración de WordNet 1.7 en WebKB-2". Webkb.org . Consultado el 11 de marzo de 2014 .
^ Gangemi, A.; Navigli, R.; Velardi, P. (2003). El proyecto OntoWordNet: extensión y axiomatización de relaciones conceptuales en WordNet (PDF) . Catania, Sicilia (Italia). págs. 820–838. {{cite book}}: |work=ignorado ( ayuda )Mantenimiento de CS1: falta la ubicación del editor ( enlace )
^ Oltramari, A.; Gangemi, A.; Guarino, N.; Masolo, C. (2002). Reestructuración del nivel superior de WordNet: el enfoque OntoClean . Taller OntoLex'2, Ontologías y bases de conocimiento léxico (LREC 2002). Las Palmas, España. pp. 17–26. CiteSeerX 10.1.1.19.6574 .
^ Rudnicka, Ewa; Vínculo, Francisco; Grabowski, Lukasz; Piasecki, Maciej; Piotrowski, Tadeusz (2018). "Perspectiva léxica sobre el mapeo de Wordnet a Wordnet". Actas de la novena Conferencia Global WordNet (GWC 2018) : 210.
^ Bond, Francis; Foster, Ryan (2013). "Vincular y extender una red de palabras multilingüe abierta" (PDF) . Actas de la 51.ª reunión anual de la Asociación de Lingüística Computacional : 1352–1362 . Consultado el 20 de enero de 2020 .
^ Fellbaum, Christiane; Vossen, Piek (2012). "Desafíos para una wordnet multilingüe". Evaluación y recursos lingüísticos . 46 (2): 313–326. doi :10.1007/s10579-012-9186-z. S2CID 10117946.
^ R. Navigli. Desambiguación del sentido de las palabras: una encuesta, ACM Computing Surveys , 41(2), 2009, págs. 1–69
^ E. Agirre, O. Lopez. 2003. Clustering WordNet Word Senses. En Proc. de la Conferencia sobre avances recientes en lenguaje natural (RANLP'03) , Borovetz, Bulgaria, págs. 121–130.
^ R. Navigli. Meaningful Clustering of Senses Helps Boost Word Sense Disambiguation Performance, en actas de la 44.ª reunión anual de la Asociación de Lingüística Computacional, en colaboración con la 21.ª Conferencia Internacional sobre Lingüística Computacional (COLING-ACL 2006) , Sídney (Australia), del 17 al 21 de julio de 2006, págs. 105-112.
^ R. Snow, S. Prakash, D. Jurafsky, AY Ng. 2007. Aprendiendo a fusionar los sentidos de las palabras, en actas de la Conferencia conjunta de 2007 sobre métodos empíricos en el procesamiento del lenguaje natural y el aprendizaje computacional del lenguaje natural (EMNLP-CoNLL) , Praga, República Checa, págs. 1005–1014.
^ Wong, Julia Carrie (18 de septiembre de 2019). "La aplicación viral de selfies ImageNet Roulette parecía divertida, hasta que me llamó con un insulto racista". The Guardian . Consultado el 14 de octubre de 2022 .
^ Francis Bond y Kyonghee Paik 2012a. Un estudio de las WordNet y sus licencias. En Actas de la 6.ª Conferencia Global WordNet (GWC 2012). Matsue. 64–71
^ "Open Multilingual Wordnet". compling.hss.ntu.edu.sg . Consultado el 10 de abril de 2018 .
^ "Ted Pedersen - WordNet::Similarity". D.umn.edu. 16 de junio de 2008. Consultado el 11 de marzo de 2014 .
^ PNL con Python NLTK/
^ MT Pilehvar, D. Jurgens y R. Navigli. Alinear, desambiguar y caminar: un enfoque unificado para medir la similitud semántica. Actas de la 51.ª Reunión Anual de la Asociación de Lingüística Computacional (ACL 2013), Sofía, Bulgaria, 4 al 9 de agosto de 2013, págs. 1341-1351.
^ Ballatore A, et al. (2014). "Vinculación de vocabularios geográficos a través de WordNet". Anales de SIG . 20 (2): 73–84. arXiv : 1404.5372 . Código Bib : 2014AnGIS..20...73B. doi :10.1080/19475683.2014.904440. S2CID 9246582.
^ "Proyectos relacionados - WordNet - Proyectos relacionados". Wordnet.princeton.edu. 2014-01-06 . Consultado el 2018-06-22 .
^ Asociación Global WordNet (4 de febrero de 2010). "globalwordnet.org". globalwordnet.org . Consultado el 11 de marzo de 2014 .
^ "Wordnets en el mundo". Archivado desde el original el 21 de octubre de 2011.
^ Black W., Elkateb S., Rodriguez H., Alkhalifa M., Vossen P., Pease A., Bertran M., Fellbaum C., (2006) El proyecto WordNet árabe, Actas de LREC 2006
^ Lahsen Abouenour, Karim Bouzoubaa, Paolo Rosso (2013) Sobre la evaluación y mejora de la cobertura y usabilidad de WordNet en árabe, Recursos lingüísticos y evaluación 47(3) pp 891–917
^ D. Tufis, D. Cristea, S. Stamou. 2004. Balkanet: objetivos, métodos, resultados y perspectivas. Una visión general. Revista rumana de ciencias y tecnología (número especial sobre Balkanet) , 7(1-2), págs. 9-43.
^ "BulNet". dcl.bas.bg . Consultado el 7 de mayo de 2015 .
^ Página oficial de Wordnet chino (中文詞彙網路) en la Universidad Nacional de Taiwán
^ P. Vossen, Ed. 1998. EuroWordNet: una base de datos multilingüe con redes semánticas léxicas. Kluwer, Dordrecht, Países Bajos.
^ "La Asociación Global WordNet". Globalwordnet.org. 4 de febrero de 2010. Consultado el 5 de enero de 2014 .
^ "FinnWordNet – La red de palabras finlandesa - Departamento de lingüística general". Ling.helsinki.fi . Consultado el 5 de enero de 2014 .
^ "GermaNet". Sfs.uni-tuebingen.de . Consultado el 11 de marzo de 2014 .
^ Pushpak Bhattacharyya, IndoWordNet, Conferencia de ingeniería de recursos léxicos 2010 (LREC 2010), Malta, mayo de 2010.
^ C. Mouton, G. de Chalendar. 2010. JAWS: Otro subconjunto más de WordNet. En Proc. de TALN 2010 .
^ Sitio web
^ "MCR 3.0 | Adimen". adimen.si.ehu.es . Consultado el 21 de marzo de 2022 .
^ E. Pianta, L. Bentivogli, C. Girardi. 2002. MultiWordNet: Desarrollo de una base de datos multilingüe alineada. En Proc. de la 1.ª Conferencia Internacional sobre Global WordNet , Mysore, India, págs. 21-25.
^ "Open Dutch WordNet". Wordpress.let.vupr.nl. 28 de octubre de 2015. Consultado el 21 de marzo de 2022 .
^ "arademaker/openWordnet-PT — GitHub". Github.com . Consultado el 5 de enero de 2014 .
^ página web oficial
^ página web oficial
^ "Русский WordNet". Pgups.ru . Consultado el 5 de enero de 2014 .
^ Balkova, Valentina; Sukhonogov, Andrey; Yablonsky, Sergey (2003). "Russian WordNet From UML-notation to Internet/Intranet Database Implementation" (PDF) . Actas de GWC 2004 : 31–38 . Consultado el 12 de marzo de 2017 .
^ "RussNet: Главная страница". Proyecto.phil.spbu.ru . Consultado el 11 de marzo de 2014 .
^ "UWN: Hacia un Wordnet multilingüe universal - D5: bases de datos y sistemas de información (Max-Planck-Institut für Informatik)". Mpi-inf.mpg.de. 2011-08-14 . Consultado el 5 de enero de 2014 .
^ S. Benoît, F. Darja. 2008. Creación de una red de palabras francesa gratuita a partir de recursos multilingües. En Proc. de Ontolex 2008 , Marrakech, Marruecos.
^ R. Navigli, SP Ponzetto. BabelNet: Building a Very Large Multilingual Semantic Network. Actas de la 48.ª Reunión Anual de la Asociación de Lingüística Computacional (ACL 2010), Uppsala, Suecia, 11-16 de julio de 2010, págs. 216-225.
^ I. Niles, A. Pease 2001. Hacia una ontología superior estándar: una gran ontología para la Web semántica y sus aplicaciones. En Actas de la 2.ª Conferencia internacional sobre ontología formal en sistemas de información (FOIS-2001) ,
^ I. Niles, A. Pease 2003. Vinculación de léxicos y ontologías: mapeo de WordNet a la ontología superior fusionada sugerida, en Actas de la Conferencia internacional IEEE sobre ingeniería de la información y el conocimiento , págs. 412-416
^ S. Reed y D. Lenat. 2002. Mapping Ontologies into Cyc. En las actas del taller de la conferencia AAAI 2002 sobre ontologías para la web semántica , Edmonton, Canadá, 2002
^ Masolo, C., Borgo, S., Gangemi, A., Guarino, N., Oltramari, A., Schneider, LS 2002. WonderWeb Deliverable D17. La biblioteca WonderWeb de ontologías fundamentales y la ontología DOLCE. Informe (versión 2.0, 15-08-2002)
^ Gangemi, A., Guarino, N., Masolo, C., Oltramari, A. 2003 Endulzando WordNet con DOLCE. En AI Magazine 24(3): Otoño de 2003, págs. 13-24
^ C. Bizer, J. Lehmann, G. Kobilarov, S. Auer, C. Becker, R. Cyganiak, S. Hellmann, DBpedia – Un punto de cristalización para la Web de datos. Web Semantics, 7(3), 2009, págs. 154–165
^ SM Harabagiu, GA Miller, DI Moldovan. 1999. WordNet 2: un recurso mejorado morfológica y semánticamente. En Actas del taller ACL SIGLEX: Estandarización de recursos léxicos , págs. 1–8.
^ J. Deng, W. Dong, R. Socher, L. Li, K. Li, L. Fei-Fei. ImageNet: una base de datos de imágenes jerárquica a gran escala. En las actas de la Conferencia IEEE de 2009 sobre visión artificial y reconocimiento de patrones
^ M. Poprat, E. Beisswanger, U. Hahn. 2008. Creación de una BIOWORDNET mediante el uso de los formatos de datos y la infraestructura de software de WORDNET: una historia de fracaso. En Proc. del taller de ingeniería de software, pruebas y garantía de calidad para el procesamiento del lenguaje natural , págs. 31–39.
^ S. Ponzetto, R. Navigli. Mapeo taxonómico a gran escala para la reestructuración e integración de Wikipedia, en actas de la 21.ª Conferencia conjunta internacional sobre inteligencia artificial (IJCAI 2009) , Pasadena, California, 14-17 de julio de 2009, págs. 2083-2088.
^ SP Ponzetto, R. Navigli. Desambiguación del sentido de las palabras rica en conocimiento que rivaliza con los sistemas supervisados. En Proc. de la 48.ª Reunión Anual de la Asociación de Lingüística Computacional (ACL), 2010, págs. 1522-1531.
^ S. Baccianella, A. Esuli y F. Sebastiani. SentiWordNet 3.0: Un recurso léxico mejorado para el análisis de sentimientos y la minería de opiniones. En Actas de la 7.ª Conferencia sobre recursos lingüísticos y evaluación (LREC'10), Valletta, MT, 2010, págs. 2200–2204.
^ Piek Vossen, Claudia Soria, Monica Monachini: Wordnet-LMF: una representación estándar para redes de palabras multilingües, en LMF Lexical Markup Framework , editado por Gil Francopoulo ISTE / Wiley 2013 ( ISBN 978-1-84821-430-9 )
^ "Babylon WordNet". Babylon.com . Consultado el 11 de marzo de 2014 .
^ "GoldenDict - Buscar diccionarios en Sourceforge.net". Sourceforge.net. 2010-12-01 . Consultado el 2014-01-05 .
^ "Lingoes WordNet". Lingoes.net. 16 de noviembre de 2007. Consultado el 11 de marzo de 2014 .

Enlaces externos

Sitio web oficial
"Malayalam WordNet". Ciencias de la Computación . Universidad de Ciencia y Tecnología de Cochin.
Pilato, Maria. "Adjetivos, Intensificadores, Negaciones (AIN) Thesaurus" . Sentimiento italiano .