Corpus Nacional Esloveno

El Corpus Nacional Esloveno FidaPLUS es el corpus de 621 millones de palabras (tokens) del idioma esloveno , recopiladas a partir de textos seleccionados escritos en esloveno de diferentes géneros y estilos, principalmente de libros y periódicos. ^[1]

La base de datos FidaPLUS es una actualización del corpus anterior (FIDA), que se desarrolló entre 1997 y 2000, con textos agregados que se publicaron hasta 2006 y fue el resultado del proyecto de investigación aplicativa de la Facultad de Artes, Facultad de Ciencias Sociales. , tanto de la Universidad de Liubliana como del Departamento de Tecnologías del Conocimiento del Instituto Jožef Stefan . ^[2]

Corpus está disponible a través de un administrador de corpus Sketch Engine . ^[3] Esta versión del corpus FidaPLUS contiene bocetos de Word , una descripción general automática derivada del corpus del comportamiento gramatical y colocacional de Word.

Referencias

^ "FidaPLUS". Archivado desde el original el 14 de noviembre de 2010 . Consultado el 15 de marzo de 2012 .El número de palabras de FidaPLUS por fecha de publicación.
^ "FidaPLUS". Archivado desde el original el 21 de marzo de 2012 . Consultado el 22 de marzo de 2011 .La lista del equipo FidaPLUS y afiliaciones institucionales
^ Corpus FidaPLUS en Sketch Engine

enlaces externos

Sitio web del Corpus Nacional Esloveno FidaPLUS