El corpus árabe coránico ( árabe : المدونة القرآنية العربية , romanizado : al-modwana al-Qurʾāni al-ʿArabiyya ) es un recurso lingüístico comentado que consta de 77.430 palabras de árabe coránico. El proyecto tiene como objetivo proporcionar anotaciones morfológicas y sintácticas para investigadores que quieran estudiar el lenguaje del Corán. [1] [2] [3] [4] [5]
Funciones
El análisis gramatical ayuda a los lectores a descubrir mejor los significados detallados de cada versículo y oración. Cada palabra del Corán está etiquetada con su parte gramatical, así como con múltiples características morfológicas. A diferencia de otros corpus árabes anotados, el marco gramatical adoptado por el Corpus Coránico es la gramática árabe tradicional de i'rab ( إﻋﺮﺍﺏ ). El proyecto de investigación está dirigido por Kais Dukes en la Universidad de Leeds , [4] y es parte del grupo de investigación de computación en lengua árabe dentro de la Escuela de Computación, supervisado por Eric Atwell. [6]
Una nueva visualización de la gramática árabe tradicional a través de gráficos de dependencia.
Búsqueda morfológica del Corán.
Un léxico morfológico legible por máquina de palabras coránicas en inglés.
Una concordancia de partes del discurso para el árabe coránico organizada por lema.
Un tablero de mensajes en línea para anotaciones de voluntarios de la comunidad.
La anotación de corpus asigna una etiqueta gramatical y características morfológicas a cada palabra. Por ejemplo, la anotación implica decidir si una palabra es un sustantivo o un verbo, y si se declina para masculino o femenino. La primera etapa del proyecto implicó el etiquetado automático de las partes gramaticales mediante la aplicación de tecnología informática en lengua árabe al texto. La anotación de cada una de las 77.430 palabras del Corán fue revisada en etapas por dos anotadores y aún se están realizando mejoras para mejorar aún más la precisión.
Además, el proyecto proporciona una traducción coránica palabra por palabra basada en fuentes inglesas aceptadas, en lugar de producir una nueva traducción del Corán. [4]
^ ab K. Dukes, E. Atwell y N. Habash (2011). Colaboración supervisada para la anotación sintáctica del árabe coránico. Revista de recursos lingüísticos y evaluación (LREJ). Número especial sobre recursos lingüísticos construidos de forma colaborativa.
^ Colaboración supervisada para la anotación sintáctica del árabe coránico en ResearchGate . Cargado por Nizar Habash, Universidad de Columbia .
^ K. Dukes y T. Buckwalter (2010). Un árbol de dependencias del Corán utilizando la gramática árabe tradicional. En Actas de la 7.ª Conferencia Internacional sobre Informática y Sistemas (INFOS). El Cairo, Egipto.
^ abc El corpus árabe coránico Archivado el 23 de febrero de 2013 en Wayback Machine en The Muslim Tribune. 20 de junio de 2011.
^ Eric Atwell, Claire Brierley, Kais Dukes, Majdi Sawalha y Abdul-Baquee Sharaf. Un enfoque de inteligencia artificial para el contenido árabe e islámico en Internet [ vínculo muerto permanente ] , pág. 2. Riad : Universidad Rey Saud , 2011.
^ Ingeniería. "Perfil del Dr. Eric Atwell - Facultad de Informática - Universidad de Leeds". www.comp.leeds.ac.uk .
^ K. Dukes y Habash, N. (2011). Análisis estadístico en un solo paso de representaciones sintácticas híbridas de dependencias y constituyentes. Conferencia internacional sobre tecnologías de análisis (IWPT). Dublín, Irlanda.
^ M. Albared, N. Omar y M. Ab Aziz (2011). Desarrollo de un etiquetador de puntos de venta en árabe HMM competitivo utilizando pequeños corpus de entrenamiento. Sistemas de información y bases de datos inteligentes. Springer Berlin, Heidelberg.
^ AM Sharaf y E. Atwell (2011). Categorización automática de los capítulos coránicos. 7.ª Conferencia Internacional de Informática en Árabe (ICCA11). Riad, Arabia Saudita.
^ C. Brierley, M. Sawalha y E. Atwell (2012). Boundary Annotated Qur'an Corpus for Arabic Phrase Break Prediction. Archivado el 15 de diciembre de 2018 en Wayback Machine . Simposio anual de la IVACS. Cambridge.