stringtranslate.com

Espacio

spaCy ( / s p ˈ s / spay- SEE ) es una biblioteca de software de código abierto para el procesamiento avanzado del lenguaje natural , escrita en los lenguajes de programación Python y Cython . [3] [4] La biblioteca se publica bajo la licencia MIT y sus principales desarrolladores son Matthew Honnibal e Ines Montani, los fundadores de la empresa de software Explosion.

A diferencia de NLTK , que se usa ampliamente para la enseñanza y la investigación, spaCy se centra en proporcionar software para uso en producción. [5] [6] spaCy también admite flujos de trabajo de aprendizaje profundo que permiten conectar modelos estadísticos entrenados por bibliotecas de aprendizaje automático populares como TensorFlow , PyTorch o MXNet a través de su propia biblioteca de aprendizaje automático Thinc. [7] [8] Usando Thinc como su backend, spaCy presenta modelos de redes neuronales convolucionales para etiquetado de partes del discurso , análisis de dependencias , categorización de texto y reconocimiento de entidades nombradas (NER) . Los modelos de redes neuronales estadísticas preconstruidos para realizar estas tareas están disponibles para 23 idiomas, incluidos inglés, portugués, español, ruso y chino, y también hay un modelo NER en varios idiomas . El soporte adicional para tokenización para más de 65 idiomas permite a los usuarios entrenar modelos personalizados en sus propios conjuntos de datos también. [9]

Historia

Características principales

Extensiones y visualizadores

Visualización del árbol de análisis de dependencia generada con el visualizador displaCy
Visualización del árbol de análisis de dependencia generada con el visualizador displaCy

spaCy viene con varias extensiones y visualizaciones que están disponibles como bibliotecas gratuitas de código abierto :

Referencias

  1. ^ "Presentación de spaCy". explosion.ai . Consultado el 18 de diciembre de 2016 .
  2. ^ "Versión 3.7.5". 5 de junio de 2024. Consultado el 26 de junio de 2024 .
  3. ^ Choi et al. (2015). Depende: comparación de analizadores de dependencias mediante una herramienta de evaluación basada en la Web.
  4. ^ "La nueva inteligencia artificial de Google no puede entender estas frases. ¿Puedes tú?". Washington Post . Consultado el 18 de diciembre de 2016 .
  5. ^ "Datos y cifras - spaCy". spacy.io . Consultado el 4 de abril de 2020 .
  6. ^ Bird, Steven; Klein, Ewan; Loper, Edward; Baldridge, Jason (2008). "Instrucción multidisciplinaria con el kit de herramientas de lenguaje natural" (PDF) . Actas del tercer taller sobre cuestiones de enseñanza de la lingüística computacional, ACL : 62. doi : 10.3115/1627306.1627317 . ISBN . 9781932432145. Número de identificación del sujeto  16932735.
  7. ^ "PyTorch, TensorFlow y MXNet". thinc.ai . Consultado el 4 de abril de 2020 .
  8. ^ "explosion/thinc". GitHub . Consultado el 30 de diciembre de 2016 .
  9. ^ "Modelos e idiomas | Documentación de uso de spaCy". spacy.io . Consultado el 10 de marzo de 2020 .
  10. ^ "explosion/spaCy". GitHub . Consultado el 8 de febrero de 2021 .
  11. ^ "explosion/spaCy". GitHub . Consultado el 8 de febrero de 2021 .
  12. ^ "explosion/spaCy". GitHub . Consultado el 8 de febrero de 2021 .
  13. ^ "Modelos y lenguajes - spaCy". spacy.io . Consultado el 8 de febrero de 2021 .
  14. ^ "Modelos e idiomas | Documentación de uso de spaCy". spacy.io . Consultado el 8 de febrero de 2021 .
  15. ^ "Puntos de referencia | Documentación de uso de spaCy". spacy.io . Consultado el 8 de febrero de 2021 .
  16. ^ Trask et al. (2015). sense2vec: un método rápido y preciso para la desambiguación del sentido de las palabras en incrustaciones de palabras neuronales.

Enlaces externos