stringtranslate.com

Académico semántico

Semantic Scholar es una herramienta de investigación de literatura científica impulsada por inteligencia artificial . Fue desarrollada en el Instituto Allen de IA y se lanzó al público en noviembre de 2015. [2] Semantic Scholar utiliza técnicas modernas de procesamiento del lenguaje natural para respaldar el proceso de investigación, por ejemplo, brindando resúmenes generados automáticamente de artículos académicos. [3] El equipo de Semantic Scholar está investigando activamente el uso de inteligencia artificial en el procesamiento del lenguaje natural , el aprendizaje automático , la interacción entre humanos y computadoras y la recuperación de información . [4]

Semantic Scholar comenzó como una base de datos para los temas de informática , geociencia y neurociencia . [5] En 2017, el sistema comenzó a incluir literatura biomédica en su corpus. [5] A septiembre de 2022 , incluye más de 200 millones de publicaciones de todos los campos de la ciencia. [6]

Tecnología

Semantic Scholar ofrece un resumen de la literatura científica en una sola frase . Uno de sus objetivos era abordar el desafío de leer numerosos títulos y resúmenes extensos en dispositivos móviles. [7] También busca garantizar que los tres millones de artículos científicos publicados anualmente lleguen a los lectores, ya que se estima que solo la mitad de esta literatura se lee alguna vez. [8]

La inteligencia artificial se utiliza para capturar la esencia de un artículo, generándolo a través de una técnica "abstractiva". [3] El proyecto utiliza una combinación de aprendizaje automático , procesamiento del lenguaje natural y visión artificial para agregar una capa de análisis semántico a los métodos tradicionales de análisis de citas y para extraer figuras, tablas , entidades y lugares relevantes de los artículos. [9] [10]

Otra característica clave impulsada por IA es Research Feeds, un recomendador de investigación adaptativo que utiliza IA para aprender rápidamente qué artículos les interesan a los usuarios y recomienda las últimas investigaciones para ayudar a los académicos a mantenerse actualizados. Utiliza un modelo de incorporación de artículos de última generación entrenado mediante aprendizaje contrastivo para encontrar artículos similares a los de cada carpeta de la Biblioteca. [11]

Semantic Scholar también ofrece Semantic Reader, un lector aumentado con el potencial de revolucionar la lectura científica al hacerla más accesible y ricamente contextualizada. [12] Semantic Reader proporciona tarjetas de citas en línea que permiten a los usuarios ver citas con resúmenes breves generados automáticamente a medida que leen y reseñas que capturan los puntos clave de un artículo para que los usuarios puedan digerirlo más rápido.

A diferencia de Google Scholar y PubMed , Semantic Scholar está diseñado para resaltar los elementos más importantes e influyentes de un artículo. [13] La tecnología de IA está diseñada para identificar conexiones y vínculos ocultos entre temas de investigación. [14] Al igual que los motores de búsqueda citados anteriormente, Semantic Scholar también explota estructuras de gráficos, que incluyen Microsoft Academic Knowledge Graph , Springer Nature's SciGraph y Semantic Scholar Corpus (originalmente un corpus de 45 millones de artículos en informática, neurociencia y biomedicina). [15] [16]

Identificador del artículo

A cada artículo alojado por Semantic Scholar se le asigna un identificador único llamado Semantic Scholar Corpus ID (abreviado como S2CID). La siguiente entrada es un ejemplo:

Liu, Ying; Gayle, Albert A; Wilder-Smith, Annelies; Rocklöv, Joacim (marzo de 2020). "El número de reproducción de COVID-19 es mayor en comparación con el coronavirus del SARS". Journal of Travel Medicine . 27 (2). doi :10.1093/jtm/taaa021. PMID  32052846. S2CID  211099356.

Indexación

Semantic Scholar es de uso gratuito y, a diferencia de motores de búsqueda similares (por ejemplo, Google Scholar ), no busca material que esté detrás de un muro de pago . [5] [ cita requerida ]

Un estudio comparó el alcance del índice de Semantic Scholar con el de Google Scholar y descubrió que, en el caso de los artículos citados por estudios secundarios en informática, los dos índices tenían una cobertura comparable y cada uno solo omitía un puñado de artículos. [17]

Número de usuarios y publicaciones

En enero de 2018, tras un proyecto de 2017 que añadió artículos biomédicos y resúmenes de temas, el corpus de Semantic Scholar incluía más de 40 millones de artículos de informática y biomedicina . [18] En marzo de 2018, Doug Raymond, que desarrolló iniciativas de aprendizaje automático para la plataforma Amazon Alexa , fue contratado para dirigir el proyecto Semantic Scholar. [19] En agosto de 2019 , la cantidad de metadatos de artículos incluidos (no los PDF reales) había aumentado a más de 173 millones [20] después de la adición de los registros de Microsoft Academic Graph . [21] En 2020, una asociación entre Semantic Scholar y University of Chicago Press Journals hizo que todos los artículos publicados bajo University of Chicago Press estuvieran disponibles en el corpus de Semantic Scholar. [22] A fines de 2020, Semantic Scholar había indexado 190 millones de artículos. [23] En 2020, Semantic Scholar alcanzó los siete millones de usuarios por mes. [7]

Véase también

Referencias

  1. ^ Jones, Nicola (2015). "Instituto de inteligencia artificial lanza motor de búsqueda científica gratuito". Nature . doi : 10.1038/nature.2015.18703 . ISSN:  1476-4687. S2CID  : 182440976.
  2. ^ Eunjung Cha, Ariana (3 de noviembre de 2015). «El grupo de investigación en IA de Paul Allen presenta un programa que pretende revolucionar la forma en que buscamos conocimiento científico. Pruébelo». The Washington Post . Archivado desde el original el 6 de noviembre de 2019. Consultado el 3 de noviembre de 2015 .
  3. ^ ab Hao, Karen (18 de noviembre de 2020). "Una IA te ayuda a resumir lo último en IA". MIT Technology Review . Consultado el 16 de febrero de 2021 .
  4. ^ "Investigación académica semántica". research.semanticscholar.org . Consultado el 22 de noviembre de 2021 .
  5. ^ abc Fricke, Suzanne (12 de enero de 2018). "Semantic Scholar". Revista de la Asociación de Bibliotecas Médicas . 106 (1): 145–147. doi : 10.5195/jmla.2018.280 . ISSN  1558-9439. PMC 5764585 . S2CID  45802944. 
  6. ^ Matthews, David (1 de septiembre de 2021). "¿Ahogándose en la literatura? Estas herramientas de software inteligentes pueden ayudar". Nature . Consultado el 5 de septiembre de 2022 . ...el corpus disponible públicamente compilado por Semantic Scholar, una herramienta creada en 2015 por el Instituto Allen de Inteligencia Artificial en Seattle, Washington, que asciende a alrededor de 200 millones de artículos, incluidas las preimpresiones.
  7. ^ ab Grad, Peter (24 de noviembre de 2020). "Una herramienta de inteligencia artificial resume artículos extensos en una oración". Tech Xplore . Consultado el 16 de febrero de 2021 .
  8. ^ "Semantic Scholar del Instituto Allen ahora busca en 175 millones de artículos académicos". VentureBeat . 2019-10-23 . Consultado el 2021-02-16 .
  9. ^ Bohannon, John (11 de noviembre de 2016). «Un programa informático acaba de clasificar a los científicos del cerebro más influyentes de la era moderna». Science . doi :10.1126/science.aal0371. Archivado desde el original el 29 de abril de 2020 . Consultado el 12 de noviembre de 2016 .
  10. ^ Christopher Clark; Santosh Divvala (2016), PDFFigures 2.0: Minería de cifras a partir de artículos de investigación, Actas de la 16.ª Conferencia conjunta ACM/IEEE-CS sobre bibliotecas digitales - JCDL '16, Wikidata  Q108172042
  11. ^ "Semantic Scholar | Preguntas frecuentes". Archivado desde el original el 15 de julio de 2023.
  12. ^ "Semantic Scholar | Semantic Reader". Semantic Scholar . Archivado desde el original el 15 de julio de 2023.
  13. ^ "Semantic Scholar". Revista internacional de estudios lingüísticos y literarios . Consultado el 9 de noviembre de 2021 .
  14. ^ Baykoucheva, Svetla (2021). Impulsando el descubrimiento de información científica en la era digital . Chandos Publishing. pág. 91. ISBN 978-0-12-823724-3.OCLC 1241441806  .
  15. ^ José, Joemon M.; Yilmaz, Emine; Magalhães, João; Castells, Pablo; Ferro, Nicola; Silva, Mario J.; Martins, Flavio (2020). Avances en la recuperación de información: 42.a Conferencia europea sobre investigación de RI, ECIR 2020, Lisboa, Portugal, 14 al 17 de abril de 2020, Actas, Parte I. Cham, Suiza: Springer Nature. pag. 254.ISBN 978-3-030-45438-8.OCLC 1164658107  .
  16. ^ Ammar, Waleed (2019). "Open Research Corpus". Corpus de investigación abierta de Semantic Scholar Lab . Archivado desde el original el 29 de marzo de 2019. Consultado el 5 de agosto de 2024 .
  17. ^ Hannousse, Abdelhakim (2021). "Búsqueda de artículos relevantes para estudios secundarios de ingeniería de software: cobertura de Semantic Scholar y papel de identificación". IET Software . 15 (1): 126–146. doi :10.1049/sfw2.12011. ISSN  1751-8814. S2CID  234053002.
  18. ^ "AI2 amplía el motor de búsqueda Semantic Scholar para abarcar la investigación biomédica". GeekWire . 2017-10-17. Archivado desde el original el 2018-01-19 . Consultado el 2018-01-18 .
  19. ^ "Movimientos tecnológicos: Allen Institute contrata a un líder de aprendizaje automático de Amazon Alexa; el presidente de Microsoft asume un nuevo rol de inversor; y más". GeekWire. 2 de mayo de 2018. Archivado desde el original el 10 de mayo de 2018. Consultado el 9 de mayo de 2018 .
  20. ^ "Semantic Scholar". Semantic Scholar . Archivado desde el original el 11 de agosto de 2019. Consultado el 11 de agosto de 2019 .
  21. ^ "AI2 une fuerzas con Microsoft Research para mejorar las herramientas de búsqueda de estudios científicos". GeekWire . 2018-12-05. Archivado desde el original el 2019-08-25 . Consultado el 2019-08-25 .
  22. ^ "La University of Chicago Press se suma a más de 500 editoriales que trabajan con Semantic Scholar para mejorar la búsqueda y la capacidad de descubrimiento". RCNi Company Limited . Consultado el 22 de noviembre de 2021 .
  23. ^ Dunn, Adriana (14 de diciembre de 2020). «Semantic Scholar suma 25 millones de artículos científicos en 2020 a través de nuevas asociaciones con editoriales» (PDF) . Semantic Scholar . Consultado el 22 de noviembre de 2021 .

Enlaces externos