Académico semántico

Semantic Scholar es una herramienta de investigación de literatura científica impulsada por inteligencia artificial . Se desarrolló en el Instituto Allen de IA y se publicó públicamente en noviembre de 2015. ^[2] Semantic Scholar utiliza técnicas modernas de procesamiento del lenguaje natural para respaldar el proceso de investigación, por ejemplo, proporcionando resúmenes de artículos académicos generados automáticamente. ^[3] El equipo de Semantic Scholar está investigando activamente el uso de la inteligencia artificial en el procesamiento del lenguaje natural , el aprendizaje automático , la interacción persona-computadora y la recuperación de información . ^[4]

Semantic Scholar comenzó como una base de datos para temas de informática , geociencia y neurociencia . ^[5] En 2017, el sistema comenzó a incluir literatura biomédica en su corpus. ^[5] A septiembre de 2022 ^[actualizar], incluye más de 200 millones de publicaciones de todos los campos de la ciencia. ^[6]

Tecnología

Semantic Scholar proporciona un resumen de una oración de la literatura científica . Uno de sus objetivos era abordar el desafío de leer numerosos títulos y resúmenes extensos en dispositivos móviles. ^[7] También busca garantizar que los tres millones de artículos científicos que se publican anualmente lleguen a los lectores, ya que se estima que sólo la mitad de esta literatura se lee alguna vez. ^[8]

La inteligencia artificial se utiliza para captar la esencia de un papel, generándola mediante una técnica "abstractiva". ^[3] El proyecto utiliza una combinación de aprendizaje automático , procesamiento de lenguaje natural y visión artificial para agregar una capa de análisis semántico a los métodos tradicionales de análisis de citas y para extraer figuras, tablas , entidades y lugares relevantes de los artículos. ^[9]^[10]

Otra característica clave impulsada por la IA es Research Feeds, un recomendador de investigaciones adaptativo que utiliza IA para aprender rápidamente qué artículos les interesa leer a los usuarios y recomienda las últimas investigaciones para ayudar a los académicos a mantenerse actualizados. Utiliza un modelo de incrustación de papel de última generación entrenado mediante aprendizaje contrastivo para encontrar documentos similares a los de cada carpeta de la Biblioteca. ^[11]

Semantic Scholar también ofrece Semantic Reader, un lector aumentado con el potencial de revolucionar la lectura científica haciéndola más accesible y rica en contexto. ^[12] Semantic Reader proporciona tarjetas de citas en línea que permiten a los usuarios ver citas con resúmenes TLDR mientras leen y hojean aspectos destacados que capturan puntos clave de un artículo para que los usuarios puedan digerirlo más rápido.

A diferencia de Google Scholar y PubMed , Semantic Scholar está diseñado para resaltar los elementos más importantes e influyentes de un artículo. ^[13] La tecnología de IA está diseñada para identificar conexiones y vínculos ocultos entre temas de investigación. ^[14] Al igual que los motores de búsqueda citados anteriormente, Semantic Scholar también explota estructuras gráficas, que incluyen Microsoft Academic Knowledge Graph , Springer Nature's SciGraph y Semantic Scholar Corpus (originalmente un corpus de 45 millones de artículos en informática, neurociencia y biomedicina). ^[15]^[16]

Identificador del artículo

A cada artículo alojado en Semantic Scholar se le asigna un identificador único llamado Semantic Scholar Corpus ID (abreviado S2CID). La siguiente entrada es un ejemplo:

Liu, Ying; Gayle, Albert A; Wilder-Smith, Annelies; Rocklöv, Joacim (marzo de 2020). "El número reproductivo de COVID-19 es mayor en comparación con el coronavirus del SARS". Revista de medicina de viajes . 27 (2). doi : 10.1093/jtm/taaa021. PMID 32052846. S2CID 211099356.

Indexación

Semantic Scholar es de uso gratuito y, a diferencia de motores de búsqueda similares (es decir, Google Scholar ), no busca material que esté detrás de un muro de pago . ^[5]^{[ cita necesaria ]}

Un estudio comparó el alcance del índice de Semantic Scholar con el de Google Scholar y encontró que para los artículos citados por estudios secundarios en ciencias de la computación, los dos índices tenían una cobertura comparable y a cada uno solo le faltaban un puñado de artículos. ^[17]

Número de usuarios y publicaciones

En enero de 2018, tras un proyecto de 2017 que agregó artículos biomédicos y resúmenes de temas, el corpus de Semantic Scholar incluía más de 40 millones de artículos de informática y biomedicina . ^[18] En marzo de 2018, Doug Raymond, quien desarrolló iniciativas de aprendizaje automático para la plataforma Amazon Alexa , fue contratado para liderar el proyecto Semantic Scholar. ^[19] En agosto de 2019 ^[actualizar], la cantidad de metadatos de artículos incluidos (no los archivos PDF reales) había aumentado a más de 173 millones ^[20] después de la adición de los registros de Microsoft Academic Graph . ^[21] En 2020, una asociación entre Semantic Scholar y University of Chicago Press Journals hizo que todos los artículos publicados bajo University of Chicago Press estuvieran disponibles en el corpus de Semantic Scholar. ^[22] A finales de 2020, Semantic Scholar había indexado 190 millones de artículos. ^[23] En 2020, Semantic Scholar alcanzó los siete millones de usuarios por mes. ^[7]

Ver también

Análisis de citas : examen de la frecuencia, patrones y gráficos de citas en documentos.
Índice de citas - Índice de citas entre publicaciones
Extracción de conocimiento : creación de conocimiento a partir de fuentes estructuradas y no estructuradas.
Lista de bases de datos académicas y motores de búsqueda.
Cienciometría : estudio cuantitativo de la literatura académica.

Referencias

^ Jones, Nicola (2015). "El instituto de inteligencia artificial lanza un motor de búsqueda científica gratuito". Naturaleza . doi : 10.1038/naturaleza.2015.18703 . ISSN 1476-4687. S2CID 182440976.
^ Eunjung Cha, Ariana (3 de noviembre de 2015). "El grupo de investigación de IA de Paul Allen presenta un programa que tiene como objetivo revolucionar la forma en que buscamos conocimiento científico. Pruébelo". El Washington Post . Archivado desde el original el 6 de noviembre de 2019 . Consultado el 3 de noviembre de 2015 .
^ ab Hao, Karen (18 de noviembre de 2020). "Una IA te ayuda a resumir lo último en IA". Revisión de tecnología del MIT . Consultado el 16 de febrero de 2021 .
^ "Investigación académica semántica". research.semanticscholar.org . Consultado el 22 de noviembre de 2021 .
^ abc Fricke, Suzanne (12 de enero de 2018). "Erudito semántico". Revista de la Asociación de Bibliotecas Médicas . 106 (1): 145-147. doi : 10.5195/jmla.2018.280 . ISSN 1558-9439. PMC 5764585 . S2CID 45802944.
^ Matthews, David (1 de septiembre de 2021). "¿Ahogándose en la literatura? Estas herramientas de software inteligentes pueden ayudar". Naturaleza . Consultado el 5 de septiembre de 2022 . ...el corpus disponible públicamente compilado por Semantic Scholar, una herramienta creada en 2015 por el Instituto Allen de Inteligencia Artificial en Seattle, Washington, que asciende a alrededor de 200 millones de artículos, incluidos los preprints.
^ ab Grad, Peter (24 de noviembre de 2020). "La herramienta de inteligencia artificial resume artículos extensos en una oración". Exploración tecnológica . Consultado el 16 de febrero de 2021 .
^ "Semantic Scholar del Instituto Allen ahora busca en 175 millones de artículos académicos". VentureBeat . 2019-10-23 . Consultado el 16 de febrero de 2021 .
^ Bohannon, John (11 de noviembre de 2016). "Un programa de computadora acaba de clasificar a los científicos del cerebro más influyentes de la era moderna". Ciencia . doi : 10.1126/ciencia.aal0371. Archivado desde el original el 29 de abril de 2020 . Consultado el 12 de noviembre de 2016 .
^ Cristóbal Clark; Santosh Divvala (2016), PDFFigures 2.0: Cifras de minería a partir de artículos de investigación, Actas de la 16ª ACM/IEEE-CS sobre la Conferencia Conjunta sobre Bibliotecas Digitales - JCDL '16, Wikidata Q108172042
^ "Semantic Scholar | Preguntas frecuentes". Archivado desde el original el 15 de julio de 2023.
^ "Erudito semántico | Lector semántico". Académico semántico . Archivado desde el original el 15 de julio de 2023.
^ "Erudito semántico". Revista Internacional de Lengua y Estudios Literarios . Consultado el 9 de noviembre de 2021 .
^ Baykoucheva, Svetla (2021). Impulsando el descubrimiento de información científica en la era digital . Editorial Chandos. pag. 91.ISBN 978-0-12-823724-3.
^ José, Joemon M.; Yilmaz, Emine; Magalhães, João; Castells, Pablo; Ferro, Nicola; Silva, Mario J.; Martins, Flavio (2020). Avances en la recuperación de información: 42.a Conferencia europea sobre investigación de RI, ECIR 2020, Lisboa, Portugal, 14 al 17 de abril de 2020, Actas, Parte I. Cham, Suiza: Springer Nature. pag. 254.ISBN 978-3-030-45438-8.
^ Ammar, Waleed (2019). "Corpus de investigación abierto". Corpus de investigación abierto del Semantic Scholar Lab . Archivado desde el original el 29 de marzo de 2019 . Consultado el 5 de agosto de 2024 .
^ Hannousse, Abdelhakim (2021). "Búsqueda de artículos relevantes para estudios secundarios de ingeniería de software: cobertura y función de identificación de Semantic Scholar". Software IET . 15 (1): 126–146. doi :10.1049/sfw2.12011. ISSN 1751-8814. S2CID 234053002.
^ "AI2 amplía el motor de búsqueda de Semantic Scholar para abarcar la investigación biomédica". GeekWire . 2017-10-17. Archivado desde el original el 19 de enero de 2018 . Consultado el 18 de enero de 2018 .
^ "Movimientos tecnológicos: Allen Institutitue contrata al líder de aprendizaje automático de Amazon Alexa; el presidente de Microsoft asume un nuevo papel de inversor; y más". Cable Geek. 2018-05-02. Archivado desde el original el 10 de mayo de 2018 . Consultado el 9 de mayo de 2018 .
^ "Erudito semántico". Académico semántico . Archivado desde el original el 11 de agosto de 2019 . Consultado el 11 de agosto de 2019 .
^ "AI2 une fuerzas con Microsoft Research para actualizar las herramientas de búsqueda para estudios científicos". GeekWire . 2018-12-05. Archivado desde el original el 25 de agosto de 2019 . Consultado el 25 de agosto de 2019 .
^ "La University of Chicago Press se une a más de 500 editores que trabajan con Semantic Scholar para mejorar la búsqueda y la capacidad de descubrimiento". RCNi Company Limited . Consultado el 22 de noviembre de 2021 .
^ Dunn, Adriana (14 de diciembre de 2020). "Semantic Scholar agrega 25 millones de artículos científicos en 2020 a través de nuevas asociaciones con editores" (PDF) . Académico semántico . Consultado el 22 de noviembre de 2021 .

enlaces externos

Wikidata tiene las propiedades:

ID de tema de Semantic Scholar (P6611) (ver usos )
ID de autor de Semantic Scholar (P4012) (ver usos )
ID del corpus Semantic Scholar (P8299) (ver usos )
ID del artículo de Semantic Scholar (P4011) (ver usos )

Página web oficial