Base de datos de investigación
AMiner (anteriormente ArnetMiner ) es un servicio en línea gratuito que se utiliza para indexar, buscar y extraer grandes datos científicos .
Descripción general
AMiner (ArnetMiner) está diseñado para buscar y realizar operaciones de extracción de datos en publicaciones académicas en Internet , utilizando análisis de redes sociales para identificar conexiones entre investigadores, conferencias y publicaciones. [1] Esto le permite proporcionar servicios tales como búsqueda de expertos, búsqueda geográfica, análisis de tendencias, recomendación de revisores, búsqueda de asociaciones, búsqueda de cursos, evaluación del desempeño académico y modelado de temas.
AMiner se creó como un proyecto de investigación en análisis de influencia social, clasificación de redes sociales y extracción de redes sociales. Se han publicado varios artículos revisados por pares derivados del desarrollo del sistema. Lleva más de tres años en funcionamiento y ha indexado 130.000.000 de investigadores y más de 265 millones de publicaciones. [2] La investigación fue financiada por el Programa Nacional Chino de I+D de Alta Tecnología y la Fundación Nacional de Ciencias de China .
AMiner se usa comúnmente en el mundo académico para identificar relaciones y establecer correlaciones estadísticas sobre la investigación y los investigadores. Ha atraído más de 10 millones de accesos IP independientes de 220 países y regiones. El producto se ha utilizado en la plataforma SciVerse de Elsevier [3] y en conferencias académicas como SIGKDD, ICDM, PKDD, WSDM.
Operación
AMiner extrae automáticamente el perfil del investigador de la web. Recopila e identifica las páginas relevantes y luego utiliza un enfoque unificado para extraer datos de los documentos identificados. También extrae publicaciones de bibliotecas digitales en línea utilizando reglas heurísticas.
Integra los perfiles de los investigadores extraídos y las publicaciones extraídas. Emplea el nombre del investigador como identificador. Se ha propuesto un marco probabilístico para abordar el problema de la ambigüedad de nombres en la integración. Los datos integrados se almacenan en una base de conocimientos de la red de investigadores (RNKB).
Los otros principales productos en el área son Google Scholar, Scirus de Elsevier y el proyecto de código abierto CiteSeer.
Historia
Fue iniciado y creado por el profesor Jie Tang de la Universidad de Tsinghua , China. Se lanzó por primera vez en marzo de 2006. A continuación se proporciona una lista de actualizaciones de los últimos años:
- Marzo de 2006, versión 0.1. Las funciones incluyen elaboración de perfiles de investigadores, búsqueda de expertos, búsqueda de conferencias y búsqueda de publicaciones. El sistema fue desarrollado en Perl;
- Agosto de 2006, Versión 1.0, El sistema fue reimplementado en Java;
- Julio de 2007, versión 2.0. Las nuevas funciones incluyen extracción de intereses de los investigadores, búsqueda de asociaciones y búsqueda de documentos de encuesta (no disponible ahora);
- Abril de 2008, versión 3.0. Las nuevas funciones incluyen comprensión de consultas , nueva GUI y análisis de registros de búsqueda;
- Noviembre de 2008, versión 4.0. Las nuevas funciones incluyen búsqueda de gráficos, modelado de temas, extracción de información de financiación NSF/NSFC;
- Abril de 2009, versión 5.0. Las nuevas funciones incluyen edición de perfil, servicio API abierto, búsqueda de Bole, búsqueda de cursos (no disponible ahora);
- Diciembre de 2009, Versión 6.0. Las nuevas funciones incluyen evaluación del desempeño académico, comentarios de los usuarios, análisis de conferencias;
- Mayo de 2010, versión 7.0. Las nuevas funciones incluyen desambiguación de nombres, recomendación del revisor del artículo, creación de ArnetPage;
- Marzo de 2012, Versión II, rebautizada como AMiner, reescribió todos los códigos y rediseñó la GUI. Las nuevas funciones incluyen: búsqueda geográfica, plataforma ArnetAPP.
- Junio de 2014, Versión II, rebautizada como AMiner, reescribió todos los códigos y rediseñó la GUI. Las nuevas funciones incluyen: búsqueda geográfica, plataforma ArnetAPP.
- En diciembre de 2015, se puso en línea una versión completamente nueva.
- Mayo de 2017, la versión profesional se puso en línea.
- Abril de 2018, las nuevas funciones incluyen análisis de tendencias, [4] una desambiguación de nombres basada en aprendizaje profundo [5]
Recursos
AMiner publicó varios conjuntos de datos con fines de investigación académica, incluido Open Academic Graph, [6] DBLP+citation [7] (un conjunto de datos que aumenta las citas en los datos DBLP del Digital Bibliography & Library Project ), desambiguación de nombres, [8] Social Tie Analysis . [9] Para obtener más conjuntos de datos disponibles y códigos fuente para investigación, consulte. [10]
Ver también
Referencias
- ^ Jie Tang; Jing Zhang; Limin Yao; Juanzi Li; Li Zhang; Zhong Su (2008). "ArnetMiner". Actas de la 14ª conferencia internacional ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos . Nueva York: ACM. págs. 990–998. doi :10.1145/1401890.1402008. ISBN 9781605581934. S2CID 3348552.
- ^ "Arnetminer: introducción" . Consultado el 17 de diciembre de 2020 .
- ^ "SciVerse - HUB - Inicio". Archivado desde el original el 9 de septiembre de 2012 . Consultado el 24 de abril de 2012 .
- ^ "Análisis de tendencias" . Consultado el 24 de diciembre de 2018 .
- ^ Yutao Zhang; Fanjin Zhang; Peiran Yao; Jie Tang (2018). "Desambiguación de nombres en AMiner". Actas de la 24ª Conferencia Internacional ACM SIGKDD sobre Descubrimiento de Conocimiento y Minería de Datos . Londres: ACM. págs. 1002-1011. doi :10.1145/3219819.3219859. ISBN 9781450355520. S2CID 207579405.
- ^ "Abrir gráfico académico" . Consultado el 24 de diciembre de 2018 .
- ^ "Artículos DBLP + Relación de citas" . Consultado el 24 de diciembre de 2018 .
- ^ "Desambiguación de nombres" . Consultado el 24 de abril de 2012 .
- ^ "Inferir vínculos sociales en grandes redes" . Consultado el 24 de abril de 2012 .
- ^ "Datos y códigos abiertos de ArnetMiner" . Consultado el 24 de abril de 2012 .
enlaces externos
- AMiner.org (Arnetminer.org ahora está archivado)
- AMiner.cn
Otras lecturas
- Jie Tang, Jing Zhang, Limin Yao, Juanzi Li, Li Zhang, Zhong Su. Arnetminer: extracción y minado de redes sociales académicas. En actas de la 14ª conferencia internacional ACM SIGKDD sobre descubrimiento de conocimientos y minería de datos (SIGKDD'2008)
- Chi Wang, Jiawei Han , Yuntao Jia, Jie Tang , Duo Zhang, Yintao Yu y Jingyi Guo. Relaciones asesor-asesorado en minería de redes de publicaciones de investigación. En Actas de la Decimosexta Conferencia Internacional ACM SIGKDD sobre Descubrimiento de Conocimiento y Minería de Datos (SIGKDD'2010).
- Jie Tang , Jimeng Sun, Chi Wang y Zi Yang. Análisis de la influencia social en redes de gran escala. En actas de la decimoquinta conferencia internacional ACM SIGKDD sobre descubrimiento de conocimientos y minería de datos (SIGKDD'2009). págs. 807–816.
- Jie Tang , Ruoming Jin y Jing Zhang. Un enfoque de modelado de temas y su integración en el marco de Random Walk para la búsqueda académica. En actas de la Conferencia internacional IEEE sobre minería de datos de 2008 (ICDM'2008). págs. 1055-1060.
- Jie Tang , Limin Yao, Duo Zhang y Jing Zhang. Un enfoque combinado para la elaboración de perfiles de usuarios web. ACM Transactions on Knowledge Discovery from Data (TKDD), (vol. 5 no. 1), artículo 2 (diciembre de 2010), 44 páginas.
- Yutao Zhang, Fanjin Zhang, Peiran Yao y Jie Tang . Desambiguación de nombres en AMiner: agrupación, mantenimiento y humanos en el bucle. En actas de la vigésima cuarta conferencia internacional ACM SIGKDD sobre descubrimiento de conocimientos y minería de datos (KDD'18). págs. 1002-1011.