Base de datos de investigación
AMiner (anteriormente ArnetMiner ) es un servicio en línea gratuito que se utiliza para indexar, buscar y extraer grandes cantidades de datos científicos .
Descripción general
AMiner (ArnetMiner) está diseñado para buscar y realizar operaciones de minería de datos contra publicaciones académicas en Internet , utilizando análisis de redes sociales para identificar conexiones entre investigadores, conferencias y publicaciones. [1] Esto le permite proporcionar servicios como búsqueda de expertos, búsqueda geográfica, análisis de tendencias, recomendación de revisores, búsqueda de asociaciones, búsqueda de cursos, evaluación del desempeño académico y modelado de temas.
AMiner fue creado como un proyecto de investigación en análisis de influencia social, clasificación de redes sociales y extracción de redes sociales. Se han publicado varios artículos revisados por pares como resultado del desarrollo del sistema. Ha estado en funcionamiento durante más de tres años y ha indexado a 130.000.000 de investigadores y más de 265 millones de publicaciones. [2] La investigación fue financiada por el Programa Nacional de Investigación y Desarrollo de Alta Tecnología de China y la Fundación Nacional de Ciencias de China .
AMiner se utiliza habitualmente en el ámbito académico para identificar relaciones y establecer correlaciones estadísticas entre investigaciones e investigadores. Ha atraído más de 10 millones de accesos IP independientes de 220 países y regiones. El producto se ha utilizado en la plataforma SciVerse de Elsevier [3] y en conferencias académicas como SIGKDD, ICDM, PKDD y WSDM.
Operación
AMiner extrae automáticamente el perfil del investigador de la web. Recopila e identifica las páginas relevantes y luego utiliza un enfoque unificado para extraer datos de los documentos identificados. También extrae publicaciones de bibliotecas digitales en línea utilizando reglas heurísticas.
Integra los perfiles de los investigadores extraídos y las publicaciones extraídas. Emplea el nombre del investigador como identificador. Se ha propuesto un marco probabilístico para abordar el problema de la ambigüedad del nombre en la integración. Los datos integrados se almacenan en una base de conocimiento de la red de investigadores (RNKB).
Los otros productos principales en este área son Google Scholar, Scirus de Elsevier y el proyecto de código abierto CiteSeer.
Historia
Fue iniciado y creado por el profesor Jie Tang de la Universidad de Tsinghua , China. Se lanzó por primera vez en marzo de 2006. A continuación, se ofrece una lista de actualizaciones de los últimos años:
- Marzo de 2006, versión 0.1. Las funciones incluyen creación de perfiles de investigadores, búsqueda de expertos, búsqueda de conferencias y búsqueda de publicaciones. El sistema se desarrolló en Perl;
- Agosto de 2006, Versión 1.0, El sistema fue reimplementado en Java;
- Julio de 2007, versión 2.0, las nuevas funciones incluyen minería de intereses del investigador, búsqueda de asociaciones y búsqueda de artículos de encuestas (no disponible actualmente);
- Abril de 2008, versión 3.0, las nuevas funciones incluyen comprensión de consultas , nueva GUI y análisis de registros de búsqueda;
- Noviembre de 2008, versión 4.0, las nuevas funciones incluyen búsqueda de gráficos, modelado de temas y extracción de información de financiación de NSF/NSFC;
- Abril de 2009, versión 5.0, las nuevas funciones incluyen edición de perfil, servicio de API abierta, búsqueda en Bole, búsqueda de cursos (no disponible ahora);
- Diciembre de 2009, versión 6.0, las nuevas funciones incluyen evaluación del desempeño académico, retroalimentación de los usuarios y análisis de conferencias;
- Mayo de 2010, versión 7.0, las nuevas funciones incluyen desambiguación de nombres, recomendación de revisores de artículos y creación de ArnetPage;
- Marzo de 2012, versión II, renombrada como AMiner, se reescribieron todos los códigos y se rediseñó la interfaz gráfica de usuario. Las nuevas funciones incluyen: búsqueda geográfica, plataforma ArnetAPP.
- Junio de 2014, Versión II, renombrada como AMiner, reescribió todos los códigos y rediseñó la GUI. Las nuevas funciones incluyen: búsqueda geográfica, plataforma ArnetAPP.
- En diciembre de 2015 se puso en línea una versión completamente nueva.
- En mayo de 2017 se puso en línea la versión profesional.
- Abril de 2018, las nuevas funciones incluyen análisis de tendencias, [4] una desambiguación de nombres basada en aprendizaje profundo [5]
Recursos
AMiner publicó varios conjuntos de datos para fines de investigación académica, incluidos Open Academic Graph, [6] DBLP+citation [7] (un conjunto de datos que aumenta las citas en los datos DBLP de Digital Bibliography & Library Project ), Name Disambiguation, [8] Social Tie Analysis. [9] Para obtener más conjuntos de datos y códigos fuente disponibles para investigación, consulte. [10]
Véase también
Referencias
- ^ Jie Tang; Jing Zhang; Limin Yao; Juanzi Li; Li Zhang; Zhong Su (2008). "ArnetMiner". Actas de la 14.ª conferencia internacional ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos . Nueva York: ACM. págs. 990–998. doi :10.1145/1401890.1402008. ISBN . 9781605581934.S2CID3348552 .
- ^ "Arnetminer: introducción" . Consultado el 17 de diciembre de 2020 .
- ^ "SciVerse - HUB - Home". Archivado desde el original el 9 de septiembre de 2012 . Consultado el 24 de abril de 2012 .
- ^ "Análisis de tendencias" . Consultado el 24 de diciembre de 2018 .
- ^ Yutao Zhang; Fanjin Zhang; Peiran Yao; Jie Tang (2018). "Desambiguación de nombres en AMiner". Actas de la 24.ª Conferencia internacional ACM SIGKDD sobre descubrimiento de conocimientos y minería de datos . Londres: ACM. págs. 1002–1011. doi :10.1145/3219819.3219859. ISBN. 9781450355520. Número de identificación del sujeto 207579405.
- ^ "Gráfico académico abierto" . Consultado el 24 de diciembre de 2018 .
- ^ "Documentos DBLP + relación de citas" . Consultado el 24 de diciembre de 2018 .
- ^ "Desambiguación de nombres" . Consultado el 24 de abril de 2012 .
- ^ "Inferir vínculos sociales en grandes redes" . Consultado el 24 de abril de 2012 .
- ^ "Datos y códigos abiertos de ArnetMiner" . Consultado el 24 de abril de 2012 .
Enlaces externos
- AMiner.org (Arnetminer.org ahora está archivado)
- AMiner.cn
Lectura adicional
- Jie Tang, Jing Zhang, Limin Yao, Juanzi Li, Li Zhang, Zhong Su. Arnetminer: extracción y minería de redes sociales académicas. En Actas de la 14.ª conferencia internacional ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos (SIGKDD'2008)
- Chi Wang, Jiawei Han , Yuntao Jia, Jie Tang , Duo Zhang, Yintao Yu y Jingyi Guo. Relaciones entre asesores y asesores en minería de datos en redes de publicaciones de investigación. En las Actas de la Decimosexta Conferencia Internacional ACM SIGKDD sobre Descubrimiento de Conocimiento y Minería de Datos (SIGKDD'2010).
- Jie Tang , Jimeng Sun, Chi Wang y Zi Yang. Análisis de la influencia social en redes a gran escala. En Actas de la decimoquinta conferencia internacional ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos (SIGKDD'2009). págs. 807–816.
- Jie Tang , Ruoming Jin y Jing Zhang. Un enfoque de modelado de temas y su integración en el marco de trabajo de caminata aleatoria para la búsqueda académica. En Actas de la Conferencia Internacional IEEE de 2008 sobre Minería de Datos (ICDM'2008). págs. 1055–1060.
- Jie Tang , Limin Yao, Duo Zhang y Jing Zhang. Un enfoque combinado para la elaboración de perfiles de usuarios web. ACM Transactions on Knowledge Discovery from Data (TKDD), (vol. 5, núm. 1), artículo 2 (diciembre de 2010), 44 páginas.
- Yutao Zhang, Fanjin Zhang, Peiran Yao y Jie Tang . Desambiguación de nombres en AMiner: agrupamiento, mantenimiento y participación humana. En Actas de la vigésimo cuarta conferencia internacional ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos (KDD'18). págs. 1002-1011.