stringtranslate.com

SCIgen

SCIgen es un generador de artículos que utiliza gramática libre de contexto para generar aleatoriamente tonterías en forma de artículos de investigación en informática . Su fuente de datos original fue una colección de artículos de informática descargados de CiteSeer . Se forman todos los elementos de los artículos, incluidos gráficos, diagramas y citas . Creado por científicos del Instituto Tecnológico de Massachusetts , su objetivo declarado es "maximizar la diversión, en lugar de la coherencia". [1] Originalmente creado en 2005 para exponer la falta de escrutinio de las presentaciones a conferencias, el generador posteriormente comenzó a usarse, principalmente por académicos chinos, para crear grandes cantidades de presentaciones fraudulentas a conferencias, lo que llevó a la retractación de 122 artículos generados por SCIgen y a la creación de software de detección para combatir su uso. [2]

Ejemplo de salida

Resumen de apertura de Rooter: una metodología para la unificación típica de puntos de acceso y redundancia : [3]

Muchos físicos estarían de acuerdo en que, de no haber sido por el control de la congestión, la evaluación de los navegadores web tal vez nunca se hubiera producido. De hecho, pocos hackers en todo el mundo estarían en desacuerdo con la unificación esencial de la voz sobre IP y el par de claves pública/privada. Para resolver este enigma, confirmamos que los SMP pueden hacerse estocásticos, almacenables en caché e interponibles.

Resultados destacados

En 2005, un artículo generado por SCIgen, Rooter: A Methodology for the Typical Unification of Access Points and Redundancy , fue aceptado como artículo no revisado en la Multiconferencia Mundial sobre Sistémica, Cibernética e Informática (WMSCI) de 2005 y los autores fueron invitados a hablar. Los autores de SCIgen describieron su engaño en su sitio web, y pronto recibió una gran publicidad cuando fue recogido por Slashdot . WMSCI retiró su invitación, pero el equipo de SCIgen fue de todos modos, alquilando espacio en el hotel por separado de la conferencia y brindando una serie de charlas generadas aleatoriamente en su propia "pista". El organizador de estas conferencias WMSCI es el profesor Nagib Callaos. Desde 2000 hasta 2005, la WMSCI también fue patrocinada por el Instituto de Ingenieros Eléctricos y Electrónicos . [4] El IEEE dejó de otorgar patrocinio a Callaos desde 2006 hasta 2008.

El envío del artículo fue un intento deliberado de poner en aprietos a WMSCI, que según los autores acepta artículos de baja calidad y envía solicitudes no solicitadas de envíos masivos a académicos. Como afirma el sitio web de SCIgen:

Un programa de este tipo tiene como finalidad generar automáticamente presentaciones para congresos que sospeche que pueden tener estándares de presentación muy bajos. Un buen ejemplo, que puede reconocer en el correo basura que recibe en su bandeja de entrada, es SCI/IIIS y sus docenas de congresos que se celebran en el mismo lugar (consulte la descripción muy amplia de los congresos en el sitio web de WMSCI 2005).

—  Acerca de SCIgen [5]

El escritor informático Stan Kelly-Bootle señaló en ACM Queue que muchas frases del artículo "Rooter" eran plausibles individualmente, lo que consideraba que planteaba un problema para la detección automática de artículos falsos. Sugirió que incluso los lectores humanos podrían verse engañados por el uso efectivo de la jerga ("El juego de palabras entre raíz y enrutador es habitual en el humor de los graduados del MIT, y es obligatorio que aparezca al menos una vez la palabra metodología") y atribuir la aparente incoherencia del artículo a su propio conocimiento limitado. Su conclusión fue que "un filtro fiable de jerga requiere una revisión holística cuidadosa por parte de varios expertos en el tema". [6]

Schlangeman

El seudónimo "Herbert Schlangemann" se utilizó para publicar artículos científicos falsos en congresos internacionales que afirmaban practicar la revisión por pares . El nombre proviene del cortometraje sueco Der Schlangemann .

En todos los casos, los artículos publicados fueron retirados de las actas de las conferencias y el comité organizador de la conferencia, así como los nombres de los oradores principales, fueron eliminados de sus sitios web.

Lista de obras con aceptación notable

En conferencias

En revistas

Falsificando Google Scholar yyo-calculadoras de índice

El arbitraje realizado en nombre del Instituto de Ingenieros Eléctricos y Electrónicos también ha sido objeto de críticas después de que se descubrieran artículos falsos en publicaciones de conferencias, en particular los de Labbé y un investigador que usaba el seudónimo de Schlangemann. [22] [23] [24] [25] [26] [27]

Cyril Labbé, de la Universidad de Grenoble, demostró la vulnerabilidad de los cálculos del índice h basados ​​en los resultados de Google Scholar al introducir en un artículo de 2010 un gran conjunto de documentos generados por SCIgen que se citaban entre sí (es decir, una granja de enlaces académicos). Con este método, el autor logró situar a "Ike Antkare" por delante de Albert Einstein , por ejemplo. [28]

Retractaciones de 2013

En 2013, Springer y el IEEE retiraron más de 122 artículos de conferencias publicados creados por SCIgen . A diferencia de los artículos anteriores que tenían la intención de ser una broma, este fue presentado en gran parte por académicos chinos, que estaban usando los artículos de SCIgen para mejorar su historial de publicaciones. [29]

Detectar ciencia

En 2015, Springer lanzó SciDetect , un software desarrollado por Cyril Labbé que está diseñado para detectar automáticamente los artículos generados por SCIgen. [2]

Informe 2021

En 2021, se publicó un estudio sobre 243 artículos de SCIgen que se habían publicado en la literatura académica. Se descubrió que los artículos de SCIgen representaban 75 por millón de artículos (<  0,01 %) en ciencias de la información, y que solo una pequeña fracción de los artículos detectados había sido abordada. [30] [31]

Véase también

Referencias

  1. ^ SCIgen - Un generador automático de artículos de informática
  2. ^ ab Bohannon, John (27 de marzo de 2015). "Un software que detecta fraudes detecta artículos falsos". Ciencia | AAAS . Consultado el 28 de septiembre de 2020 . En lugar de haber sido creados como bromas, parece que muchos de los artículos falsos provenían de China, donde fueron "comprados por académicos y estudiantes" para engrosar sus registros de publicaciones, dice el investigador principal detrás de la investigación, Cyril Labbé, un científico informático de la Universidad Joseph Fourier en Grenoble, Francia.
  3. ^ Stribling, Jeremy; Aguayo, Daniel; Krohn, Maxwell. "Rooter: una metodología para la unificación típica de puntos de acceso y redundancia" (PDF) .
  4. ^ Heinrich Zankl: Der Science-Generator-ein geniales Publikationsprogramm . En W. Hömberg, E. Roloff (Herausgeber): Jahrbuch der Marginalistik IV: Lit-Verlag. Münster. 2016 págs. 60–67. ISBN 978-3-643-99793-7 
  5. ^ "SCIgen - Un generador automático de artículos de informática". MIT.
  6. ^ Stan Kelly-Bootle (julio-agosto de 2005). "¿A eso le llamas galimatías?". ACM Queue . 3 (6): 64. doi : 10.1145/1080862.1080884 .
  7. ^ "Programa de conferencias CSSE" (PDF) .
  8. ^ ab "El blog oficial de Herbert Schlangemann, La historia completa detrás del artículo "Hacia la simulación del comercio electrónico"".
  9. ^ kdawson (24 de diciembre de 2008). "Artículo generado por software aceptado en la conferencia IEEE". Slashdot . VA Linux Systems Japan . Consultado el 5 de mayo de 2009 .
  10. ^ Peter-Michael Ziegler (26 de diciembre de 2008). "Dr. Herbert Schlangemann - oder die Geschichte eines pseudowissenschaftlichen Nonsens-Papiers (en alemán)". Heise en línea . Heise Zeitschriften Verlag . Consultado el 5 de mayo de 2009 .
  11. ^ Página web de Heise Online (en alemán)
  12. ^ "Artículo de Mathias Uslar". Archivado desde el original el 15 de junio de 2009.
  13. ^ "Sobre el artículo de Genco Gulan".
  14. ^ "Publicaciones duplicadas y falsas en la literatura científica: ¿cuántos artículos de SCIgen hay en informática?" (PDF) . Hal.archives-ouvertes.fr . Consultado el 15 de mayo de 2014 .
  15. ^ "Los editores retiran más de 120 artículos sin fundamento". Nature . 24 de febrero de 2014 . Consultado el 25 de febrero de 2014 .
  16. ^ Rohollah Mosallahnezhad. "Algoritmos cooperativos y compactos para algoritmos aleatorios" (PDF) . Archivado desde el original (PDF) el 29 de diciembre de 2009.
  17. ^ Rohollah Mosallahnezhad (2007), "ELIMINADO: Algoritmos cooperativos y compactos para algoritmos aleatorios", Applied Mathematics and Computation , doi :10.1016/j.amc.2007.03.011
  18. ^ "¡Mon ordinateur écrit mieux que le tien!". Agencia Science-Presse (en francés). Canadá. 8 de septiembre de 2009 . Consultado el 4 de octubre de 2011 .
  19. ^ "Rooter invade Rusia". SCIgen . 8 de enero de 2009. Archivado desde el original el 3 de abril de 2014 . Consultado el 4 de octubre de 2011 .
  20. ^ Malozemov, Sergei (7 de octubre de 2008). Группа отечественных ученых поставила эксперимент — смешала сложные термины случайным образом, а полученный текст а в один из научных журналов. NTV (en ruso) . Consultado el 4 de octubre de 2011 .
  21. ^ "Retroalimentación". New Scientist . 15 de agosto de 2009.
  22. ^ Labbé, Cyril; Labbé, Dominique (2013). "Publicaciones duplicadas y falsas en la literatura científica: ¿cuántos artículos de SCIgen hay en informática?". Scientometrics . 94 (1): 379–396. doi :10.1007/s11192-012-0781-y. S2CID  6889400.
  23. ^ Oransky, Ivan (24 de febrero de 2014). «Springer y el IEEE retiran más de 120 artículos sin sentido». retractionwatch.com . WordPress.com . Consultado el 29 de abril de 2014 .
  24. ^ de Gloucester, Paul Colin (2013). "Los árbitros a menudo pasan por alto errores obvios en publicaciones electrónicas y por computadora". Responsabilidad en la investigación: políticas y garantía de calidad . 20 (3): 143–166. Bibcode :2013ARPQ...20..143D. doi :10.1080/08989621.2013.788379. PMID  23672521. S2CID  42975675.
  25. ^ Dawson, K. (23 de diciembre de 2008). "Software-Generated Paper Accepted At IEEE Conference" (Artículo generado por software aceptado en la conferencia IEEE). slashdot.org . Dice . Consultado el 29 de abril de 2014 .
  26. ^ Hatta, Masayuki (24 de diciembre de 2008). "IEEEカンファレンス、自動生成のニセ論文をアクセプト". slashdot.jp (en japonés). Corporación OSDN . Consultado el 29 de abril de 2014 .
  27. ^ Ziegler, Peter-Michael (26 de diciembre de 2008). "Dr. Herbert Schlangemann - oder die Geschichte eines pseudowissenschaftlichen Nonsens-Papiers". heise.de (en alemán). Heise Zeitschriften Verlag . Consultado el 29 de abril de 2014 .
  28. ^ "Les rapports de recherche du LIG" (PDF) . Rr.liglab.fr . Consultado el 15 de mayo de 2014 .
  29. ^ Van Noorden, Richard (2014). «Los editores retiran más de 120 artículos sin sentido». Nature News . doi : 10.1038/nature.2014.14763 .
  30. ^ Cabanac, Guillaume; Labbé, Cyril (25 de mayo de 2021). «Prevalencia de artículos generados algorítmicamente sin sentido en la literatura científica». Revista de la Asociación de Ciencia y Tecnología de la Información . 72 (12): 1461–1476. doi : 10.1002/asi.24495 . ISSN  2330-1635. S2CID  236374033.
  31. ^ Noorden, Richard Van (27 de mayo de 2021). «Cientos de artículos sin sentido todavía acechan en la literatura científica». Nature . 594 (7862): 160–161. Bibcode :2021Natur.594..160V. doi :10.1038/d41586-021-01436-7. PMID  34045760. S2CID  235232305.

Lectura adicional

Enlaces externos