Software de generación de texto aleatorio
SCIgen es un generador de artículos que utiliza gramática libre de contexto para generar aleatoriamente tonterías en forma de artículos de investigación en informática . Su fuente de datos original fue una colección de artículos de informática descargados de CiteSeer . Se forman todos los elementos de los artículos, incluidos gráficos, diagramas y citas . Creado por científicos del Instituto Tecnológico de Massachusetts , su objetivo declarado es "maximizar la diversión, en lugar de la coherencia". [1] Originalmente creado en 2005 para exponer la falta de escrutinio de las presentaciones a conferencias, el generador posteriormente comenzó a usarse, principalmente por académicos chinos, para crear grandes cantidades de presentaciones fraudulentas a conferencias, lo que llevó a la retractación de 122 artículos generados por SCIgen y a la creación de software de detección para combatir su uso. [2]
Ejemplo de salida
Resumen de apertura de Rooter: una metodología para la unificación típica de puntos de acceso y redundancia : [3]
Muchos físicos estarían de acuerdo en que, de no haber sido por el control de la congestión, la evaluación de los navegadores web tal vez nunca se hubiera producido. De hecho, pocos hackers en todo el mundo estarían en desacuerdo con la unificación esencial de la voz sobre IP y el par de claves pública/privada. Para resolver este enigma, confirmamos que los SMP pueden hacerse estocásticos, almacenables en caché e interponibles.
Resultados destacados
En 2005, un artículo generado por SCIgen, Rooter: A Methodology for the Typical Unification of Access Points and Redundancy , fue aceptado como artículo no revisado en la Multiconferencia Mundial sobre Sistémica, Cibernética e Informática (WMSCI) de 2005 y los autores fueron invitados a hablar. Los autores de SCIgen describieron su engaño en su sitio web, y pronto recibió una gran publicidad cuando fue recogido por Slashdot . WMSCI retiró su invitación, pero el equipo de SCIgen fue de todos modos, alquilando espacio en el hotel por separado de la conferencia y brindando una serie de charlas generadas aleatoriamente en su propia "pista". El organizador de estas conferencias WMSCI es el profesor Nagib Callaos. Desde 2000 hasta 2005, la WMSCI también fue patrocinada por el Instituto de Ingenieros Eléctricos y Electrónicos . [4] El IEEE dejó de otorgar patrocinio a Callaos desde 2006 hasta 2008.
El envío del artículo fue un intento deliberado de poner en aprietos a WMSCI, que según los autores acepta artículos de baja calidad y envía solicitudes no solicitadas de envíos masivos a académicos. Como afirma el sitio web de SCIgen:
Un programa de este tipo tiene como finalidad generar automáticamente presentaciones para congresos que sospeche que pueden tener estándares de presentación muy bajos. Un buen ejemplo, que puede reconocer en el correo basura que recibe en su bandeja de entrada, es SCI/IIIS y sus docenas de congresos que se celebran en el mismo lugar (consulte la descripción muy amplia de los congresos en el sitio web de WMSCI 2005).
— Acerca de SCIgen [5]
El escritor informático Stan Kelly-Bootle señaló en ACM Queue que muchas frases del artículo "Rooter" eran plausibles individualmente, lo que consideraba que planteaba un problema para la detección automática de artículos falsos. Sugirió que incluso los lectores humanos podrían verse engañados por el uso efectivo de la jerga ("El juego de palabras entre raíz y enrutador es habitual en el humor de los graduados del MIT, y es obligatorio que aparezca al menos una vez la palabra metodología") y atribuir la aparente incoherencia del artículo a su propio conocimiento limitado. Su conclusión fue que "un filtro fiable de jerga requiere una revisión holística cuidadosa por parte de varios expertos en el tema". [6]
Schlangeman
El seudónimo "Herbert Schlangemann" se utilizó para publicar artículos científicos falsos en congresos internacionales que afirmaban practicar la revisión por pares . El nombre proviene del cortometraje sueco Der Schlangemann .
- En 2008, en respuesta a una serie de correos electrónicos de convocatoria de artículos , se utilizó SCIgen para generar un artículo científico falso titulado Towards the Simulation of E-Commerce ( Hacia la simulación del comercio electrónico) , en el que se utilizaba a "Herbert Schlangemann" como autor. El artículo fue aceptado en la Conferencia Internacional de Ciencias de la Computación e Ingeniería de Software (CSSE 2008) de 2008 , copatrocinada por el IEEE , que se celebraría en Wuhan, China , y el autor fue invitado a presidir una sesión en base a su currículum vitae ficticio . [7] El comentario oficial de la revisión: "Este artículo presenta la tecnología cooperativa y la comunicación clásica. En conclusión, el resultado muestra que, aunque el tan promocionado algoritmo anfibio para el refinamiento de algoritmos aleatorios es imposible, el conocido algoritmo cliente-servidor para el análisis de voz sobre IP de Kumar y Raman se ejecuta en tiempo _(n). Los autores pueden identificar claramente características importantes de visualización de DHT y analizarlas con perspicacia. Se recomienda que los autores desarrollen ideas de manera más convincente, las organicen de manera más lógica y las conecten con transiciones claras". El artículo estuvo disponible durante un corto tiempo en la base de datos IEEE Xplore, pero luego fue eliminado. La historia completa se describe en el blog oficial "Herbert Schlangemann" , [8] y también recibió atención en Slashdot [9] y el sitio de noticias tecnológicas en idioma alemán Heise Online. [10] [11]
- En 2009, ocurrió el mismo incidente y el último artículo falso de Herbert Schlangemann , PlusPug: A Methodology for the Improvement of Local-Area Networks, fue aceptado para presentación oral en la Conferencia Internacional de 2009 sobre Seguridad de Sistemas de Información y Comercio Electrónico (EBISS 2009) , también copatrocinada por IEEE , que se realizará nuevamente en Wuhan, China . [8]
En todos los casos, los artículos publicados fueron retirados de las actas de las conferencias y el comité organizador de la conferencia, así como los nombres de los oradores principales, fueron eliminados de sus sitios web.
Lista de obras con aceptación notable
En conferencias
- Rob Thomas: Rooter: una metodología para la unificación típica de puntos de acceso y redundancia , 2005 para WMSCI (ver arriba)
- El artículo de Mathias Uslar fue aceptado en la conferencia IPSI-BG. [12]
- El profesor Genco Gulan publicó un artículo en el 3er Simposio Internacional de Diseño de Medios Interactivos. [13]
- Un artículo de cienciometría de 2013 demostró que IEEE y Springer han publicado al menos 85 artículos de SCIgen . [14] Según esta investigación, se eliminaron más de 120 artículos de SCIgen. [15]
En revistas
- Los estudiantes de la Universidad Sharif de Tecnología de Irán publicaron un artículo en la revista Journal of Applied Mathematics and Computation de Elsevier . [16] Los estudiantes escribieron bajo el apellido "MosallahNejad", que se traduce literalmente del idioma persa (a pesar de no ser un nombre persa tradicional ) como "de una raza armada". El artículo fue posteriormente eliminado cuando se informó a los editores que era un artículo de broma. [17]
- En agosto de 2008, Mikhail Gelfand publicó una traducción del artículo "Rooter" en la revista en idioma ruso Journal of Scientific Publications of Aspirants and Doctorants. Gelfand protestaba contra la revista, que aparentemente no estaba revisada por pares y estaba siendo utilizada por candidatos rusos a doctorado para publicar en una revista científica " acreditada ", cobrándoles 4000 rublos por hacerlo. La acreditación fue revocada dos semanas después. [18] [19] [20] [21] (Véase Dissernet para obtener información relacionada.)
- Springer Science+Business Media e IEEE también fueron objeto de bromas similares.
Falsificando Google Scholar yyo-calculadoras de índice
El arbitraje realizado en nombre del Instituto de Ingenieros Eléctricos y Electrónicos también ha sido objeto de críticas después de que se descubrieran artículos falsos en publicaciones de conferencias, en particular los de Labbé y un investigador que usaba el seudónimo de Schlangemann. [22] [23] [24] [25] [26] [27]
Cyril Labbé, de la Universidad de Grenoble, demostró la vulnerabilidad de los cálculos del índice h basados en los resultados de Google Scholar al introducir en un artículo de 2010 un gran conjunto de documentos generados por SCIgen que se citaban entre sí (es decir, una granja de enlaces académicos). Con este método, el autor logró situar a "Ike Antkare" por delante de Albert Einstein , por ejemplo. [28]
Retractaciones de 2013
En 2013, Springer y el IEEE retiraron más de 122 artículos de conferencias publicados creados por SCIgen . A diferencia de los artículos anteriores que tenían la intención de ser una broma, este fue presentado en gran parte por académicos chinos, que estaban usando los artículos de SCIgen para mejorar su historial de publicaciones. [29]
Detectar ciencia
En 2015, Springer lanzó SciDetect , un software desarrollado por Cyril Labbé que está diseñado para detectar automáticamente los artículos generados por SCIgen. [2]
Informe 2021
En 2021, se publicó un estudio sobre 243 artículos de SCIgen que se habían publicado en la literatura académica. Se descubrió que los artículos de SCIgen representaban 75 por millón de artículos (< 0,01 %) en ciencias de la información, y que solo una pequeña fracción de los artículos detectados había sido abordada. [30] [31]
Véase también
Referencias
- ^ SCIgen - Un generador automático de artículos de informática
- ^ ab Bohannon, John (27 de marzo de 2015). "Un software que detecta fraudes detecta artículos falsos". Ciencia | AAAS . Consultado el 28 de septiembre de 2020 .
En lugar de haber sido creados como bromas, parece que muchos de los artículos falsos provenían de China, donde fueron "comprados por académicos y estudiantes" para engrosar sus registros de publicaciones, dice el investigador principal detrás de la investigación, Cyril Labbé, un científico informático de la Universidad Joseph Fourier en Grenoble, Francia.
- ^ Stribling, Jeremy; Aguayo, Daniel; Krohn, Maxwell. "Rooter: una metodología para la unificación típica de puntos de acceso y redundancia" (PDF) .
- ^ Heinrich Zankl: Der Science-Generator-ein geniales Publikationsprogramm . En W. Hömberg, E. Roloff (Herausgeber): Jahrbuch der Marginalistik IV: Lit-Verlag. Münster. 2016 págs. 60–67. ISBN 978-3-643-99793-7
- ^ "SCIgen - Un generador automático de artículos de informática". MIT.
- ^ Stan Kelly-Bootle (julio-agosto de 2005). "¿A eso le llamas galimatías?". ACM Queue . 3 (6): 64. doi : 10.1145/1080862.1080884 .
- ^ "Programa de conferencias CSSE" (PDF) .
- ^ ab "El blog oficial de Herbert Schlangemann, La historia completa detrás del artículo "Hacia la simulación del comercio electrónico"".
- ^ kdawson (24 de diciembre de 2008). "Artículo generado por software aceptado en la conferencia IEEE". Slashdot . VA Linux Systems Japan . Consultado el 5 de mayo de 2009 .
- ^ Peter-Michael Ziegler (26 de diciembre de 2008). "Dr. Herbert Schlangemann - oder die Geschichte eines pseudowissenschaftlichen Nonsens-Papiers (en alemán)". Heise en línea . Heise Zeitschriften Verlag . Consultado el 5 de mayo de 2009 .
- ^ Página web de Heise Online (en alemán)
- ^ "Artículo de Mathias Uslar". Archivado desde el original el 15 de junio de 2009.
- ^ "Sobre el artículo de Genco Gulan".
- ^ "Publicaciones duplicadas y falsas en la literatura científica: ¿cuántos artículos de SCIgen hay en informática?" (PDF) . Hal.archives-ouvertes.fr . Consultado el 15 de mayo de 2014 .
- ^ "Los editores retiran más de 120 artículos sin fundamento". Nature . 24 de febrero de 2014 . Consultado el 25 de febrero de 2014 .
- ^ Rohollah Mosallahnezhad. "Algoritmos cooperativos y compactos para algoritmos aleatorios" (PDF) . Archivado desde el original (PDF) el 29 de diciembre de 2009.
- ^ Rohollah Mosallahnezhad (2007), "ELIMINADO: Algoritmos cooperativos y compactos para algoritmos aleatorios", Applied Mathematics and Computation , doi :10.1016/j.amc.2007.03.011
- ^ "¡Mon ordinateur écrit mieux que le tien!". Agencia Science-Presse (en francés). Canadá. 8 de septiembre de 2009 . Consultado el 4 de octubre de 2011 .
- ^ "Rooter invade Rusia". SCIgen . 8 de enero de 2009. Archivado desde el original el 3 de abril de 2014 . Consultado el 4 de octubre de 2011 .
- ^ Malozemov, Sergei (7 de octubre de 2008). Группа отечественных ученых поставила эксперимент — смешала сложные термины случайным образом, а полученный текст а в один из научных журналов. NTV (en ruso) . Consultado el 4 de octubre de 2011 .
- ^ "Retroalimentación". New Scientist . 15 de agosto de 2009.
- ^ Labbé, Cyril; Labbé, Dominique (2013). "Publicaciones duplicadas y falsas en la literatura científica: ¿cuántos artículos de SCIgen hay en informática?". Scientometrics . 94 (1): 379–396. doi :10.1007/s11192-012-0781-y. S2CID 6889400.
- ^ Oransky, Ivan (24 de febrero de 2014). «Springer y el IEEE retiran más de 120 artículos sin sentido». retractionwatch.com . WordPress.com . Consultado el 29 de abril de 2014 .
- ^ de Gloucester, Paul Colin (2013). "Los árbitros a menudo pasan por alto errores obvios en publicaciones electrónicas y por computadora". Responsabilidad en la investigación: políticas y garantía de calidad . 20 (3): 143–166. Bibcode :2013ARPQ...20..143D. doi :10.1080/08989621.2013.788379. PMID 23672521. S2CID 42975675.
- ^ Dawson, K. (23 de diciembre de 2008). "Software-Generated Paper Accepted At IEEE Conference" (Artículo generado por software aceptado en la conferencia IEEE). slashdot.org . Dice . Consultado el 29 de abril de 2014 .
- ^ Hatta, Masayuki (24 de diciembre de 2008). "IEEEカンファレンス、自動生成のニセ論文をアクセプト". slashdot.jp (en japonés). Corporación OSDN . Consultado el 29 de abril de 2014 .
- ^ Ziegler, Peter-Michael (26 de diciembre de 2008). "Dr. Herbert Schlangemann - oder die Geschichte eines pseudowissenschaftlichen Nonsens-Papiers". heise.de (en alemán). Heise Zeitschriften Verlag . Consultado el 29 de abril de 2014 .
- ^ "Les rapports de recherche du LIG" (PDF) . Rr.liglab.fr . Consultado el 15 de mayo de 2014 .
- ^ Van Noorden, Richard (2014). «Los editores retiran más de 120 artículos sin sentido». Nature News . doi : 10.1038/nature.2014.14763 .
- ^ Cabanac, Guillaume; Labbé, Cyril (25 de mayo de 2021). «Prevalencia de artículos generados algorítmicamente sin sentido en la literatura científica». Revista de la Asociación de Ciencia y Tecnología de la Información . 72 (12): 1461–1476. doi : 10.1002/asi.24495 . ISSN 2330-1635. S2CID 236374033.
- ^ Noorden, Richard Van (27 de mayo de 2021). «Cientos de artículos sin sentido todavía acechan en la literatura científica». Nature . 594 (7862): 160–161. Bibcode :2021Natur.594..160V. doi :10.1038/d41586-021-01436-7. PMID 34045760. S2CID 235232305.
Lectura adicional
- Ball, Philip (2005). "Conferencia de informática da la bienvenida a un artículo galimatías". Nature . 434 (7036): 946. Bibcode :2005Natur.434..946B. doi : 10.1038/nature03653 . PMID 15846311.
- kdawson (24 de diciembre de 2008). "Artículo generado por software aceptado en la conferencia IEEE". Slashdot . VA Linux Systems Japan . Consultado el 5 de mayo de 2009 .
- Peter-Michael Ziegler (26 de diciembre de 2008). "Dr. Herbert Schlangemann - oder die Geschichte eines pseudowissenschaftlichen Nonsens-Papiers (en alemán)". Heise en línea . Heise Zeitschriften Verlag . Consultado el 5 de mayo de 2009 .
Enlaces externos
- Copia del artículo falso: Hacia la simulación del comercio electrónico de Herbert Schlangemann
- SCIgen - Un generador automático de documentos CS
- Sitio web de detección de SCIgen