stringtranslate.com

Análisis de citas

El análisis de citas es el examen de la frecuencia, los patrones y los gráficos de citas en documentos. Utiliza el gráfico dirigido de citas (enlaces de un documento a otro) para revelar las propiedades de los documentos. Un objetivo típico sería identificar los documentos más importantes de una colección. Un ejemplo clásico es el de las citas entre artículos académicos y libros. [1] [2] Otro ejemplo es el de los jueces de derecho que respaldan sus sentencias haciendo referencia a sentencias dictadas en casos anteriores (véase análisis de citas en un contexto legal). Un ejemplo adicional lo proporcionan las patentes que contienen estado de la técnica , citas de patentes anteriores relevantes para la reivindicación actual. La digitalización de los datos de patentes y el aumento de la potencia informática han dado lugar a una comunidad de práctica que utiliza estos datos de citas para medir los atributos de innovación, rastrear los flujos de conocimiento y mapear las redes de innovación. [3]

Los documentos pueden asociarse con muchas otras características además de las citas, como autores, editores, revistas y sus textos reales. El análisis general de colecciones de documentos se conoce como bibliometría y el análisis de citas es una parte clave de ese campo. Por ejemplo, el acoplamiento bibliográfico y la cocitación son medidas de asociación basadas en el análisis de citas (citas compartidas o referencias compartidas). Las citas en una colección de documentos también pueden representarse en formas como un gráfico de citas , como señaló Derek J. de Solla Price en su artículo de 1965 "Networks of Scientific Papers". [4] Esto significa que el análisis de citas se basa en aspectos del análisis de redes sociales y la ciencia de redes .

Un ejemplo temprano de indexación automatizada de citas fue CiteSeer , que se utilizó para citas entre artículos académicos, mientras que Web of Science es un ejemplo de un sistema moderno que incluye más que solo libros y artículos académicos que reflejan una gama más amplia de fuentes de información. Hoy, la indexación automatizada de citas [5] ha cambiado la naturaleza de la investigación de análisis de citas, permitiendo que se analicen millones de citas para detectar patrones a gran escala y descubrir conocimientos . Las herramientas de análisis de citas se pueden utilizar para calcular varias medidas de impacto para los académicos basadas en datos de índices de citas . [6] [7] [nota 1] Estos tienen varias aplicaciones, desde la identificación de árbitros expertos para revisar artículos y propuestas de subvenciones, hasta proporcionar datos transparentes en apoyo de la revisión del mérito académico, la titularidad y las decisiones de promoción. Esta competencia por recursos limitados puede conducir a un comportamiento éticamente cuestionable para aumentar las citas. [8] [9]

Se han hecho muchas críticas a la práctica de utilizar ingenuamente análisis de citas para comparar el impacto de diferentes artículos académicos sin tener en cuenta otros factores que pueden afectar los patrones de citación. [10] Entre estas críticas, una recurrente se centra en los "factores dependientes del campo", que se refieren al hecho de que las prácticas de citación varían de un área de la ciencia a otra, e incluso entre campos de investigación dentro de una disciplina. [11]

Descripción general

Si bien los índices de citas se diseñaron originalmente para la recuperación de información , cada vez se utilizan más para la bibliometría y otros estudios que implican la evaluación de la investigación. Los datos de citas también son la base del popular factor de impacto de las revistas .

Existe una gran cantidad de literatura sobre el análisis de citas, a veces llamado cienciometría , un término inventado por Vasily Nalimov , o más específicamente bibliometría . El campo floreció con la llegada del Science Citation Index , que ahora cubre la literatura fuente desde 1900 en adelante. Las principales revistas del campo son Scientometrics , Informetrics y Journal of the Association for Information Science and Technology . ASIST también alberga una lista de correo electrónico llamada SIGMETRICS en ASIST. [12] Este método está experimentando un resurgimiento basado en la amplia difusión de las bases de datos de suscripción Web of Science y Scopus en muchas universidades, y las herramientas de citación gratuitas universalmente disponibles como CiteBase, CiteSeerX , Google Scholar y el antiguo Windows Live Academic (ahora disponible con características adicionales como Microsoft Academic ). Los métodos de investigación de análisis de citas incluyen enfoques cualitativos, cuantitativos y computacionales. Los principales enfoques de dichos estudios cienciométricos han incluido comparaciones de productividad, clasificaciones de investigación institucional, clasificaciones de revistas [13], establecimiento de estándares de productividad y permanencia de la facultad [14] , evaluación de la influencia de los mejores artículos académicos [15], seguimiento de la trayectoria de desarrollo de un campo científico o tecnológico [16] y desarrollo de perfiles de los principales autores e instituciones en términos de desempeño en investigación. [17]

El análisis de citas legales es una técnica de análisis de citas para analizar documentos legales con el fin de facilitar la comprensión de los documentos de cumplimiento normativo interrelacionados mediante la exploración de las citas que conectan disposiciones con otras disposiciones dentro del mismo documento o entre diferentes documentos. El análisis de citas legales utiliza un gráfico de citas extraído de un documento normativo, que podría complementar el descubrimiento electrónico , un proceso que aprovecha las innovaciones tecnológicas en el análisis de big data . [18] [19] [20] [21]

Historia

En un artículo de 1965, Derek J. de Solla Price describió la característica de vinculación inherente del SCI como "Redes de artículos científicos". [4] Los vínculos entre los artículos citados y los que citaban se volvieron dinámicos cuando el SCI comenzó a publicarse en línea. El Social Sciences Citation Index se convirtió en una de las primeras bases de datos que se montaron en el sistema Dialog [22] en 1972. Con la llegada de la edición en CD-ROM , la vinculación se hizo aún más fácil y permitió el uso del acoplamiento bibliográfico para encontrar registros relacionados. En 1973, Henry Small publicó su obra clásica sobre el análisis de cocitación, que se convirtió en un sistema de clasificación autoorganizado que condujo a experimentos de agrupamiento de documentos y, finalmente, a un "Atlas de la ciencia", más tarde llamado "Reseñas de investigación".

La naturaleza topológica y gráfica inherente de la red mundial de citas, que es una propiedad inherente de la literatura científica, fue descrita por Ralph Garner ( Universidad de Drexel ) en 1965. [23]

El uso de recuentos de citas para clasificar revistas fue una técnica utilizada en la primera parte del siglo XIX, pero la medición sistemática continua de estos recuentos para revistas científicas fue iniciada por Eugene Garfield en el Instituto de Información Científica, quien también fue pionero en el uso de estos recuentos para clasificar autores y artículos . En un artículo histórico de 1965, él e Irving Sher mostraron la correlación entre la frecuencia de citación y la eminencia al demostrar que los ganadores del Premio Nobel publicaron cinco veces el número promedio de artículos, mientras que su trabajo fue citado entre 30 y 50 veces el promedio. En una larga serie de ensayos sobre el Nobel y otros premios, Garfield informó sobre este fenómeno. La medida de resumen habitual se conoce como factor de impacto , el número de citas a una revista durante los dos años anteriores, dividido por el número de artículos publicados en esos años. Se usa ampliamente, tanto para fines apropiados como inapropiados; en particular, el uso de esta medida solo para clasificar autores y artículos es, por lo tanto, bastante controvertido.

En un estudio temprano de 1964 sobre el uso del análisis de citas para escribir la historia del ADN , Garfield y Sher demostraron el potencial para generar historiografías , mapas topológicos de los pasos más importantes en la historia de los temas científicos. Este trabajo fue automatizado más tarde por E. Garfield, AI Pudovkin del Instituto de Biología Marina, Academia Rusa de Ciencias y VS Istomin del Centro de Enseñanza, Aprendizaje y Tecnología, Universidad Estatal de Washington y condujo a la creación del software HistCite [24] alrededor de 2002.

La indexación automática de citas fue introducida en 1998 por Lee Giles , Steve Lawrence y Kurt Bollacker [25] y permitió la extracción algorítmica automática y la agrupación de citas para cualquier documento académico y científico digital. Mientras que antes la extracción de citas era un proceso manual, las mediciones de citas ahora podían ampliarse y calcularse para cualquier campo académico y científico y lugar de documentos, no solo aquellos seleccionados por organizaciones como ISI. Esto condujo a la creación de nuevos sistemas para la indexación de citas públicas y automatizadas, siendo el primero CiteSeer (ahora CiteSeerX , pronto seguido por Cora, que se centró principalmente en el campo de la informática y la ciencia de la información . A estos les siguieron más tarde sistemas de citas de dominio académico a gran escala como Google Scholar y Microsoft Academic. Dicha indexación de citas autónoma aún no es perfecta en la extracción de citas o la agrupación de citas con una tasa de error estimada por algunos en un 10%, aunque aún no se ha realizado un muestreo estadístico cuidadoso. Esto ha dado lugar a que a autores como Ann Arbor , Milton Keynes y Walton Hall se les atribuya una extensa producción académica. [26] SCI afirma crear una indexación de citas automática a través de métodos puramente programáticos. Incluso los registros más antiguos tienen una magnitud de error similar.

Impacto de la cita

El impacto de las citas o tasa de citas es una medida de cuántas veces un artículo de una revista académica o un libro o un autor es citado por otros artículos, libros o autores. [27] [28] [29] [30] [31] [32] Los recuentos de citas se interpretan como medidas del impacto o influencia del trabajo académico y han dado lugar al campo de la bibliometría o cienciometría , [33] [34] especializándose en el estudio de patrones de impacto académico a través del análisis de citas. La importancia de las revistas se puede medir por la tasa de citas promedio, [35] [32]

la relación entre el número de citas y el número de artículos publicados en un período de tiempo determinado y en un índice determinado, como el factor de impacto de una revista o el Citescore . Las instituciones académicas lo utilizan para tomar decisiones sobre la permanencia, la promoción y la contratación académicas , y por lo tanto también lo utilizan los autores para decidir en qué revista publicar. Las medidas similares a las citas también se utilizan en otros campos que se dedican a la clasificación , como el algoritmo PageRank de Google , las métricas de software , las clasificaciones de colegios y universidades y los indicadores de rendimiento empresarial .

Análisis de citas de documentos legales

El análisis de citas de documentos legales es un enfoque que facilita la comprensión y el análisis de documentos de cumplimiento normativo interrelacionados mediante la exploración de las citas que conectan disposiciones con otras disposiciones dentro del mismo documento o entre diferentes documentos. El análisis de citas utiliza un gráfico de citas extraído de un documento normativo, que podría complementar el descubrimiento electrónico , un proceso que aprovecha las innovaciones tecnológicas en el análisis de big data . [20] [21] [36]

Análisis de citas para la detección de plagio

La detección de plagio basada en citas (CbPD) [37] se basa en el análisis de citas y es el único enfoque para la detección de plagio que no se basa en la similitud textual. [38] CbPD examina la información de citas y referencias en textos para identificar patrones similares en las secuencias de citas. Como tal, este enfoque es adecuado para textos científicos u otros documentos académicos que contienen citas. El análisis de citas para detectar plagio es un concepto relativamente joven. No ha sido adoptado por software comercial, pero existe un primer prototipo de un sistema de detección de plagio basado en citas. [39] El orden similar y la proximidad de las citas en los documentos examinados son los criterios principales utilizados para calcular las similitudes de patrones de citas. Los patrones de citas representan subsecuencias que contienen no exclusivamente citas compartidas por los documentos comparados. [38] [40] También se consideran factores, incluido el número absoluto o la fracción relativa de citas compartidas en el patrón, así como la probabilidad de que las citas coexistan en un documento, para cuantificar el grado de similitud de los patrones. [38] [40] [41] [42]

Análisis de citas para el procesamiento del lenguaje natural

El procesamiento del lenguaje natural (PLN), un campo en la intersección de la inteligencia artificial y la lingüística, está preparado para impactar sustancialmente a la sociedad a través de varias innovaciones, como los grandes modelos de lenguaje . El impacto en y del PLN se ha estudiado ampliamente a través de citas. Los investigadores han analizado varios factores, como la influencia entre diferentes campos, [43] el impacto de la industria, [44] los patrones de citas temporales, [45] el plagio, [46] la ubicación geográfica, [47] y el género. [48] Muchos estudios muestran que el campo se está volviendo más insular, con un enfoque estrecho, una interdisciplinariedad reducida y una concentración de financiación en unos pocos actores de la industria.

Controversias

Véase también

Notas

  1. ^ Algunos ejemplos son herramientas basadas en suscripción y basadas en datos propietarios, como Web of Science y Scopus , y herramientas gratuitas basadas en datos abiertos, como Scholarometer de Filippo Menczer y su equipo.

Referencias

  1. ^ Rubin, Richard (2010). Fundamentos de la biblioteconomía y la ciencia de la información (3.ª ed.). Nueva York: Neal-Schuman Publishers. ISBN 978-1-55570-690-6.
  2. ^ Garfield, E. Indexación de citas: su teoría y aplicación en ciencia, tecnología y humanidades Filadelfia: ISI Press, 1983.
  3. ^ Jaffe, Adam; de Rassenfosse, Gaétan (2017). "Datos de citación de patentes en la investigación en ciencias sociales: descripción general y mejores prácticas". Revista de la Asociación de Ciencias de la Información y Tecnología . 68 (6): 1360–1374. doi :10.1002/asi.23731.
  4. ^ por Derek J. de Solla Price (30 de julio de 1965). "Redes de artículos científicos" (PDF) . Science . 149 (3683): ​​510–515. Bibcode :1965Sci...149..510D. doi :10.1126/science.149.3683.510. PMID  14325149.
  5. ^ Giles, C. Lee; Bollacker, Kurt D.; Lawrence, Steve (1998), "CiteSeer", Actas de la tercera conferencia de la ACM sobre bibliotecas digitales - DL '98 , Nueva York: Association for Computing Machinery, págs. 89-98, doi :10.1145/276675.276685, ISBN 978-0-89791-965-4, S2CID  514080
  6. ^ Kaur, Jasleen; Diep Thi Hoang; Xiaoling Sun; Lino Possamai; Mohsen JafariAsbagh; Snehal Patil; Filippo Menczer (2012). "Scholarometer: un marco social para analizar el impacto en distintas disciplinas". PLOS ONE . ​​7 (9): e43235. Bibcode :2012PLoSO...743235K. doi : 10.1371/journal.pone.0043235 . PMC 3440403 . PMID  22984414. 
  7. ^ Hoang, D.; Kaur, J.; Menczer, F. (2010), "Crowdsourcing Scholarly Data", Proceedings of the WebSci10: Extending the Frontiers of Society On-Line, 26-27 de abril de 2010, Raleigh, NC: US , archivado desde el original el 17 de abril de 2015 , consultado el 9 de agosto de 2015
  8. ^ Anderson, MS van; Ronning, EA van; de Vries, R.; Martison, BC (2007). "Los efectos perversos de la competencia en el trabajo y las relaciones de los científicos". Ética de la ciencia y la ingeniería . 4 (13): 437–461. doi :10.1007/s11948-007-9042-5. PMID  18030595. S2CID  2994701.
  9. ^ Wesel, M. van (2016). "Evaluación por citación: tendencias en el comportamiento de publicación, criterios de evaluación y la búsqueda de publicaciones de alto impacto". Ética en ciencia e ingeniería . 22 (1): 199–225. doi :10.1007/s11948-015-9638-0. PMC 4750571 . PMID  25742806. 
  10. ^ Bornmann, L.; Daniel, HD (2008). "¿Qué miden los recuentos de citas? Una revisión de estudios sobre el comportamiento de citación". Journal of Documentation . 64 (1): 45–80. doi :10.1108/00220410810844150. hdl : 11858/00-001M-0000-0013-7A94-3 . S2CID  17260826.
  11. ^ Anauati, Maria Victoria y Galiani, Sebastian y Gálvez, Ramiro H., Cuantificación del ciclo de vida de los artículos académicos en los distintos campos de la investigación económica (11 de noviembre de 2014). Disponible en SSRN: https://ssrn.com/abstract=2523078
  12. ^ "La Sociedad Estadounidense de Ciencias de la Información y Tecnología". La Sociedad de la Información para la Era de la Información . Consultado el 21 de mayo de 2006 .
  13. ^ Lowry, Paul Benjamin; Moody, Gregory D.; Gaskin, James; Galletta, Dennis F.; Humpherys, Sean; Barlow, Jordan B.; y Wilson, David W. (2013). "Evaluación de la calidad de las revistas y la canasta de revistas de la Association for Information Systems (AIS) Senior Scholars a través de medidas bibliométricas: ¿las evaluaciones de las revistas por parte de expertos añaden valor?", MIS Quarterly, vol. 37(4), 993–1012. Además, narración en video de este artículo: TheAISChannel (22 de octubre de 2014). "Information Systems Journal Rankings MISQ 2013". YouTube . Archivado desde el original el 2 de noviembre de 2023.
  14. ^ Dean, Douglas L; Lowry, Paul Benjamin; y Humpherys, Sean (2011). "Perfiles de la productividad investigadora de los profesores titulares de sistemas de información en instituciones estadounidenses", MIS Quarterly, vol. 35(1), págs. 1–15 ( ISSN  0276-7783).
  15. ^ Karuga, Gilbert G.; Lowry, Paul Benjamin; y Richardson, Vernon J. (2007). "Evaluación del impacto de la investigación de sistemas de información de primer nivel a lo largo del tiempo", Communications of the Association for Information Systems, vol. 19(7), págs. 115–131 (http://aisel.aisnet.org/cais/vol19/iss1/7)
  16. ^ Liu, John S.; Lu, Louis YY (1 de marzo de 2012). "Un enfoque integrado para el análisis de la ruta principal: desarrollo del índice de Hirsch como ejemplo". Revista de la Sociedad Estadounidense de Ciencias de la Información y Tecnología . 63 (3): 528–542. doi :10.1002/asi.21692. ISSN  1532-2890.
  17. ^ Lowry, Paul Benjamin; Karuga, Gilbert G.; y Richardson, Vernon J. (2007). "Evaluación de instituciones líderes, profesores y artículos en revistas de investigación de sistemas de información de primer nivel", Communications of the Association for Information Systems, vol. 20(16), págs. 142–203 (http://aisel.aisnet.org/cais/vol20/iss1/16).
  18. ^ Hamou-Lhadj, Abdelwahab; Hamdaqa, Mohammad (2009). "Análisis de citas: un enfoque para facilitar la comprensión y el análisis de documentos de cumplimiento normativo". Sexta Conferencia Internacional sobre Tecnologías de la Información: Nuevas Generaciones , 2009. págs. 278–283. doi :10.1109/ITNG.2009.161. ISBN 978-1-4244-3770-2.S2CID10083351  .​
  19. ^ Mohammad Hamdaqa y A. Hamou-Lhadj, "Análisis de citas: un enfoque para facilitar la comprensión y el análisis de documentos de cumplimiento normativo", en las actas de la 6.ª Conferencia internacional sobre tecnología de la información, Las Vegas, EE. UU.
  20. ^ ab "Informe especial sobre e-Discovery: la creciente ola de revisión no lineal". Hudson Legal. Archivado desde el original el 3 de julio de 2012. Consultado el 1 de julio de 2012 .Por Cat Casey y Alejandra Pérez
  21. ^ ab "Lo que el descubrimiento electrónico asistido por tecnología nos enseña sobre el papel de los humanos en la tecnología - Re-Humanizing Technology-Assisted Review". Forbes . Consultado el 1 de julio de 2012 .
  22. ^ "Dialog, A Thomson Business". Dialog inventó los servicios de información en línea . Consultado el 21 de mayo de 2006 .
  23. ^ Garner, Ralph; Lunin, Lois; Baker, Lois (1967). "Tres estudios de investigación en ciencias de la información de Drexel" (PDF) . Drexel Press. Archivado desde el original (PDF) el 27 de marzo de 2022. Consultado el 14 de agosto de 2022 .
  24. ^ Eugene Garfield; AI Pudovkin; VS Istomin (2002). "Historiografía algorítmica vinculada a citas: mapeo de la literatura científica". Presentado en ASIS&T 2002: Información, conexiones y comunidad. 65.ª reunión anual de ASIST en Filadelfia, Pensilvania, del 18 al 21 de noviembre de 2002. Consultado el 21 de mayo de 2006 .
  25. ^ CL Giles, K. Bollacker, S. Lawrence, "CiteSeer: un sistema automático de indexación de citas", DL'98 Digital Libraries, 3.ª Conferencia ACM sobre bibliotecas digitales, págs. 89-98, 1998.
  26. ^ Postellon DC (marzo de 2008). «Hall y Keynes se unen a Arbor en los índices de citas». Nature . 452 (7185): 282. Bibcode :2008Natur.452..282P. doi : 10.1038/452282b . PMID  18354457.
  27. ^ Garfield, E. (1955). "Índices de citas para la ciencia: una nueva dimensión en la documentación a través de la asociación de ideas". Science . 122 (3159): 108–111. Bibcode :1955Sci...122..108G. doi :10.1126/science.122.3159.108. PMID  14385826.
  28. ^ Garfield, E. (1973). "Frecuencia de citación como medida de la actividad y el rendimiento de la investigación" (PDF) . Ensayos de un científico de la información . 1 : 406–408.
  29. ^ Garfield, E. (1988). "¿Pueden los investigadores confiar en el análisis de citas?" (PDF) . Ensayos de un científico de la información . 11 : 354.
  30. ^ Garfield, E. (1998). "El uso de factores de impacto de revistas y análisis de citas en la evaluación de la ciencia". 41.ª Reunión Anual del Consejo de Editores de Biología .
  31. ^ Moed, Henk F. (2005). Análisis de citas en la evaluación de la investigación . Springer . ISBN 978-1-4020-3713-9.
  32. ^ ab Haustein, S. (2012). Evaluación multidimensional de revistas: análisis de publicaciones científicas más allá del factor de impacto. Conocimiento e información. De Gruyter. ISBN 978-3-11-025555-3. Consultado el 6 de junio de 2023 .
  33. ^ Leydesdorff, L., y Milojević, S. (2012). Cienciometría. Preimpresión arXiv arXiv:1208.4566.
  34. ^ Harnad, S. (2009). Cienciometría de acceso abierto y el ejercicio de evaluación de la investigación en el Reino Unido. Cienciometría, 79(1), 147-156.
  35. ^ Garfield, Eugene (3 de noviembre de 1972). "Análisis de citas como herramienta en la evaluación de revistas". Science . 178 (4060). Asociación Estadounidense para el Avance de la Ciencia (AAAS): 471–479. Bibcode :1972Sci...178..471G. doi :10.1126/science.178.4060.471. ISSN  0036-8075. PMID  5079701.
  36. ^ Hamdaqa, M.; A Hamou-Lhadj (2009). "Análisis de citas: un enfoque para facilitar la comprensión y el análisis de documentos de cumplimiento normativo". Sexta Conferencia Internacional sobre Tecnología de la Información de 2009: Nuevas Generaciones . Sexta Conferencia Internacional sobre Tecnología de la Información de 2009: Nuevas Generaciones. Las Vegas, NV: IEEE. págs. 278–283. doi :10.1109/ITNG.2009.161. ISBN 978-1-4244-3770-2.S2CID10083351  .​
  37. ^ Gipp, Bela (2014), Detección de plagio basada en citas, Springer Vieweg Research, ISBN 978-3-658-06393-1
  38. ^ abc Gipp, Bela; Beel, Jöran (junio de 2010), "Detección de plagio basada en citas: un nuevo enfoque para identificar obras plagiadas de forma independiente del lenguaje", Actas de la 21.ª Conferencia de la ACM sobre hipertexto e hipermedia (HT'10) (PDF) , ACM, pp. 273–274, doi :10.1145/1810617.1810671, ISBN 978-1-4503-0041-4, S2CID  2668037, archivado desde el original (PDF) el 25 de abril de 2012 , consultado el 21 de octubre de 2011
  39. ^ Gipp, Bela; Meuschke, Norman; Breitinger, Corinna; Lipinski, Mario; Nürnberger, Andreas (28 de julio de 2013), "Demostración del análisis de patrones de citas para la detección de plagio", Actas de la 36.ª Conferencia internacional ACM SIGIR sobre investigación y desarrollo en recuperación de información (PDF) , ACM, pág. 1119, doi :10.1145/2484028.2484214, ISBN 9781450320344, S2CID2106222 ​
  40. ^ ab Gipp, Bela; Meuschke, Norman (septiembre de 2011), "Algoritmos de coincidencia de patrones de citas para la detección de plagio basada en citas: mosaico de citas voraces, fragmentación de citas y secuencia de citas comunes más larga", Actas del 11.º Simposio de la ACM sobre ingeniería de documentos (DocEng2011) (PDF) , ACM, págs. 249–258, doi :10.1145/2034691.2034741, ISBN 978-1-4503-0863-2, S2CID  207190305, archivado desde el original (PDF) el 25 de abril de 2012 , consultado el 7 de octubre de 2011
  41. ^ Gipp, Bela; Meuschke, Norman; Beel, Jöran (junio de 2011), "Evaluación comparativa de enfoques de detección de plagio basados ​​en texto y citas utilizando GuttenPlag", Actas de la 11.ª Conferencia conjunta ACM/IEEE-CS sobre bibliotecas digitales (JCDL'11) (PDF) , ACM, págs. 255–258, CiteSeerX 10.1.1.736.4865 , doi :10.1145/1998076.1998124, ISBN  978-1-4503-0744-4, S2CID  3683238, archivado desde el original (PDF) el 25 de abril de 2012 , consultado el 7 de octubre de 2011
  42. ^ Gipp, Bela; Beel, Jöran (julio de 2009), "Análisis de proximidad de citas (CPA): un nuevo enfoque para identificar trabajos relacionados basado en el análisis de cocitaciones", Actas de la 12.ª Conferencia Internacional sobre Cienciometría e Informetría (ISSI'09) (PDF) , Sociedad Internacional de Cienciometría e Informetría, pp. 571–575, ISSN  2175-1935, archivado desde el original (PDF) el 13 de septiembre de 2012 , consultado el 7 de octubre de 2011
  43. ^ Wahle, Jan Philip; Ruas, Terry; Abdalla, Mohamed; Gipp, Bela; Mohammad, Saif (diciembre de 2023). "Somos quienes citamos: puentes de influencia entre el procesamiento del lenguaje natural y otros campos académicos". En Bouamor, Houda; Pino, Juan; Bali, Kalika (eds.). Actas de la Conferencia de 2023 sobre métodos empíricos en el procesamiento del lenguaje natural . Singapur: Asociación de Lingüística Computacional. págs. 12896–12913. doi :10.18653/v1/2023.emnlp-main.797.
  44. ^ Abdalla, Mohamed; Wahle, Jan Philip; Ruas, Terry; Névéol, Aurélie; Ducel, Fanny; Mohammad, Saif; Fort, Karen (julio de 2023). Rogers, Anna; Boyd-Graber, Jordan; Okazaki, Naoaki (eds.). "El elefante en la habitación: análisis de la presencia de las grandes tecnologías en la investigación del procesamiento del lenguaje natural". Actas de la 61.ª reunión anual de la Asociación de Lingüística Computacional (volumen 1: artículos extensos) . Toronto, Canadá: Asociación de Lingüística Computacional: 13141–13160. arXiv : 2305.02797 . doi :10.18653/v1/2023.acl-long.734.
  45. ^ Singh, Janvijay; Rungta, Mukund; Yang, Diyi; Mohammad, Saif (julio de 2023). Rogers, Anna; Boyd-Graber, Jordan; Okazaki, Naoaki (eds.). "Conocimiento olvidado: Examinando la amnesia citacional en PNL". Actas de la 61.ª Reunión Anual de la Asociación de Lingüística Computacional (volumen 1: artículos extensos) . Toronto, Canadá: Asociación de Lingüística Computacional: 6192–6208. arXiv : 2305.18554 . doi :10.18653/v1/2023.acl-long.341.
  46. ^ Wahle, Jan Philip; Ruas, Terry; Kirstein, Frederic; Gipp, Bela (diciembre de 2022). "Cómo los modelos de lenguaje de gran tamaño están transformando el plagio de paráfrasis de máquinas". En Goldberg, Yoav; Kozareva, Zornitsa; Zhang, Yue (eds.). Actas de la Conferencia de 2022 sobre métodos empíricos en el procesamiento del lenguaje natural . Abu Dabi, Emiratos Árabes Unidos: Asociación de Lingüística Computacional. págs. 952–963. doi :10.18653/v1/2022.emnlp-main.62.
  47. ^ Rungta, Mukund; Singh, Janvijay; Mohammad, Saif M.; Yang, Diyi (diciembre de 2022). "Brechas de citas geográficas en la investigación en PNL". En Goldberg, Yoav; Kozareva, Zornitsa; Zhang, Yue (eds.). Actas de la Conferencia de 2022 sobre métodos empíricos en el procesamiento del lenguaje natural . Abu Dabi, Emiratos Árabes Unidos: Asociación de Lingüística Computacional. págs. 1371–1383. doi :10.18653/v1/2022.emnlp-main.89.
  48. ^ Mohammad, Saif M. (julio de 2020). Jurafsky, Dan; Chai, Joyce; Schluter, Natalie; Tetreault, Joel (eds.). "Brecha de género en la investigación sobre procesamiento del lenguaje natural: disparidades en la autoría y las citas". Actas de la 58.ª reunión anual de la Asociación de Lingüística Computacional . En línea: Asociación de Lingüística Computacional: 7860–7870. arXiv : 2005.00962 . doi :10.18653/v1/2020.acl-main.702.
  49. ^ Zhao, Lisa. "Cómo los bibliotecarios utilizaron los recursos electrónicos: un análisis de las citas en CCQ". Cataloging & Classification Quarterly 42(1) (2006): 117-131.
  50. ^ Lawrence, Steve. La disponibilidad gratuita en línea aumenta sustancialmente el impacto de un artículo. Nature volumen 411 (número 6837) (2001): 521. También disponible en línea en http://citeseer.ist.psu.edu/online-nature01/
  51. ^ Gálvez RH (marzo de 2017). "Evaluación de la autocitación del autor como mecanismo de difusión del conocimiento relevante". Cienciometría . 111 (3): 1801–1812. doi :10.1007/s11192-017-2330-1. S2CID  6863843.
  52. ^ Singh Chawla, Dalmeet (5 de julio de 2016). "Los hombres se citan a sí mismos más que las mujeres". Nature . 535 (7611): 212. doi : 10.1038/nature.2016.20176 . PMID  27414239. S2CID  4395779.
  53. ^ Van Der Walt, Wynand; Willems, Kris; Friedrich, Wernher; Hatsu, Sylvester; Kirstin, Krauss (2020). "Artículos retractados sobre la COVID-19 y los niveles de 'contaminación de citas': un análisis preliminar y direcciones para futuras investigaciones". Cahiers de la Documentation - Bladen voor Documentatie . 3 (4). hdl :10962/167732 . Consultado el 13 de enero de 2021 .
  54. ^ Paul, Pamela (4 de mayo de 2023). "Un artículo que dice que la ciencia debe ser imparcial fue rechazado por las principales revistas. Esto no se puede inventar". The New York Times . ISSN  0362-4331 . Consultado el 6 de mayo de 2023 .