La cocitación es la frecuencia con la que dos documentos son citados juntos por otros documentos. [1] Si al menos otro documento cita dos documentos en común, se dice que estos documentos están cocitados . Cuantas más cocitaciones reciban dos documentos, mayor será su fuerza de cocitación y es más probable que estén relacionados semánticamente. [1] Al igual que el acoplamiento bibliográfico , la cocitación es una medida de similitud semántica para documentos que hace uso de análisis de citas .
La figura de la derecha ilustra el concepto de cocitación y una variación más reciente de cocitación que explica la ubicación de las citas en el texto completo de los documentos. La imagen de la izquierda de la figura muestra los Documentos A y B, ambos citados en los Documentos C, D y E; por lo tanto, los documentos A y B tienen una fuerza de cocitación o índice de cocitación [2] de tres. Esta puntuación suele establecerse mediante índices de citas . Los documentos que presentan un gran número de cocitaciones se consideran más similares. [1]
La imagen de la derecha de la figura muestra un documento de cita que cita los Documentos 1, 2 y 3. Tanto los Documentos 1 y 2 como los Documentos 2 y 3 tienen una fuerza de cocitación de uno, dado que son citados juntos exactamente por otro documento. . Sin embargo, los Documentos 2 y 3 se citan mucho más cerca entre sí en el documento de citación en comparación con el Documento 1. Para que la co-citación sea una medida más significativa en este caso, se puede introducir un Índice de Proximidad de Co-citación (IPC) para tener en cuenta la ubicación de las citas entre sí. Los documentos cocitados a mayores distancias relativas en el texto completo reciben valores de IPC más bajos. [3] Gipp y Beel fueron los primeros en proponer el uso de ponderaciones de cocitación modificadas basadas en la proximidad. [4]
A Henry Small [1] e Irina Marshakova [5] se les atribuye la introducción del análisis de cocitaciones en 1973. [2] Ambos investigadores idearon la medida de forma independiente, aunque Marshakova obtuvo menos crédito, probablemente porque su trabajo fue publicado en ruso. [6]
El análisis de co-citas proporciona una evaluación prospectiva de la similitud de documentos en contraste con el acoplamiento bibliográfico, que es retrospectivo. [7] Las citas que recibe un artículo en el futuro dependen de la evolución de un campo académico, por lo que las frecuencias de cocitación aún pueden cambiar. En el diagrama adyacente, por ejemplo, el Doc A y el Doc B aún pueden ser citados conjuntamente en documentos futuros, digamos el Doc F y el Doc G. Esta característica de la cocitación permite un sistema de clasificación de documentos dinámico en comparación con el acoplamiento bibliográfico.
A lo largo de las décadas, los investigadores propusieron variantes o mejoras al concepto original de cocitación. Howard White introdujo el análisis de cocitación de autores en 1981. [8] Gipp y Beel propusieron el Análisis de proximidad de cocitación (CPA) e introdujeron el CPI como una mejora del concepto original de cocitación en 2009. [3] Proximidad de cocitación El análisis considera la proximidad de las citas dentro de los textos completos para el cálculo de la similitud y, por lo tanto, permite una evaluación más detallada de la similitud semántica de los documentos que la co-cita pura. [9]
Las motivaciones de los autores para citar literatura pueden variar mucho y ocurrir por diversas razones además de simplemente referirse a documentos académicamente relevantes. Cole y Cole expresaron esta preocupación basándose en la observación de que los científicos tienden a citar con mayor frecuencia a amigos y colegas de investigación, una parcialidad conocida como amiguismo . [10] Además, se ha observado que los trabajos académicos que ya han ganado mucho crédito y reputación en un campo tienden a recibir aún más crédito y, por lo tanto, citas en la literatura futura, una observación denominada efecto Matthew en la ciencia.