Un gráfico de citas (o red de citas ), en ciencias de la información y bibliometría , es un gráfico dirigido que describe las citas dentro de una colección de documentos.
Cada vértice (o nodo ) del gráfico representa un documento de la colección, y cada arista se dirige desde un documento hacia otro que cita (o viceversa, dependiendo de la implementación específica). [1]
Los gráficos de citas se han utilizado de diversas maneras, incluidas formas de análisis de citas , herramientas de búsqueda académica y sentencias judiciales . Se prevé que se vuelvan más relevantes y útiles en el futuro a medida que crezca el volumen de investigaciones publicadas.
No existe un formato estándar para las citas en las bibliografías , y la vinculación de registros de citas puede ser un proceso lento y complicado. Además, los errores de citación pueden ocurrir en cualquier etapa del proceso de publicación. Sin embargo, existe una larga historia de creación de bases de datos de citas, también conocidas como índices de citas , por lo que hay mucha información sobre estos problemas.
En principio, cada documento debería tener una fecha de publicación única y solo puede hacer referencia a documentos anteriores. Esto significa que un gráfico de citas ideal no solo es dirigido sino acíclico ; es decir, no hay bucles en el gráfico. Esto no siempre es así en la práctica, ya que un artículo académico pasa por varias versiones en el proceso de publicación. La sincronización de las actualizaciones asincrónicas de las bibliografías puede dar lugar a aristas que aparentemente apuntan hacia atrás en el tiempo. Estas citas "hacia atrás" parecen constituir menos del 1% del número total de enlaces. [2]
Como los enlaces de citas deben ser permanentes, la mayor parte de un gráfico de citas debe ser estático y solo el borde principal del gráfico debe cambiar. Pueden ocurrir excepciones cuando se retiran artículos de circulación. [2]
Una cita es una referencia a una fuente publicada o no publicada (no siempre la fuente original). Más precisamente, una cita es una expresión alfanumérica abreviada inserta en el cuerpo de una obra intelectual que denota una entrada en la sección de referencias bibliográficas de la obra. Su propósito es reconocer la relevancia de las obras de otros para el tema de discusión en el punto donde aparece la cita .
Generalmente, la combinación de la cita en el cuerpo del artículo y la entrada bibliográfica constituye lo que comúnmente se considera una cita (mientras que las entradas bibliográficas por sí solas no lo son). [3] Las referencias a afirmaciones únicas legibles por máquina en artículos científicos electrónicos se conocen como nanopublicaciones , una forma de microatribuciones .
Las redes de citas son un tipo de red social que se ha estudiado cuantitativamente casi desde el momento en que las bases de datos de citas estuvieron disponibles por primera vez. En 1965, Derek J. de Solla Price describió la característica de enlace inherente del Science Citation Index (SCI) en su artículo titulado "Networks of Scientific Papers". Los vínculos entre las citas y los artículos citados se volvieron dinámicos cuando el SCI comenzó a publicarse en línea. En 1973, Henry Small publicó su trabajo sobre análisis de cocitación, que se convirtió en un sistema de clasificación autoorganizado que condujo a experimentos de agrupamiento de documentos y, finalmente, a lo que se llama "Revisiones de investigación". [4]
Los gráficos de citas se pueden aplicar a las medidas de impacto académico , es decir, el impacto que ha tenido un artículo en particular en el mundo académico. Si bien es un valor difícil de cuantificar, el impacto académico es útil, ya que tener una medida del impacto académico de muchos artículos puede ayudar a identificar artículos importantes. También puede proporcionar una medida de la relevancia de una comunidad académica en particular. Los gráficos de citas son muy útiles para medir esto, ya que la cantidad de conexiones en el gráfico de citas se corresponde con el impacto académico de un artículo, ya que esto significa que ha sido citado por muchos otros artículos. [5]
El análisis de similitud es otra área del análisis de citas que frecuentemente utiliza gráficos de citas. La relación entre dos artículos en el gráfico de citas se ha comparado con su similitud basada en el texto , y se ha descubierto que la proximidad en el gráfico de citas puede predecir un nivel de similitud basada en el texto. [6] Además, se ha descubierto que los dos métodos (proximidad del gráfico de citas y similitud tradicional basada en el contenido) funcionan bien en conjunto para producir un resultado más preciso. [6]
Los análisis de los gráficos de citas también han llevado a la propuesta del gráfico de citas como una forma de identificar diferentes comunidades y áreas de investigación dentro del mundo académico. Se ha descubierto que analizar el gráfico de citas para grupos de documentos junto con palabras clave puede proporcionar una forma precisa de identificar grupos de investigaciones similares. [7] De manera similar, una forma de identificar la “corriente” principal de un área de investigación, o la progresión de una idea de investigación a lo largo del tiempo, se puede identificar mediante el uso de algoritmos de búsqueda en profundidad en el gráfico de citas. En lugar de observar la similitud entre dos nodos, o grupos de muchos nodos, este método recorre los vínculos entre nodos para rastrear una idea de investigación hasta su inicio, y así descubrir su progresión a través de diferentes artículos hasta su estado actual. [8]
El método tradicional que utilizan las herramientas de búsqueda académica consiste en comprobar si hay coincidencias entre un término de búsqueda y palabras clave en los artículos para obtener resultados potenciales. Si bien este método suele ser eficaz, puede dar lugar a errores en los que se recomienda un artículo de una disciplina diferente debido a coincidencias de palabras clave, incluso cuando los dos temas en realidad tienen poco en común.
Muchos han argumentado que esta forma de buscar artículos relevantes podría mejorarse y hacerse más precisa si se incorporaran gráficos de citas a las herramientas de búsqueda de artículos académicos. Por ejemplo, se propuso un sistema que utilizaba tanto el sistema de palabras clave como un sistema de popularidad basado en la cantidad de conexiones que tenía un artículo en el gráfico de citas. En este sistema, los artículos más conectados se consideraban más populares y, por lo tanto, se les daba una mayor ponderación en el sistema de recomendación de artículos. [9]
En los últimos años se han desarrollado herramientas de búsqueda visual que utilizan gráficos de citas para proporcionar una representación visual de las conexiones entre los artículos. Una implementación comercial de este concepto es la herramienta de búsqueda Connected Papers. [ cita requerida ]
Los gráficos de citas se han utilizado históricamente para ayudar a organizar y mapear las citas de documentos legales. De manera similar a las herramientas de búsqueda mencionadas anteriormente, se han utilizado construcciones de gráficos de citas específicas para los tipos de citas que se encuentran en documentos legales para permitir que se encuentren documentos legales pasados relevantes cuando sea necesario para una decisión judicial. Como una forma de reemplazar o mejorar los métodos de búsqueda tradicionales, esta forma de organizar documentos legales asistida por gráficos de citas puede brindar mayor eficiencia, precisión y organización. [10]
Existen otros tipos de grafos de red que están estrechamente relacionados con las redes de citas. El grafo de cocitación es el grafo entre documentos como nodos, donde dos documentos están conectados si comparten una cita común (ver Cocitación y Acoplamiento bibliográfico ). Otras redes relacionadas se forman utilizando otra información presente en el documento. Por ejemplo, en un grafo de colaboración , conocido en este contexto como red de coautoría, los nodos son los autores de los documentos, vinculados si han sido coautores del mismo documento. Los pesos de los vínculos entre dos autores en redes de coautoría pueden aumentar con el tiempo si tienen una mayor colaboración.
Si bien los gráficos de citas han tenido un impacto notable en varias áreas académicas, es probable que se vuelvan más relevantes en el futuro. A medida que aumenta el volumen de investigaciones publicadas, las formas más tradicionales de búsqueda de artículos se volverán menos efectivas para limitar la búsqueda de artículos relevantes para un tema en particular. Por ejemplo, la similitud basada en texto solo puede llegar hasta cierto punto a la hora de seleccionar qué artículos son relevantes para un tema, mientras que la adición de gráficos de citas podría permitir dar mayor prioridad a aquellos artículos que tienen muchas conexiones con otros artículos relevantes para el tema.
Sin embargo, este tipo de desarrollos se enfrentan a retos similares a los de la mayoría de las aplicaciones de gráficos de citas, que es el hecho de que no existe un formato o una forma estandarizada de citar. Esto hace que la construcción de estos gráficos sea muy difícil, ya que requiere un análisis de software complejo para extraer citas de los artículos. Una solución propuesta para este problema es crear bases de datos abiertas de información de citas en un formato que pueda ser utilizado por cualquier persona y que se pueda convertir fácilmente a una forma diferente, por ejemplo, un gráfico de citas. [11]