El análisis de la ruta principal es una herramienta matemática propuesta por primera vez por Hummon y Doreian en 1989 [1] para identificar las rutas principales en una red de citas , que es una forma de un gráfico acíclico dirigido (DAG). Desde entonces, se ha convertido en una técnica eficaz para trazar trayectorias tecnológicas, explorar flujos de conocimiento científico y realizar revisiones bibliográficas.
El método comienza midiendo la importancia de todos los enlaces en una red de citas a través del concepto de "conteo transversal" y luego encadena secuencialmente los enlaces más significativos en una "ruta principal", que se considera la ruta histórica más significativa en la red de citas de destino . El método es aplicable a cualquier actividad humana que pueda organizarse en forma de una red de citas . El método se aplica comúnmente para rastrear las rutas de flujo de conocimiento o las trayectorias de desarrollo de un campo científico o tecnológico, a través de citas bibliográficas o citas de patentes. [2] [3] [4] También se ha aplicado a decisiones judiciales para rastrear los cambios evolutivos de las opiniones legales. [5] El análisis de la ruta principal ha atraído la atención de los académicos recientemente. La investigación académica relacionada con el análisis de la ruta principal experimentó un rápido crecimiento desde 2007. Aquí se puede encontrar una lista de artículos académicos que introducen, explican, aplican, modifican o amplían el método originado en Hummon y Doreian [1] . Sin embargo, hay cuestiones que no se discuten ampliamente en la aplicación del método, incluido el manejo de datos de citas, la elección de un esquema de ponderación de recorrido adecuado, las opciones de búsqueda y la interpretación de las rutas resultantes. [6]
El análisis de la ruta principal fue propuesto por primera vez por Hummon y Doreian (1989) [1] , quienes sugieren un enfoque diferente para analizar una red de citas "donde los hilos conectivos a través de una red se conservan y el enfoque se centra en los enlaces de la red en lugar de en los nodos". [1] Llaman a la cadena resultante de los enlaces de citas más utilizados "ruta principal" y afirman que "es nuestra intuición que la ruta principal, seleccionada sobre la base de la ruta más utilizada, identificará la corriente principal de una literatura". La idea se verificó utilizando un conjunto de artículos de investigación de ADN. Para hacer que el método sea más práctico, Liu y Lu (2012) [7] extienden el método para incluir la búsqueda de ruta clave. La característica más útil de la búsqueda de ruta clave es que uno puede ver los diferentes niveles de rutas principales ajustando los números de ruta clave.
El análisis de la ruta principal se realiza en dos pasos. En el primer paso se obtienen los recuentos de recorridos de cada vínculo en una red de citas. En la literatura se mencionan varios tipos de recuentos de recorridos. En el segundo paso se buscan las rutas principales vinculando los vínculos significativos según el tamaño de los recuentos de recorridos. Es necesario preparar una red de citas antes de proceder al análisis de la ruta principal.
Es necesario preparar una red de citas antes de comenzar el análisis de la ruta principal. En una red de citas, los nodos representan los documentos, como artículos académicos, patentes o casos legales. Estos nodos están conectados mediante información de citas. Las redes de citas son dirigidas por naturaleza porque los dos nodos en el extremo opuesto de un enlace no son simétricos en sus funciones. En cuanto a la dirección, este artículo adopta la convención de que el nodo citado apunta al nodo que cita, lo que significa que el conocimiento en el nodo citado fluye hacia el nodo que cita. La red de citas también es acíclica por naturaleza, lo que significa que un nodo nunca puede volver a encadenarse a sí mismo si uno se mueve a lo largo de los enlaces siguiendo su dirección.
Aquí se definen varios términos relacionados con una red de citas antes de continuar. Las cabezas son los nodos a los que conduce la flecha de dirección. Las colas son los nodos en otros extremos de la flecha de dirección. Las fuentes son los nodos que se citan pero no citan a otros. Los receptores citan a otros nodos pero no se citan. Los ancestros son los nodos a los que se puede llegar desde un nodo de destino. Los descendientes son los nodos a los que se puede llegar desde un destino si se avanza por los enlaces siguiendo su dirección.
Los recuentos de recorridos miden la importancia de un enlace. La literatura analiza varios tipos de recuentos de recorridos, incluidos el recuento de rutas de búsqueda (SPC), el recuento de enlaces de rutas de búsqueda (SPLC), el par de nodos de rutas de búsqueda (SPNP) y otras variaciones. [8] Todos estos recuentos de recorridos se indicarán como SPX.
El SPC de un enlace es el número de veces que se atraviesa el enlace si se recorren todos los caminos posibles desde todas las fuentes hasta todos los receptores. El SPC fue propuesto por primera vez por Vladimir Batagelj . [9] Los valores de SPC para cada enlace en una red de citas de muestra se muestran en la Figura 1. El valor de SPC para el enlace (B, D) es 5 porque cinco caminos (BDFHK, BDFIL, BDFIMN, BDIL y BDIMN) lo atraviesan.
El SPLC de un enlace es el número de veces que se recorre el enlace si se recorren todos los caminos posibles desde todos los ancestros del nodo de cola (incluido él mismo) hasta todos los sumideros. El SPLC fue propuesto por primera vez por Hummon y Doreian. [1] La Figura 2 presenta los valores SPLC para cada enlace en la misma red de citas como se muestra en la Figura 1. Seis caminos atraviesan el enlace (D, F) por lo que le dan el valor SPLC 6. Son: BDFHK, BDFIL, BDFIMN, DFHK, DFIL y DFIMN, notando que todos los caminos comienzan ya sea desde el ancestro de D, que es B, y D mismo.
El SPNP de un enlace es el número de veces que se recorre el enlace si se recorren todos los caminos posibles desde todos los ancestros del nodo de cola (incluido él mismo) hasta todos los descendientes del nodo de cabeza (incluido él mismo). El SPNP fue propuesto por primera vez por Hummon y Doreian. [1] Los valores SPNP del enlace (C, H) son 6 porque hay 6 caminos que comienzan en A, B, C (A y B son los ancestros de C) y terminan en H y K (K es el descendiente de H). Estos caminos son ACH, ACHK, BCH, BCHK, CH y CHK.
En función de los recuentos de recorridos, se pueden buscar las rutas más importantes. Hay varias formas de encontrarlas, incluidas la búsqueda local, global y de ruta clave.
La búsqueda local se menciona en Hummon y Doreian [1] como búsqueda de "prioridad primero". Este proceso de búsqueda siempre elige el siguiente enlace con el SPX más alto como enlace saliente. Sigue rastreando el enlace más recorrido, por lo que obtiene el flujo principal entre todas las cadenas de citas. La Figura 4 muestra las rutas principales locales que se obtienen en función del SPC. Observe que cuando la búsqueda llega al nodo I, dos enlaces salientes tienen los mismos valores de SPC, por lo que se producen dos rutas después.
La búsqueda global simplemente sugiere la cadena de citas con el SPX general más grande. El concepto de búsqueda global es similar al método de ruta crítica en la programación de proyectos. Las rutas principales globales de la red de citas de muestra basada en SPC se presentan en la Figura 5. La suma de todos los valores de SPC en la ruta BDFIMN es 15, que es la más grande entre todas las rutas posibles.
La búsqueda de ruta clave está diseñada para evitar el problema de perder enlaces significativos tanto en la búsqueda local como en la global. El problema está en las rutas principales locales y globales que se muestran arriba, en las que uno de los enlaces más importantes (H, K) no está incluido en las rutas principales. Como se describe en Liu y Lu (2012), [7] el enfoque busca rutas principales a partir de los enlaces especificados (rutas clave) y, por lo tanto, garantiza la inclusión de los enlaces. También se pueden especificar múltiples enlaces para obtener múltiples rutas principales. Una ventaja adicional del enfoque de ruta clave es que se puede controlar el detalle de las rutas principales variando el número de rutas clave. Cuanto mayor sea el número de rutas clave que se especifique, más detalles se revelarán. Cuando el número de rutas clave aumenta hasta un cierto punto, la búsqueda devuelve la red de citas completa. Las figuras 6 y 7 muestran las rutas principales de ruta clave local y ruta clave global de la red de citas de muestra. En ambas rutas principales, el número de ruta clave se establece en 1, es decir, la búsqueda se realiza únicamente en base a los enlaces superiores. Como hay dos enlaces superiores (B, D) y (H, K), las rutas principales resultantes incluyen ambos.
Además del enfoque de búsqueda de ruta clave, las variaciones del método incluyen el enfoque agregativo y estocástico, [10] considera la decadencia en la difusión del conocimiento, [8] etc.
El método se ha aplicado a tres tipos de sistemas de documentación que mantienen la tradición de hacer referencias a los documentos anteriores: el artículo académico, el sistema de patentes y el sistema de documentación judicial.
Las bases de datos de citas académicas como Web of Science y Scopus incluyen información digitalizada completa sobre citas. Esta información permite aplicar el análisis de la ruta principal para examinar la estructura del conocimiento o rastrear el flujo de conocimiento de cualquier campo científico. Algunas de las primeras aplicaciones exploran el tema de la centralidad-productividad, [11] la resolución de conflictos, [12] etc. Las aplicaciones más recientes incluyen fulerenos, [4] nanotubos, [4] análisis envolvente de datos, [2] [13] [14] gestión de la cadena de suministro, [15] responsabilidad social corporativa, [16] subcontratación de TI, [17] turismo médico, [18] etc.
Las patentes que hacen referencia a técnicas anteriores son una práctica común. Por ejemplo, cada documento de patente de los Estados Unidos incluye una sección de "Referencias citadas" que enumera las técnicas anteriores de la patente. Las bases de datos de patentes como Clarivate Analytics y Webpat proporcionan información digitalizada sobre citas de patentes. Verspagen (2007) [3] y Mina (2007) [19] son los dos primeros trabajos que aplican el análisis de la ruta principal a los datos de patentes.
En el sistema de derecho consuetudinario, un documento de decisión judicial suele hacer referencia a opiniones publicadas anteriormente con el fin de justificar la decisión actual. Estas referencias judiciales, o citas legales, también se pueden utilizar para construir redes de citas y luego rastrear los cambios en las opiniones legales. Las oportunidades de investigación en esta área están abiertas. Liu et al. (2014) [5] realizaron un estudio exploratorio sobre este tipo de aplicación.
El análisis de la ruta principal se implementa en Pajek, un software de análisis de redes sociales ampliamente utilizado escrito por Vladimir Batagelj y Andrej Mrvar de la Universidad de Ljubljana , Eslovenia. Para ejecutar el análisis de la ruta principal en Pajek, primero es necesario preparar una red de citas y hacer que Pajek lea en la red. A continuación, en el menú principal de Pajek, se calculan los recuentos de recorridos de todos los enlaces de la red aplicando una de las siguientes secuencias de comandos (según la elección de los recuentos de recorridos).
Red → Red acíclica → Crear red ponderada + Vector → Pesos transversales → Recuento de enlaces de ruta de búsqueda (SPC), o
Red → Red acíclica → Crear red ponderada + Vector → Pesos transversales → Recuento de enlaces de ruta de búsqueda (SPLC), o
Red → Red acíclica → Crear red ponderada + Vector → Pesos de recorrido → Buscar pares de nodos de ruta (SPNP)
Una vez calculados los recuentos de recorridos, las siguientes secuencias de comandos encuentran las rutas principales.
Para rutas principales locales
Red → Red acíclica → Crear (sub)red → Rutas principales → Búsqueda local → Avanzar
Para rutas principales globales
Red → Red acíclica → Crear (sub)red → Rutas principales → Búsqueda global → Estándar
Para rutas principales de claves locales
Red → Red acíclica → Crear (sub)red → Rutas principales → Búsqueda local → Ruta clave
Para rutas principales de claves globales
Red → Red acíclica → Crear (sub)red → Rutas principales → Búsqueda global → Ruta clave
Además de la búsqueda de rutas clave, se agregó una función de búsqueda más flexible a partir de la versión 5.03 de Pajek (4 de enero de 2018). La nueva función permite la búsqueda local y global a través de vértices definidos por un clúster. Las secuencias de comandos son las siguientes:
Red → Red acíclica → Crear (sub)red → Rutas principales → Búsqueda local → Ruta clave → A través de vértices en clúster
Red → Red acíclica → Crear (sub)red → Rutas principales → Búsqueda global → Ruta clave → A través de vértices en clúster