li{counter-increment:listitem}.mw-parser-output .hlist ol>li::before{content:" "counter(listitem)"\a0 "}.mw-parser-output .hlist dd ol>li:first-child::before,.mw-parser-output .hlist dt ol>li:first-child::before,.mw-parser-output .hlist li ol>li:first-child::before{content:" ("counter(listitem)"\a0 "}.mw-parser-output .sidebar{width:22em;float:right;clear:right;margin:0.5em 0 1em 1em;background:var(--background-color-neutral-subtle,#f8f9fa);border:1px solid var(--border-color-base,#a2a9b1);padding:0.2em;text-align:center;line-height:1.4em;font-size:88%;border-collapse:collapse;display:table}body.skin-minerva .mw-parser-output .sidebar{display:table!important;float:right!important;margin:0.5em 0 1em 1em!important}.mw-parser-output .sidebar-subgroup{width:100%;margin:0;border-spacing:0}.mw-parser-output .sidebar-left{float:left;clear:left;margin:0.5em 1em 1em 0}.mw-parser-output .sidebar-none{float:none;clear:both;margin:0.5em 1em 1em 0}.mw-parser-output .sidebar-outer-title{padding:0 0.4em 0.2em;font-size:125%;line-height:1.2em;font-weight:bold}.mw-parser-output .sidebar-top-image{padding:0.4em}.mw-parser-output .sidebar-top-caption,.mw-parser-output .sidebar-pretitle-with-top-image,.mw-parser-output .sidebar-caption{padding:0.2em 0.4em 0;line-height:1.2em}.mw-parser-output .sidebar-pretitle{padding:0.4em 0.4em 0;line-height:1.2em}.mw-parser-output .sidebar-title,.mw-parser-output .sidebar-title-with-pretitle{padding:0.2em 0.8em;font-size:145%;line-height:1.2em}.mw-parser-output .sidebar-title-with-pretitle{padding:0.1em 0.4em}.mw-parser-output .sidebar-image{padding:0.2em 0.4em 0.4em}.mw-parser-output .sidebar-heading{padding:0.1em 0.4em}.mw-parser-output .sidebar-content{padding:0 0.5em 0.4em}.mw-parser-output .sidebar-content-with-subgroup{padding:0.1em 0.4em 0.2em}.mw-parser-output .sidebar-above,.mw-parser-output .sidebar-below{padding:0.3em 0.8em;font-weight:bold}.mw-parser-output .sidebar-collapse .sidebar-above,.mw-parser-output .sidebar-collapse .sidebar-below{border-top:1px solid #aaa;border-bottom:1px solid #aaa}.mw-parser-output .sidebar-navbar{text-align:right;font-size:115%;padding:0 0.4em 0.4em}.mw-parser-output .sidebar-list-title{padding:0 0.4em;text-align:left;font-weight:bold;line-height:1.6em;font-size:105%}.mw-parser-output .sidebar-list-title-c{padding:0 0.4em;text-align:center;margin:0 3.3em}@media(max-width:640px){body.mediawiki .mw-parser-output .sidebar{width:100%!important;clear:both;float:none!important;margin-left:0!important;margin-right:0!important}}body.skin--responsive .mw-parser-output .sidebar a>img{max-width:none!important}@media screen{html.skin-theme-clientpref-night .mw-parser-output .sidebar:not(.notheme) .sidebar-list-title,html.skin-theme-clientpref-night .mw-parser-output .sidebar:not(.notheme) .sidebar-title-with-pretitle{background:transparent!important}html.skin-theme-clientpref-night .mw-parser-output .sidebar:not(.notheme) .sidebar-title-with-pretitle a{color:var(--color-progressive)!important}}@media screen and (prefers-color-scheme:dark){html.skin-theme-clientpref-os .mw-parser-output .sidebar:not(.notheme) .sidebar-list-title,html.skin-theme-clientpref-os .mw-parser-output .sidebar:not(.notheme) .sidebar-title-with-pretitle{background:transparent!important}html.skin-theme-clientpref-os .mw-parser-output .sidebar:not(.notheme) .sidebar-title-with-pretitle a{color:var(--color-progressive)!important}}@media print{body.ns-0 .mw-parser-output .sidebar{display:none!important}}">
Un método para podar redes densas para resaltar vínculos clave
Las relaciones entre un conjunto de elementos suelen representarse como una matriz cuadrada con entradas que representan las relaciones entre todos los pares de elementos. Relaciones como distancias, diferencias, similitudes, parentesco, correlaciones, coocurrencias, probabilidades condicionales, etc., pueden representarse mediante dichas matrices. Dichos datos también pueden representarse como redes con vínculos ponderados entre los elementos. Dichas matrices y redes son extremadamente densas y no se pueden comprender fácilmente sin alguna forma de reducción o poda de datos.
Una red Pathfinder resulta de aplicar un método de poda que elimina los enlaces más débiles de una red (generalmente densa) de acuerdo con las longitudes de las rutas alternativas (ver más abajo). [1] [2] [3] Se utiliza como un método de escala psicométrica basado en la teoría de grafos y se utiliza en el estudio de la experiencia, la educación, [4] la adquisición de conocimiento , los modelos mentales , [5] y la ingeniería del conocimiento . También se emplea en la generación de redes de comunicación, [6] la depuración de software, [7] la visualización de patrones de citas científicas , [8] la recuperación de información y otras formas de visualización de datos . [9] Las redes Pathfinder son potencialmente aplicables a cualquier problema abordado por la teoría de redes .
La poda de redes tiene como objetivo resaltar los vínculos más importantes entre los elementos representados en una red. Ayuda a simplificar la recopilación de conexiones involucradas, lo que resulta valioso para la visualización de datos y para comprender las relaciones esenciales entre los elementos representados en la red.
Varios métodos de escalamiento psicométrico parten de datos por pares y producen estructuras que revelan la organización subyacente de los datos. La agrupación de datos y el escalamiento multidimensional son dos de esos métodos. El escalamiento de redes representa otro método basado en la teoría de grafos . Las redes Pathfinder se derivan de matrices de datos para pares de entidades. Debido a que el algoritmo utiliza distancias, los datos de similitud se invierten para producir diferencias para los cálculos.
En la red Pathfinder, las entidades corresponden a los nodos de la red generada, y los enlaces en la red están determinados por los patrones de proximidades. Por ejemplo, si las proximidades son similitudes, los enlaces generalmente conectarán nodos de alta similitud. Cuando las proximidades son distancias o diferencias, los enlaces conectarán las distancias más cortas. Los enlaces en la red no estarán dirigidos si las proximidades son simétricas para cada par de entidades. Las proximidades simétricas significan que el orden de las entidades no es importante, por lo que la proximidad de i y j es la misma que la proximidad de j e i para todos los pares i,j . Si las proximidades no son simétricas para cada par, los enlaces estarán dirigidos.
El algoritmo Pathfinder utiliza dos parámetros.
La distancia de la ruta se calcula como: , donde es la distancia del enlace en la ruta y . Para , es simplemente la suma de las distancias de los enlaces en la ruta. Para , es el máximo de las distancias de los enlaces en la ruta porque . Un enlace se poda si su distancia es mayor que la distancia mínima de las rutas entre los nodos conectados por el enlace. Los métodos eficientes para encontrar distancias mínimas incluyen el algoritmo de Floyd-Warshall (para ) y el algoritmo de Dijkstra (para cualquier valor de ).
Una red generada con valores particulares de y se denomina . Ambos parámetros tienen el efecto de disminuir el número de enlaces en la red a medida que aumentan sus valores. La red con el número mínimo de enlaces se obtiene cuando y , es decir, .
Con datos de escala ordinal (ver nivel de medición ), el parámetro debería ser porque el mismo resultaría de cualquier transformación monótona positiva de los datos de proximidad. Otros valores de requieren datos medidos en una escala de proporción. El parámetro se puede variar para obtener el número deseado de enlaces en la red o para centrarse en relaciones más locales con valores más pequeños de .
Básicamente, las redes Pathfinder conservan las rutas más cortas posibles dados los datos. Por lo tanto, los enlaces se eliminan cuando no están en las rutas más cortas. El será el árbol de expansión mínimo para los enlaces definidos por los datos de proximidad si existe un árbol de expansión mínimo único. En general, el incluye todos los enlaces en cualquier árbol de expansión mínimo.
Aquí hay un ejemplo de una red de buscador de caminos no dirigida derivada de las calificaciones promedio de un grupo de estudiantes de posgrado en biología. Los estudiantes calificaron la relación de todos los pares de los términos mostrados y se calculó la calificación media para cada par. Los enlaces de color azul sólido son los (etiquetados como "ambos" en la figura). Los enlaces de color rojo punteados se agregan en el . Para los enlaces agregados, no hay rutas de 2 enlaces más cortas que la distancia del enlace, pero hay al menos una ruta más corta con más de dos enlaces en los datos. Un árbol de expansión mínimo tendría 24 enlaces, por lo que los 26 enlaces en implican que hay más de un árbol de expansión mínimo. Hay dos ciclos presentes, por lo que hay distancias vinculadas en el conjunto de enlaces en el ciclo. Romper cada ciclo requeriría eliminar uno de los enlaces vinculados en cada ciclo.
Se puede encontrar más información sobre redes Pathfinder y varios ejemplos de la aplicación de PFnets a una variedad de problemas en las referencias.
Tres artículos que describen implementaciones rápidas de redes Pathfinder:
(Las dos variantes de Quirin et al. son significativamente más rápidas. Mientras que la primera se puede aplicar con o y cualquier valor para , la última solo se puede aplicar en los casos donde y ).