El CheiRank es un vector propio con un valor propio real máximo de la matriz de Google construida para una red dirigida con las direcciones invertidas de los enlaces. Es similar al vector PageRank , que clasifica los nodos de la red en promedio proporcionalmente a un número de enlaces entrantes que es el vector propio máximo de la matriz de Google con una dirección inicial dada de enlaces. Debido a la inversión de las direcciones de los enlaces, el CheiRank clasifica los nodos de la red en promedio proporcionalmente a un número de enlaces salientes. Dado que cada nodo pertenece tanto a los vectores CheiRank como a los de PageRank, la clasificación del flujo de información en una red dirigida se vuelve bidimensional .
Para una red dirigida dada, la matriz de Google se construye de la manera descrita en el artículo Matriz de Google . El vector PageRank es el vector propio con el valor propio real máximo . Se introdujo en [1] y se analiza en el artículo PageRank . De manera similar, el CheiRank es el vector propio con el valor propio real máximo de la matriz construida de la misma manera que pero utilizando la dirección invertida de los enlaces en la matriz de adyacencia dada inicialmente . Ambas matrices y pertenecen a la clase de operadores de Perron-Frobenius y, según el teorema de Perron-Frobenius, los vectores propios CheiRank y PageRank tienen componentes no negativos que pueden interpretarse como probabilidades. [2] [3] Por lo tanto, todos los nodos de la red se pueden ordenar en un orden de probabilidad decreciente con rangos para CheiRank y PageRank respectivamente. En promedio, la probabilidad de PageRank es proporcional al número de enlaces entrantes con . [4] [5] [6] Para la red World Wide Web (WWW), el exponente donde es el exponente de la distribución de enlaces entrantes. [4] [5] De manera similar, la probabilidad de CheiRank es en promedio proporcional al número de enlaces salientes con donde es el exponente de la distribución de enlaces salientes de la WWW. [4] [5] El CheiRank se introdujo para la red de llamadas a procedimientos del software del kernel de Linux en, [7] el término en sí se utilizó en Zhirov. [8] Mientras que el PageRank resalta los nodos muy conocidos y populares, el CheiRank resalta los nodos muy comunicativos. Los nodos superiores de PageRank y CheiRank tienen cierta analogía con las autoridades y los centros que aparecen en el algoritmo HITS [9] pero el HITS depende de la consulta mientras que las probabilidades de rango clasifican todos los nodos de la red. Dado que cada nodo pertenece tanto a CheiRank como a PageRank, obtenemos una clasificación bidimensional de los nodos de la red. Se habían realizado estudios preliminares sobre PageRank en redes con dirección invertida de enlaces [10] [11], pero las propiedades del ranking bidimensional no se habían analizado en detalle.
En la figura 1 se muestra un ejemplo de distribución de nodos en el plano de PageRank y CheiRank para la red de llamadas a procedimientos del software del kernel de Linux. [7]
La dependencia de la red de hipervínculos de los artículos de Wikipedia en inglés se muestra en la Fig. 2 de Zhirov. La distribución de estos artículos en el plano de PageRank y CheiRank se muestra en la Fig. 3 de Zhirov. La diferencia entre PageRank y CheiRank se ve claramente en los nombres de los artículos de Wikipedia (2009) con el rango más alto. En la parte superior de PageRank tenemos 1. Estados Unidos, 2. Reino Unido, 3. Francia mientras que para CheiRank encontramos 1. Portal: Contenidos/Esquema de conocimiento/Geografía y lugares, 2. Lista de líderes estatales por año, 3. Portal: Contenidos/Índice/Geografía y lugares. Claramente PageRank selecciona primero los artículos sobre un tema ampliamente conocido con una gran cantidad de enlaces entrantes mientras que CheiRank selecciona primero los artículos altamente comunicativos con muchos enlaces salientes. Dado que los artículos se distribuyen en 2D, se pueden clasificar de varias maneras correspondientes a la proyección del conjunto 2D en una línea. Las líneas horizontales y verticales corresponden a PageRank y CheiRank, 2DRank combina propiedades de CheiRank y PageRank como se analiza en Zhirov. [8] Muestra los principales artículos de Wikipedia: 1.India, 2.Singapur, 3.Pakistán.
El ranking 2D destaca las propiedades de los artículos de Wikipedia de una manera nueva, rica y fructífera. Según el PageRank, las 100 personalidades principales descritas en los artículos de Wikipedia tienen actividades en 5 categorías principales: 58 (política), 10 (religión), 17 (arte), 15 (ciencia), 0 (deporte), y por lo tanto la importancia de los políticos está fuertemente sobreestimada. El CheiRank da respectivamente 15, 1, 52, 16, 16 mientras que para el 2DRank se encuentran 24, 5, 62, 7, 2. Este tipo de ranking 2D puede encontrar aplicaciones útiles para varias redes dirigidas complejas, incluida la WWW.
CheiRank y PageRank aparecen naturalmente para la red de comercio mundial, o comercio internacional , donde están vinculados con los flujos de exportación e importación de un país determinado respectivamente. [12]
Se consideran las posibilidades de desarrollo de motores de búsqueda bidimensionales basados en PageRank y CheiRank. [13] Las redes dirigidas se pueden caracterizar por el correlador entre los vectores PageRank y CheiRank: en ciertas redes este correlador es cercano a cero (por ejemplo, la red del kernel de Linux), mientras que otras redes tienen valores de correlador grandes (por ejemplo, Wikipedia o redes universitarias). [7] [13]
A continuación se muestra un ejemplo simple de la construcción de las matrices de Google y , utilizadas para la determinación de los vectores PageRank y CheiRank relacionados. El ejemplo de red dirigida con 7 nodos se muestra en la Fig.4. La matriz , construida con las reglas descritas en el artículo Matriz de Google , se muestra en la Fig.5; la matriz de Google relacionada es y el vector PageRank es el vector propio derecho de con el valor propio unitario ( ). De manera similar, para determinar el vector propio CheiRank se invierten todas las direcciones de los enlaces en la Fig.4, luego se construye la matriz, de acuerdo con las mismas reglas aplicadas para la red con direcciones de enlace invertidas, como se muestra en la Fig.6. La matriz de Google relacionada es y el vector CheiRank es el vector propio derecho de con el valor propio unitario ( ). Aquí está el factor de amortiguamiento tomado en su valor habitual.