Políticas de ubicación de caché

Las políticas de ubicación de caché son políticas que determinan dónde se puede colocar un bloque de memoria en particular cuando ingresa a un caché de CPU . Un bloque de memoria no puede necesariamente colocarse en una ubicación arbitraria del caché; puede estar restringido a una línea de caché particular o a un conjunto de líneas de caché ^[1] según la política de ubicación del caché. ^[2]^[3]

Hay tres políticas diferentes disponibles para la colocación de un bloque de memoria en la caché: de asignación directa, totalmente asociativa y de conjunto asociativo. Originalmente, este espacio de organizaciones caché se describió utilizando el término "mapeo de congruencia". ^[4]

Caché asignado directamente

En una estructura de caché de mapeo directo, el caché se organiza en múltiples conjuntos ^[1] con una única línea de caché por conjunto. Según la dirección del bloque de memoria, solo puede ocupar una única línea de caché. El caché se puede enmarcar como una matriz de columnas $de n$ $\times 1 .$ ^[5]

Para colocar un bloque en el caché

El conjunto está determinado por los bits de índice ^[1] derivados de la dirección del bloque de memoria.
El bloque de memoria se coloca en el conjunto identificado y la etiqueta ^[1] se almacena en el campo de etiqueta asociado al conjunto.
Si la línea de caché está ocupada anteriormente, los nuevos datos reemplazan el bloque de memoria en el caché.

Para buscar una palabra en el caché

El conjunto se identifica por los bits de índice de la dirección.
Los bits de etiqueta derivados de la dirección del bloque de memoria se comparan con los bits de etiqueta asociados con el conjunto. Si la etiqueta coincide, entonces hay un acierto de caché y el bloque de caché se devuelve al procesador. De lo contrario, se pierde la memoria caché y el bloque de memoria se recupera de la memoria inferior ( memoria principal , disco ).

Ventajas

Esta política de ubicación ahorra energía ya que evita la búsqueda en todas las líneas de caché.
La política de colocación y la política de reposición es sencilla.
Requiere hardware económico ya que sólo es necesario comprobar una etiqueta a la vez.

Desventaja

Tiene una tasa de aciertos de caché más baja, ya que solo hay una línea de caché disponible en un conjunto. Cada vez que se hace referencia a una nueva memoria al mismo conjunto, se reemplaza la línea de caché, lo que provoca errores de conflicto. ^[6]

Ejemplo

Considere una memoria principal de 16 kilobytes, que está organizada en bloques de 4 bytes, y una caché de mapeo directo de 256 bytes con un tamaño de bloque de 4 bytes. Debido a que la memoria principal es de 16 kB, necesitamos un mínimo de 14 bits para representar de forma única una dirección de memoria.

Dado que cada bloque de caché tiene un tamaño de 4 bytes, el número total de conjuntos en el caché es 256/4, lo que equivale a 64 conjuntos.

La dirección entrante al caché se divide en bits para Offset , Index y Tag .

El desplazamiento corresponde a los bits utilizados para determinar el byte al que se accederá desde la línea de caché. Debido a que las líneas de caché tienen 4 bytes de longitud, hay 2 bits de desplazamiento .
El índice corresponde a los bits utilizados para determinar el conjunto de la caché. Hay 64 conjuntos en el caché y, como 2^6 = 64, hay 6 bits de índice.
La etiqueta corresponde a los bits restantes. Esto significa que hay 14 – (6+2) = 6 bits de etiqueta , que se almacenan en el campo de etiqueta para que coincida con la dirección en la solicitud de caché.

A continuación se muestran las direcciones de memoria y una explicación de a qué línea de caché se asignan:

La dirección 0x0000(etiqueta - 0b00_0000, índice – 0b00_0000, desplazamiento – 0b00) corresponde al bloque 0 de la memoria y se asigna al conjunto 0 del caché.
La dirección 0x0004(etiqueta - 0b00_0000, índice – 0b00_0001, desplazamiento – 0b00) corresponde al bloque 1 de la memoria y se asigna al conjunto 1 del caché.
La dirección 0x00FF(etiqueta – 0b00_0000, índice – 0b11_1111, desplazamiento – 0b11) corresponde al bloque 63 de la memoria y se asigna al conjunto 63 del caché.
La dirección 0x0100(etiqueta – 0b00_0001, índice – 0b00_0000, desplazamiento – 0b00) corresponde al bloque 64 de la memoria y se asigna al conjunto 0 del caché.

Caché totalmente asociativo

En una caché totalmente asociativa, la caché se organiza en un único conjunto de caché con varias líneas de caché. Un bloque de memoria puede ocupar cualquiera de las líneas de caché. La organización de la caché se puede enmarcar como una matriz de filas $de 1 \times m$ . ^[5]

Para colocar un bloque en el caché

La línea de caché se selecciona en función del bit válido ^[1] asociado a ella. Si el bit válido es 0, el nuevo bloque de memoria se puede colocar en la línea de caché; de lo contrario, se debe colocar en otra línea de caché con el bit válido 0.
Si el caché está completamente ocupado, se expulsa un bloque y el bloque de memoria se coloca en esa línea de caché.
La política de reemplazo decide la expulsión del bloque de memoria del caché. ^[7]

Para buscar una palabra en el caché

El campo Etiqueta de la dirección de memoria se compara con los bits de etiqueta asociados con todas las líneas de caché. Si coincide, el bloque está presente en la caché y es un acierto de caché. Si no coincide, entonces se trata de un error de caché y debe recuperarse de la memoria inferior.
Según el desplazamiento, se selecciona un byte y se devuelve al procesador.

Ventajas

La estructura de caché totalmente asociativa nos brinda la flexibilidad de colocar bloques de memoria en cualquiera de las líneas de caché y, por lo tanto, la utilización completa del caché.
La política de ubicación proporciona una mejor tasa de aciertos de caché.
Ofrece la flexibilidad de utilizar una amplia variedad de algoritmos de reemplazo si se produce una pérdida de caché.

Desventajas

La política de ubicación consume mucha energía ya que el circuito de comparación tiene que recorrer todo el caché para localizar un bloque.
El más caro de todos los métodos, debido al alto coste del hardware de comparación asociativa.

Ejemplo

Considere una memoria principal de 16 kilobytes, que está organizada en bloques de 4 bytes, y una caché totalmente asociativa de 256 bytes y un tamaño de bloque de 4 bytes. Debido a que la memoria principal es de 16 kB, necesitamos un mínimo de 14 bits para representar de forma única una dirección de memoria.

El número total de conjuntos en el caché es 1 y el conjunto contiene 256/4 = 64 líneas de caché, ya que el bloque de caché tiene un tamaño de 4 bytes.

La dirección entrante al caché se divide en bits para desplazamiento y etiqueta.

El desplazamiento corresponde a los bits utilizados para determinar el byte al que se accederá desde la línea de caché. En el ejemplo, hay 2 bits de desplazamiento, que se utilizan para direccionar los 4 bytes de la línea de caché.
La etiqueta corresponde a los bits restantes. Esto significa que hay 14 – (2) = 12 bits de etiqueta , que se almacenan en el campo de etiqueta para que coincida con la dirección en la solicitud de caché.

Dado que cualquier bloque de memoria se puede asignar a cualquier línea de caché, el bloque de memoria puede ocupar una de las líneas de caché según la política de reemplazo.

Caché asociativo de conjuntos

La caché asociativa por conjuntos es una compensación entre la caché asignada directamente y la caché totalmente asociativa.

Un caché asociativo de conjuntos se puede imaginar como una matriz $n \times m$ . El caché se divide en 'n' conjuntos y cada conjunto contiene 'm' líneas de caché. Primero se asigna un bloque de memoria a un conjunto y luego se coloca en cualquier línea de caché del conjunto.

El rango de cachés desde mapeado directo hasta completamente asociativo es un continuo de niveles de asociatividad de conjuntos. (Una caché asignada directamente es asociativa por conjuntos unidireccional y una caché totalmente asociativa con m líneas de caché es asociativa por conjuntos de m vías).

Muchas cachés de procesador en los diseños actuales son de mapeo directo, asociativas de conjuntos de dos vías o asociativas de conjuntos de cuatro vías. ^[5]

Para colocar un bloque en el caché

El conjunto está determinado por los bits de índice derivados de la dirección del bloque de memoria.
El bloque de memoria se coloca en una línea de caché disponible en el conjunto identificado y la etiqueta se almacena en el campo de etiqueta asociado con la línea. Si todas las líneas de caché del conjunto están ocupadas, los nuevos datos reemplazan el bloque identificado mediante la política de reemplazo .

Para localizar una palabra en el caché

El conjunto está determinado por los bits de índice derivados de la dirección del bloque de memoria.
Los bits de etiqueta se comparan con las etiquetas de todas las líneas de caché presentes en el conjunto seleccionado. Si la etiqueta coincide con alguna de las líneas de caché, se trata de un acierto de caché y se devuelve la línea apropiada. Si la etiqueta no coincide con ninguna de las líneas, entonces se trata de una pérdida de caché y los datos se solicitan desde el siguiente nivel en la jerarquía de memoria.

Ventajas

La política de ubicación es una compensación entre la memoria caché asignada directamente y la totalmente asociativa.
Ofrece la flexibilidad de utilizar algoritmos de reemplazo si se produce una pérdida de caché.

Desventajas

La política de ubicación no utilizará de manera efectiva todas las líneas de caché disponibles en el caché y sufre errores de conflicto .

Ejemplo

Considere una memoria principal de 16 kilobytes, que está organizada en bloques de 4 bytes, y una caché asociativa de 2 vías de 256 bytes con un tamaño de bloque de 4 bytes. Debido a que la memoria principal es de 16 kB, necesitamos un mínimo de 14 bits para representar de forma única una dirección de memoria.

Dado que cada bloque de caché tiene un tamaño de 4 bytes y es asociativo de conjuntos de 2 vías, el número total de conjuntos en el caché es 256/(4 * 2), lo que equivale a 32 conjuntos.

La dirección entrante al caché se divide en bits para Desplazamiento, Índice y Etiqueta.

El desplazamiento corresponde a los bits utilizados para determinar el byte al que se accederá desde la línea de caché. Debido a que las líneas de caché tienen 4 bytes de longitud, hay 2 bits de desplazamiento .
El índice corresponde a los bits utilizados para determinar el conjunto de la caché. Hay 32 conjuntos en el caché y, como 2^5 = 32, hay 5 bits de índice.
La etiqueta corresponde a los bits restantes. Esto significa que hay 14 – (5+2) = 7 bits , que se almacenan en el campo de etiqueta para que coincida con la dirección en la solicitud de caché.

A continuación se muestran las direcciones de memoria y una explicación de a qué línea de caché y en qué conjunto se asignan:

La dirección 0x0000(etiqueta - 0b000_0000, índice – 0b0_0000, desplazamiento – 0b00) corresponde al bloque 0 de la memoria y se asigna al conjunto 0 del caché. El bloque ocupa una línea de caché en el conjunto 0, determinada por la política de reemplazo de la caché.
La dirección 0x0004(etiqueta - 0b000_0000, índice – 0b0_0001, desplazamiento – 0b00) corresponde al bloque 1 de la memoria y se asigna al conjunto 1 del caché. El bloque ocupa una línea de caché en el conjunto 1, determinada por la política de reemplazo de la caché.
La dirección 0x00FF(etiqueta – 0b000_0001, índice – 0b1_1111, desplazamiento – 0b11) corresponde al bloque 63 de la memoria y se asigna al conjunto 31 del caché. El bloque ocupa una línea de caché en el conjunto 31, determinada por la política de reemplazo de la caché.
La dirección 0x0100(etiqueta – 0b000_0010, índice – 0b0_0000, desplazamiento – 0b00) corresponde al bloque 64 de la memoria y se asigna al conjunto 0 del caché. El bloque ocupa una línea de caché en el conjunto 0, determinada por la política de reemplazo de la caché.

Caché asociativo sesgado bidireccional

Se han sugerido otros esquemas, como el caché sesgado , ^[8] donde el índice para la vía 0 es directo, como arriba, pero el índice para la vía 1 se forma con una función hash . Una buena función hash tiene la propiedad de que las direcciones que entran en conflicto con el mapeo directo tienden a no entrar en conflicto cuando se mapean con la función hash, por lo que es menos probable que un programa sufra una cantidad inesperadamente grande de conflictos fallidos debido a un acceso patológico. patrón. La desventaja es la latencia adicional al calcular la función hash. ^[9] Además, cuando llega el momento de cargar una nueva línea y desalojar una línea antigua, puede resultar difícil determinar qué línea existente se utilizó menos recientemente, porque la nueva línea entra en conflicto con datos en diferentes índices en cada sentido; El seguimiento de LRU para cachés no sesgados generalmente se realiza por conjunto. Sin embargo, los cachés asociativos sesgados tienen grandes ventajas sobre los cachés asociativos de conjuntos convencionales. ^[10]

Caché pseudoasociativo

Un verdadero caché asociativo por conjuntos prueba todas las formas posibles simultáneamente, utilizando algo así como una memoria direccionable por contenido . Un caché pseudoasociativo prueba cada forma posible, una a la vez. Una caché hash-rehash y una caché asociativa de columnas son ejemplos de una caché pseudoasociativa.

En el caso común de encontrar un acierto en la primera forma probada, un caché pseudoasociativo es tan rápido como un caché de mapeo directo, pero tiene una tasa de errores de conflicto mucho menor que un caché de mapeo directo, más cercano a la tasa de errores. de un caché totalmente asociativo. ^[9]

Ver también

Referencias

^ abcde "Conceptos básicos del caché" (PDF) .
^ "Políticas de ubicación de caché". Archivado desde el original el 21 de febrero de 2020.
^ "Políticas de colocación". Archivado desde el original el 14 de agosto de 2020.
^ Mattson, RL ; Gecsei, J.; Slutz, DR; Traiger, yo (1970). "Técnicas de evaluación de jerarquías de almacenamiento". Revista de sistemas IBM . 9 (2): 78-117. doi :10.1147/sj.92.0078.
^ abc Solihin, Yan (2015). Fundamentos de la arquitectura paralela multinúcleo . Taylor y Francisco. págs. 136-141. ISBN 978-1482211184.
^ "Tipos de errores de caché" (PDF) .
^ "Caché totalmente asociativa". Archivado desde el original el 24 de diciembre de 2017.
^ André Seznec (1993). "Un caso para los cachés asociativos sesgados bidireccionales". Noticias de arquitectura informática de ACM SIGARCH . 21 (2): 169-178. doi : 10.1145/173682.165152 .
^ ab C. Kozyrakis . "Conferencia 3: Técnicas avanzadas de almacenamiento en caché" (PDF) . Archivado desde el original (PDF) el 7 de septiembre de 2012.
^ Microarquitectura "Los cachés asociativos sesgados tienen ... importantes ventajas sobre los cachés asociativos de conjuntos convencionales".