En informática , la regla de los cinco minutos es una regla general para decidir si un elemento de datos debe conservarse en la memoria o almacenarse en un disco y leerse nuevamente en la memoria cuando sea necesario. Fue formulada por primera vez por Jim Gray y Gianfranco Putzolu en 1985, [1] [2] y luego revisada en 1997 [3] y 2007 [4] para reflejar los cambios en el costo relativo y el rendimiento de la memoria y el almacenamiento persistente.
La regla es la siguiente:
La regla aleatoria de los 5 minutos: almacena en caché páginas de disco a las que se accede aleatoriamente y que se reutilizan cada 5 minutos o menos.
Gray también emitió una regla equivalente de un minuto para el acceso secuencial : [5]
La regla de 1 minuto: almacenar en caché páginas de disco a las que se accede secuencialmente y que se reutilizan cada 1 minuto o menos.
Aunque la regla de los 5 minutos se inventó en el ámbito de las bases de datos, también se ha aplicado en otros ámbitos, por ejemplo, en la planificación de la capacidad de caché del sistema de archivos de red . [6]
La regla original de los 5 minutos se derivó del siguiente cálculo de costo-beneficio: [4]
Si se aplica a los datos de 2007, se obtiene un intervalo de aproximadamente 90 minutos para el almacenamiento en caché de disco magnético a DRAM, 15 minutos para el almacenamiento en caché de SSD a DRAM y 2 1 ⁄ 4 horas para el almacenamiento en caché de disco a SSD. Por lo tanto, el intervalo de disco a DRAM fue un poco menor que lo que Gray y Putzolu anticiparon en 1987 como la "regla de las cinco horas" que iba a ser en 2007 para RAM y discos. [4]
Según los cálculos del ingeniero de NetApp David Dale, tal como se informó en The Register , las cifras para el almacenamiento en caché de disco a DRAM en 2008 fueron las siguientes: "El punto de equilibrio de una página de 50 KB fue de cinco minutos, el de 4 KB fue de una hora y el de 1 KB fue de cinco horas. Era necesario un aumento de 50 veces en el tamaño de la página para almacenar en caché para el punto de equilibrio a los cinco minutos". Con respecto al almacenamiento en caché de disco a SSD en 2010, la misma fuente informó que "Un punto de equilibrio de una página de 250 KB con SLC fue de cinco minutos, pero de cinco horas con un tamaño de página de 4 KB. Fueron cinco minutos con un tamaño de página de 625 KB con flash MLC y 13 horas con un tamaño de página MLC de 4 KB". [7]
En 2000, Gray y Shenoy aplicaron un cálculo similar para el almacenamiento en caché de páginas web y concluyeron que un navegador debería "almacenar en caché las páginas web si existe alguna posibilidad de que se vuelva a hacer referencia a ellas durante su vida útil". [8]