stringtranslate.com

Regla de los cinco minutos

En informática , la regla de los cinco minutos es una regla general para decidir si un elemento de datos debe conservarse en la memoria o almacenarse en un disco y leerse nuevamente en la memoria cuando sea necesario. Fue formulada por primera vez por Jim Gray y Gianfranco Putzolu en 1985, [1] [2] y luego revisada en 1997 [3] y 2007 [4] para reflejar los cambios en el costo relativo y el rendimiento de la memoria y el almacenamiento persistente.

La regla es la siguiente:

La regla aleatoria de los 5 minutos: almacena en caché páginas de disco a las que se accede aleatoriamente y que se reutilizan cada 5 minutos o menos.

Gray también emitió una regla equivalente de un minuto para el acceso secuencial : [5]

La regla de 1 minuto: almacenar en caché páginas de disco a las que se accede secuencialmente y que se reutilizan cada 1 minuto o menos.

Aunque la regla de los 5 minutos se inventó en el ámbito de las bases de datos, también se ha aplicado en otros ámbitos, por ejemplo, en la planificación de la capacidad de caché del sistema de archivos de red . [6]

La regla original de los 5 minutos se derivó del siguiente cálculo de costo-beneficio: [4]

BreakEvenIntervalinSeconds = (PáginasPorMBofRAM / AccesosPorSecondPerDisk) × (PrecioPorDiskDrive / PrecioPorMBofRAM)

Si se aplica a los datos de 2007, se obtiene un intervalo de aproximadamente 90 minutos para el almacenamiento en caché de disco magnético a DRAM, 15 minutos para el almacenamiento en caché de SSD a DRAM y 2 14 horas para el almacenamiento en caché de disco a SSD. Por lo tanto, el intervalo de disco a DRAM fue un poco menor que lo que Gray y Putzolu anticiparon en 1987 como la "regla de las cinco horas" que iba a ser en 2007 para RAM y discos. [4]

Según los cálculos del ingeniero de NetApp David Dale, tal como se informó en The Register , las cifras para el almacenamiento en caché de disco a DRAM en 2008 fueron las siguientes: "El punto de equilibrio de una página de 50 KB fue de cinco minutos, el de 4 KB fue de una hora y el de 1 KB fue de cinco horas. Era necesario un aumento de 50 veces en el tamaño de la página para almacenar en caché para el punto de equilibrio a los cinco minutos". Con respecto al almacenamiento en caché de disco a SSD en 2010, la misma fuente informó que "Un punto de equilibrio de una página de 250 KB con SLC fue de cinco minutos, pero de cinco horas con un tamaño de página de 4 KB. Fueron cinco minutos con un tamaño de página de 625 KB con flash MLC y 13 horas con un tamaño de página MLC de 4 KB". [7]

En 2000, Gray y Shenoy aplicaron un cálculo similar para el almacenamiento en caché de páginas web y concluyeron que un navegador debería "almacenar en caché las páginas web si existe alguna posibilidad de que se vuelva a hacer referencia a ellas durante su vida útil". [8]

Referencias

  1. ^ Gray, Jim; Putzolu, Franco (mayo de 1985), La regla de los 5 minutos para intercambiar memoria por accesos a disco y la regla de los 5 bytes para intercambiar memoria por tiempo de CPU (PDF)
  2. ^ Gray, Jim; Putzolu, Gianfranco R. (1987), "La regla de los 5 minutos para intercambiar memoria por accesos a disco y la regla de los 10 bytes para intercambiar memoria por tiempo de CPU", Actas de la Conferencia ACM SIGMOD , págs. 395–398, CiteSeerX 10.1.1.624.3312 , doi :10.1145/38713.38755, ISBN  978-0897912365, Número de identificación del sujeto  10770251
  3. ^ Gray, Jim; Graefe, Goetz (1997), "La regla de los cinco minutos diez años después y otras reglas generales de almacenamiento informático", ACM SIGMOD Record , 26 (4): 63–68, arXiv : cs/9809005 , doi :10.1145/271074.271094, S2CID  21524661
  4. ^ abc Graefe, Goetz (2007), "La regla de los cinco minutos veinte años después, y cómo la memoria flash cambia las reglas", DaMoN '07: Actas del tercer taller internacional sobre gestión de datos en nuevo hardware , pp. 1–9, doi :10.1145/1363189.1363198, ISBN 9781595937728, S2CID14991801 ​Versión gratuita en ACM Queue , septiembre de 2008.
  5. ^ René J. Chevance (2004). Arquitecturas de servidores: multiprocesadores, clústeres, sistemas paralelos, servidores web, soluciones de almacenamiento. Digital Press. p. 542. ISBN 978-0-08-049229-2.
  6. ^ Gian-Paolo D. Musumeci; Mike Loukides (2002). Ajuste del rendimiento del sistema. O'Reilly Media, Inc., pág. 263. ISBN 978-0-596-55204-6.
  7. ^ "Flash y la regla de los cinco minutos • The Register". The Register .
  8. ^ Jim Gray, Prashant Shenoy, "Reglas generales en ingeniería de datos", MS-TR-99-100