La latencia de la memoria es el tiempo (la latencia ) que transcurre entre el inicio de una solicitud de un byte o palabra en la memoria hasta que es recuperada por un procesador . Si los datos no están en la caché del procesador , se tarda más en obtenerlos, ya que el procesador tendrá que comunicarse con las celdas de memoria externas . La latencia es, por tanto, una medida fundamental de la velocidad de la memoria: cuanto menor sea la latencia, más rápida será la operación de lectura.
La latencia no debe confundirse con el ancho de banda de la memoria , que mide el rendimiento de la memoria. La latencia puede expresarse en ciclos de reloj o en tiempo medido en nanosegundos. Con el tiempo, las latencias de la memoria expresadas en ciclos de reloj han sido bastante estables, pero han mejorado con el tiempo. [1]