La cola de baja latencia (LLQ) es una función de programación de red desarrollada por Cisco para incorporar la cola de prioridad estricta (PQ) a la cola justa ponderada basada en clases (CBWFQ). La LLQ permite que los datos sensibles a los retrasos (como la voz) reciban un tratamiento preferencial sobre el resto del tráfico al permitir que los datos se saquen de la cola y se envíen primero. [1]
El sistema de colas justas ponderadas basadas en clases (CB-WFQ) se lanzó inicialmente sin el soporte de un sistema de colas de prioridad, por lo que no podía garantizar los requisitos de retardo y fluctuación (variación del retardo) de las conversaciones de voz y video interactivas en tiempo real. Dado que para CBWFQ, el peso de un paquete que pertenece a una clase específica se deriva del ancho de banda asignado a la clase, que a su vez determina el orden en el que se envían los paquetes. Todos los paquetes se atienden de manera justa en función del peso y no se puede otorgar prioridad estricta a ninguna clase de paquetes. Este esquema plantea problemas para el tráfico de voz que es en gran medida intolerante al retraso, especialmente a la variación del retraso.
Para solucionar este problema, Cisco lanzó LLQ para proporcionar colas de prioridad estrictas para CBWFQ al permitir el uso de una única cola de prioridad estricta dentro de CBWFQ a nivel de clase. Esto permite dirigir el tráfico que pertenece a una clase a la cola de prioridad estricta de CBWFQ. Se puede asignar un estado de prioridad a una o más clases dentro de un mapa de políticas. Cuando se configuran varias clases dentro de un único mapa de políticas como clases de prioridad, todo el tráfico de estas clases se coloca en la misma cola de prioridad estricta única.