El ARM Cortex-A78 es una unidad central de procesamiento que implementa el conjunto de instrucciones ARMv8.2-A de 64 bits diseñado por el centro de Austin de ARM Ltd. [1]
El ARM Cortex-A78 es el sucesor del ARM Cortex-A77 . Puede combinarse con las CPU ARM Cortex-X1 y/o ARM Cortex-A55 en una configuración DynamIQ para ofrecer tanto rendimiento como eficiencia. El procesador también promete un ahorro de energía de hasta un 50 % en comparación con su predecesor. [2]
El Cortex-A78 es un diseño superescalar fuera de orden de decodificación de 4 anchos con una caché de macro-OP (MOP) de 1.5K. Puede buscar 4 instrucciones y 6 Mops por ciclo, y renombrar y enviar 6 Mops y 12 μops por ciclo. El tamaño de la ventana fuera de orden es de 160 entradas y el backend tiene 13 puertos de ejecución con una profundidad de canalización de 14 etapas, y las latencias de ejecución constan de 10 etapas. [2] [3] [4]
El procesador está construido sobre una hoja de ruta Cortex-A estándar y ofrece un chipset de 2,1 GHz ( 5 nm ) que lo hace mejor que su predecesor en las siguientes formas:
También hay una escalabilidad extendida con soporte adicional de Dynamic Shared Unit para DynamIQ en el chipset. Una caché L1 más pequeña de 32 KB en lugar de la configuración de caché L1 de 64 KB es opcional. Para compensar esta memoria L1 más pequeña, el predictor de bifurcaciones es mejor para cubrir patrones de búsqueda irregulares y es capaz de seguir dos bifurcaciones tomadas por ciclo, lo que da como resultado menos errores de caché L1 y ayuda a ocultar burbujas de canalización para mantener el núcleo bien abastecido. La canalización es un ciclo más larga en comparación con el A77, lo que garantiza que el A78 alcance un objetivo de frecuencia de reloj de alrededor de 3 GHz. El A78 es un diseño de 6 instrucciones por ciclo.
ARM también introdujo una segunda unidad de multiplicación de enteros en la unidad de ejecución y una unidad de generación de direcciones (AGU) de carga adicional para aumentar tanto la carga de datos como el ancho de banda en un 50%. Otras optimizaciones del chipset incluyen instrucciones fusionadas [5] y mejoras de eficiencia en los programadores de instrucciones, estructuras de cambio de nombre de registros y el búfer de reordenamiento .
La caché L2 está disponible hasta 512 KB y tiene el doble de ancho de banda para maximizar el rendimiento, mientras que la caché L3 compartida está disponible hasta 4 MB, el doble que las generaciones anteriores. Una unidad compartida dinámica (DSU) también permite una configuración de 8 MB con ARM Cortex-X1 . [3] [4] [2] [6]
El Cortex-A78 está disponible como núcleo SIP para los licenciatarios, mientras que su diseño lo hace adecuado para la integración con otros núcleos SIP (por ejemplo, GPU , controlador de pantalla , DSP , procesador de imágenes , etc.) en una sola matriz que constituye un sistema en un chip (SoC). [ cita requerida ]
El Cortex-A78 se utilizó por primera vez en el SoC Samsung Exynos 2100, presentado en noviembre y diciembre de 2020 respectivamente. [7] [8] El núcleo Kryo 680 Gold personalizado utilizado en el SoC Snapdragon 888 [ ancla rota ] se basa en la microarquitectura Cortex-A78. [9] [10] El Cortex-A78 también se utiliza en las series MediaTek Dimensity 1200 y 8000. El dispositivo también se utiliza en NVIDIA DPU y en HiSilicon Kirin 9000s , lanzado en agosto de 2023.