Un hipervisor , también conocido como monitor de máquina virtual ( VMM ) o virtualizador , es un tipo de software , firmware o hardware que crea y ejecuta máquinas virtuales . Una computadora en la que un hipervisor ejecuta una o más máquinas virtuales se denomina máquina host y cada máquina virtual se denomina máquina invitada . El hipervisor presenta a los sistemas operativos invitados una plataforma operativa virtual y gestiona la ejecución de los sistemas operativos invitados. A diferencia de un emulador , el invitado ejecuta la mayoría de las instrucciones en el hardware nativo. [1] Varias instancias de una variedad de sistemas operativos pueden compartir los recursos de hardware virtualizados: por ejemplo, las instancias de Linux , Windows y macOS pueden ejecutarse en una única máquina física x86 . Esto contrasta con la virtualización a nivel de sistema operativo , donde todas las instancias (generalmente llamadas contenedores ) deben compartir un único kernel, aunque los sistemas operativos invitados pueden diferir en el espacio de usuario , como diferentes distribuciones de Linux con el mismo kernel.
El término hipervisor es una variante de supervisor , un término tradicional para el núcleo de un sistema operativo : el hipervisor es el supervisor de los supervisores, [2] con hiper- usado como una variante más fuerte de super- . [a] El término data de alrededor de 1970; [3] IBM lo acuñó para el 360/65 [4] y luego lo usó para el controlador DIAG del CP-67. En el anterior sistema CP/CMS (1967), se utilizaba en su lugar el término Programa de Control .
En su tesis de 1973, "Principios arquitectónicos para sistemas informáticos virtuales", Robert P. Goldberg clasificó dos tipos de hipervisor: [1]
La distinción entre estos dos tipos no siempre es clara. Por ejemplo, KVM y bhyve son módulos del kernel [6] que convierten efectivamente el sistema operativo host en un hipervisor tipo 1. [7] Al mismo tiempo, dado que las distribuciones de Linux y FreeBSD siguen siendo sistemas operativos de propósito general, con aplicaciones que compiten entre sí por los recursos de VM, KVM y bhyve también pueden clasificarse como hipervisores de tipo 2. [8]
Los primeros hipervisores que proporcionaron virtualización completa fueron la herramienta de prueba SIMMON y el exclusivo sistema de investigación IBM CP-40 , que comenzó a utilizarse en producción en enero de 1967 y se convirtió en la primera versión del sistema operativo IBM CP/CMS . CP-40 se ejecutó en un S/360-40 modificado en el Centro Científico de Cambridge para soportar la traducción dinámica de direcciones , una característica que permitía la virtualización. Antes de este tiempo, el hardware de la computadora solo se había virtualizado hasta el punto de permitir que múltiples aplicaciones de usuario se ejecutaran simultáneamente, como en CTSS e IBM M44/44X . Con CP-40, el estado supervisor del hardware también se virtualizó, permitiendo que múltiples sistemas operativos se ejecuten simultáneamente en contextos de máquinas virtuales separados .
Los programadores pronto implementaron CP-40 (como CP-67 ) para IBM System/360-67 , el primer sistema informático de producción capaz de virtualización completa. IBM envió esta máquina en 1966; incluía hardware de tabla de traducción de páginas para memoria virtual y otras técnicas que permitían una virtualización completa de todas las tareas del kernel, incluidas las E/S y el manejo de interrupciones. (Tenga en cuenta que el sistema operativo "oficial", el desafortunado TSS/360 , no empleaba virtualización completa). Tanto el CP-40 como el CP-67 comenzaron a utilizarse en producción en 1967. CP/CMS estuvo disponible para los clientes de IBM desde 1968 hasta principios de la década de 1970, en forma de código fuente sin soporte.
CP/CMS formó parte del intento de IBM de construir sistemas robustos de tiempo compartido para sus computadoras centrales . Al ejecutar varios sistemas operativos simultáneamente, el hipervisor aumentó la solidez y la estabilidad del sistema: incluso si un sistema operativo fallaba, los demás continuarían funcionando sin interrupción. De hecho, esto permitió incluso implementar y depurar versiones beta o experimentales de sistemas operativos—o incluso de nuevo hardware [9] —, sin poner en peligro el sistema de producción principal estable y sin requerir costosos sistemas de desarrollo adicionales.
IBM anunció su serie System/370 en 1970 sin la función de memoria virtual necesaria para la virtualización, pero la agregó en el anuncio de Función Avanzada de agosto de 1972. La virtualización ha aparecido en todos los sistemas sucesores, de modo que todos los mainframes IBM modernos, incluida la línea zSeries , conservan la compatibilidad con la línea IBM S/360 de la década de 1960. El anuncio de 1972 también incluía VM/370 , una reimplementación de CP/CMS para el S/370. A diferencia de CP/CMS , IBM brindó soporte para esta versión (aunque todavía se distribuyó en forma de código fuente para varias versiones). VM significa Máquina Virtual y enfatiza que todas, no solo algunas, las interfaces de hardware están virtualizadas. Tanto VM como CP/CMS disfrutaron de una aceptación temprana y un rápido desarrollo por parte de universidades, usuarios corporativos y proveedores de tiempo compartido , así como dentro de IBM. Los usuarios desempeñaron un papel activo en el desarrollo continuo, anticipándose a las tendencias observadas en los proyectos modernos de código abierto . Sin embargo, en una serie de disputadas y amargas batallas [ cita necesaria ] , el tiempo compartido perdió frente al procesamiento por lotes a través de luchas políticas internas de IBM, y VM siguió siendo el "otro" sistema operativo de mainframe de IBM durante décadas, perdiendo frente a MVS . Disfrutó de un resurgimiento de popularidad y apoyo a partir del año 2000 como producto z/VM , por ejemplo como plataforma para Linux en IBM Z.
Como se mencionó anteriormente, el programa de control de VM incluye un controlador de llamadas de hipervisor que intercepta las instrucciones DIAG ("Diagnose", código de operación x'83') utilizadas dentro de una máquina virtual. Esto proporciona una ejecución rápida no virtualizada de acceso al sistema de archivos y otras operaciones (DIAG es una instrucción privilegiada dependiente del modelo, no se utiliza en la programación normal y, por lo tanto, no está virtualizada. Por lo tanto, está disponible para su uso como señal para el sistema operativo "host"). Cuando se implementó por primera vez en CP/CMS versión 3.1, este uso de DIAG proporcionó una interfaz de sistema operativo que era análoga a la instrucción de llamada de supervisor (SVC) de System/360 , pero que no requería alterar ni extender la virtualización de SVC del sistema.
En 1985, IBM introdujo el hipervisor PR/SM para gestionar particiones lógicas (LPAR).
Varios factores llevaron a un resurgimiento alrededor de 2005 en el uso de la tecnología de virtualización entre Unix , Linux y otros sistemas operativos similares a Unix : [10]
Los principales proveedores de Unix, incluidos HP , IBM , SGI y Sun Microsystems , han estado vendiendo hardware virtualizado desde antes del año 2000. Por lo general, han sido sistemas grandes y costosos (en el rango multimillonario de la gama alta), aunque la virtualización también ha sido disponible en algunos sistemas de gama baja y media, como servidores IBM pSeries , máquinas de la serie HP Superdome y servidores CoolThreads Sun / Oracle T-series.
Aunque Solaris siempre ha sido el único sistema operativo de dominio invitado oficialmente soportado por Sun/Oracle en su hipervisor Logical Domains , a finales de 2006 [actualizar], Linux (Ubuntu y Gentoo) y FreeBSD han sido adaptados para ejecutarse sobre el hipervisor (y todos pueden funcionar). se ejecutan simultáneamente en el mismo procesador, como sistemas operativos invitados independientes totalmente virtualizados). Wind River "Carrier Grade Linux" también se ejecuta en el hipervisor de Sun. [11] La virtualización completa en procesadores SPARC resultó sencilla: desde sus inicios a mediados de la década de 1980, Sun mantuvo deliberadamente la arquitectura SPARC limpia de artefactos que habrían impedido la virtualización. (Compare con la virtualización en procesadores x86 a continuación). [12]
HPE proporciona máquinas virtuales HP Integrity (Integrity VM) para alojar múltiples sistemas operativos en sus sistemas Integrity con tecnología Itanium . Itanium puede ejecutar HP-UX , Linux, Windows y OpenVMS , y estos entornos también son compatibles como servidores virtuales en la plataforma Integrity VM de HP. El sistema operativo HP-UX aloja la capa de hipervisor Integrity VM que permite aprovechar muchas características importantes de HP-UX y proporciona una diferenciación importante entre esta plataforma y otras plataformas básicas, como el intercambio directo de procesador, el intercambio dinámico de memoria y el kernel dinámico. actualizaciones sin reiniciar el sistema. Si bien aprovecha en gran medida HP-UX, el hipervisor Integrity VM es en realidad un híbrido que se ejecuta sin sistema operativo mientras los invitados se ejecutan. Se desaconseja encarecidamente la ejecución de aplicaciones HP-UX normales en un host Integrity VM, [ ¿ por quién? ] porque Integrity VM implementa sus propias políticas de administración de memoria, programación y E/S que están ajustadas para máquinas virtuales y no son tan efectivas para aplicaciones normales. HPE también proporciona una partición más rígida de sus sistemas Integrity y HP9000 mediante tecnología VPAR y nPar ; el primero ofrece partición de recursos compartidos y el segundo ofrece E/S completa y aislamiento de procesamiento. La flexibilidad del entorno de servidor virtual (VSE) ha dado paso a su uso con mayor frecuencia en implementaciones más nuevas. [ cita necesaria ]
IBM proporciona tecnología de partición de virtualización conocida como partición lógica (LPAR) en los sistemas System/390 , zSeries , pSeries e IBM AS/400 . Para Power Systems de IBM, POWER Hypervisor (PHYP) es un hipervisor nativo (bare-metal) en firmware y proporciona aislamiento entre LPAR. La capacidad del procesador se proporciona a las LPAR de forma dedicada o mediante derechos, donde la capacidad no utilizada se aprovecha y se puede reasignar a cargas de trabajo ocupadas. Los grupos de LPAR pueden gestionar su capacidad de procesador como si estuvieran en un "grupo". IBM se refiere a esta capacidad como grupos de procesadores compartidos múltiples (MSPP) y la implementa en servidores con el procesador POWER6 . Las asignaciones de capacidad LPAR y MSPP se pueden cambiar dinámicamente. La memoria se asigna a cada LPAR (en el inicio de LPAR o dinámicamente) y está controlada por la dirección mediante POWER Hypervisor. Para el direccionamiento en modo real mediante sistemas operativos ( AIX , Linux , IBM i ), los procesadores Power ( POWER4 en adelante) han diseñado capacidades de virtualización donde se evalúa una compensación de dirección de hardware con la compensación de dirección del sistema operativo para llegar a la dirección de memoria física. Los adaptadores de entrada/salida (E/S) pueden ser "propiedad" exclusiva de las LPAR o ser compartidos por las LPAR a través de una partición de dispositivo conocida como Servidor de E/S virtual (VIOS). Power Hypervisor proporciona altos niveles de confiabilidad, disponibilidad y capacidad de servicio (RAS) al facilitar la adición/reemplazo en caliente de muchas piezas (según el modelo: procesadores, memoria, adaptadores de E/S, sopladores, unidades de energía, discos, controladores del sistema, etc.). )
Se han producido tendencias similares con las plataformas de servidores x86/x86-64, donde proyectos de código abierto como Xen han liderado los esfuerzos de virtualización. Estos incluyen hipervisores creados en kernels de Linux y Solaris, así como kernels personalizados. Dado que estas tecnologías abarcan desde sistemas grandes hasta computadoras de escritorio, se describen en la siguiente sección.
La virtualización X86 se introdujo en la década de 1990 y su emulación se incluyó en Bochs . [13] Intel y AMD lanzaron sus primeros procesadores x86 con virtualización de hardware en 2005 con Intel VT-x (nombre en código Vanderpool) y AMD-V (nombre en código Pacifica).
Un enfoque alternativo requiere modificar el sistema operativo invitado para realizar una llamada al sistema al hipervisor subyacente, en lugar de ejecutar instrucciones de E/S de la máquina que simula el hipervisor. Esto se llama paravirtualización en Xen , una "hiperllamada" en Parallels Workstation y un "código de DIAGNOSTICO" en IBM VM . Algunos microkernels, como Mach y L4 , son lo suficientemente flexibles como para permitir la paravirtualización de sistemas operativos invitados.
Los hipervisores integrados , dirigidos a sistemas integrados y ciertos entornos de sistemas operativos en tiempo real (RTOS), están diseñados con requisitos diferentes en comparación con los sistemas empresariales y de escritorio, incluida la solidez, la seguridad y las capacidades en tiempo real . La naturaleza de recursos limitados de muchos sistemas integrados, especialmente los sistemas móviles alimentados por baterías, impone un requisito adicional de memoria pequeña y gastos generales bajos. Finalmente, en contraste con la ubicuidad de la arquitectura x86 en el mundo de las PC, el mundo integrado utiliza una variedad más amplia de arquitecturas y entornos menos estandarizados. El soporte para la virtualización requiere protección de la memoria (en forma de una unidad de administración de memoria o al menos una unidad de protección de memoria) y una distinción entre modo de usuario y modo privilegiado , lo que descarta la mayoría de los microcontroladores . Esto todavía deja a x86 , MIPS , ARM y PowerPC como arquitecturas ampliamente implementadas en sistemas integrados de gama media a alta. [14]
Como los fabricantes de sistemas integrados suelen tener el código fuente de sus sistemas operativos, tienen menos necesidad de una virtualización completa en este espacio. En cambio, las ventajas de rendimiento de la paravirtualización hacen que ésta sea la tecnología de virtualización preferida. Sin embargo, ARM y MIPS han agregado recientemente soporte completo de virtualización como una opción IP y lo han incluido en sus últimas versiones de arquitectura y procesadores de alta gama, como ARM Cortex-A15 MPCore y ARMv8 EL2.
Otras diferencias entre la virtualización en servidores/escritorio y entornos integrados incluyen requisitos para compartir eficientemente recursos entre máquinas virtuales, alto ancho de banda, comunicación entre máquinas virtuales de baja latencia, una visión global de la programación y administración de energía, y un control detallado de la información. fluye. [15]
El uso de tecnología de hipervisor por parte de malware y rootkits que se instalan como un hipervisor debajo del sistema operativo, conocido como hyperjacking , puede hacerlos más difíciles de detectar porque el malware podría interceptar cualquier operación del sistema operativo (como que alguien ingrese una contraseña) sin el software antimalware necesariamente lo detecta (ya que el malware se ejecuta debajo de todo el sistema operativo). La implementación del concepto se habría producido en el rootkit de laboratorio SubVirt (desarrollado conjuntamente por investigadores de Microsoft y la Universidad de Michigan [16] ), así como en el paquete de malware Blue Pill . Sin embargo, estas afirmaciones han sido cuestionadas por otros que afirman que sería posible detectar la presencia de un rootkit basado en hipervisor. [17]
En 2009, investigadores de Microsoft y la Universidad Estatal de Carolina del Norte demostraron un anti-rootkit de capa de hipervisor llamado Hooksafe que puede proporcionar protección genérica contra rootkits en modo kernel . [18]