En informática , el almacenamiento masivo se refiere al almacenamiento de grandes cantidades de datos de forma persistente y legible por máquina . En general, el término "masivo" en "almacenamiento masivo" se utiliza para significar "grande" en relación con las unidades de disco duro contemporáneas, pero también se ha utilizado para significar "grande" en relación con el tamaño de la memoria principal , como por ejemplo con los disquetes en las computadoras personales .
Los dispositivos y/o sistemas que se han descrito como almacenamiento masivo incluyen bibliotecas de cintas , sistemas RAID y una variedad de unidades de computadora como unidades de disco duro (HDD), unidades de cinta magnética , unidades de disco magneto-ópticas , unidades de disco óptico , tarjetas de memoria y unidades de estado sólido (SSD). También incluye formas experimentales como la memoria holográfica . El almacenamiento masivo incluye dispositivos con medios extraíbles y no extraíbles. [1] [2] No incluye la memoria de acceso aleatorio (RAM).
Existen dos grandes clases de almacenamiento masivo: datos locales en dispositivos como teléfonos inteligentes o computadoras , y servidores empresariales y centros de datos para la nube. Para el almacenamiento local, los SSD están en camino de reemplazar a los HDD. Teniendo en cuenta el segmento móvil, desde teléfonos hasta computadoras portátiles, la mayoría de los sistemas actuales se basan en NAND Flash . En cuanto a las empresas y los centros de datos , se han establecido niveles de almacenamiento utilizando una combinación de SSD y HDD . [3]
La noción de "grandes" cantidades de datos depende, por supuesto, en gran medida del marco temporal y del segmento de mercado, ya que la capacidad de los dispositivos de almacenamiento ha aumentado en muchos órdenes de magnitud desde los inicios de la tecnología informática a fines de la década de 1940 y continúa creciendo; sin embargo, en cualquier marco temporal, los dispositivos de almacenamiento masivo comunes han tendido a ser mucho más grandes y, al mismo tiempo, mucho más lentos que las realizaciones comunes de la tecnología de almacenamiento primario contemporánea .
En los artículos [4] [5] [6] de la Conferencia Conjunta de Computadoras de Otoño de 1966 [7] (FJCC) se utilizó el término almacenamiento masivo para dispositivos sustancialmente más grandes que las unidades de disco duro contemporáneas. De manera similar, un análisis de 1972 identificó los sistemas de almacenamiento masivo de Ampex (Terabit Memory) que utilizaban cintas de video, Precision Industries (Unicon 690-212) que utilizaban láseres e International Video (IVC-1000) que utilizaban cintas de video [8] y afirma que "en la literatura, la definición más común de capacidad de almacenamiento masivo es un billón de bits". [9] La primera conferencia IEEE sobre almacenamiento masivo se celebró en 1974 [10] y en ese momento se identificó el almacenamiento masivo como "capacidad del orden de 10 12 bits" (1 gigabyte). [11] A mediados de la década de 1970, IBM utilizó el término en el nombre del sistema de almacenamiento masivo IBM 3850 , que proporcionaba discos virtuales respaldados por cartuchos de cinta magnética de exploración helicoidal , más lentos que las unidades de disco pero con una capacidad mayor que la que era asequible con los discos. [12] El término almacenamiento masivo se utilizó en el mercado de PC para dispositivos, como unidades de disquete, mucho más pequeños que los dispositivos que no se consideraban almacenamiento masivo en el mercado de mainframes.
Los dispositivos de almacenamiento masivo se caracterizan por:
Los discos magnéticos son los medios de almacenamiento predominantes en las computadoras personales . Sin embargo, los discos ópticos se utilizan casi exclusivamente en la distribución a gran escala de software, música y películas minoristas debido al costo y la eficiencia de fabricación del proceso de moldeo utilizado para producir DVD y discos compactos y la presencia casi universal de unidades de lectura en computadoras personales y electrodomésticos. [13] La memoria flash (en particular, NAND flash ) tiene un nicho establecido y creciente como reemplazo de los discos duros magnéticos en instalaciones informáticas empresariales de alto rendimiento debido a su robustez derivada de su falta de partes móviles y su latencia inherentemente mucho menor en comparación con las soluciones de disco duro magnético convencionales. La memoria flash también ha sido popular durante mucho tiempo como almacenamiento extraíble, como memorias USB , donde de facto compone el mercado. Esto se debe a que escala mejor en términos de costo en rangos de capacidad más bajos, así como a su durabilidad. También ha llegado a los ordenadores portátiles en forma de SSD , compartiendo razones similares con la informática empresarial: a saber, grados notablemente altos de resistencia al impacto físico, lo que se debe nuevamente a la falta de partes móviles, así como a un aumento del rendimiento sobre los discos duros magnéticos convencionales y un peso y consumo de energía notablemente reducidos. Flash también ha llegado a los teléfonos móviles . [14] [15]
El diseño de las arquitecturas informáticas y de los sistemas operativos suele estar determinado por la tecnología de almacenamiento masivo y de bus de su época. [16]
Los dispositivos de almacenamiento masivo que se utilizan en las computadoras de escritorio y en la mayoría de los servidores suelen tener sus datos organizados en un sistema de archivos . La elección del sistema de archivos suele ser importante para maximizar el rendimiento del dispositivo: los sistemas de archivos de propósito general (como NTFS y HFS , por ejemplo) tienden a tener un rendimiento deficiente en el almacenamiento óptico de búsqueda lenta, como los discos compactos.
Algunas bases de datos relacionales también se pueden implementar en dispositivos de almacenamiento masivo sin un sistema de archivos intermedio o un administrador de almacenamiento. Oracle y MySQL , por ejemplo, pueden almacenar datos de tablas directamente en dispositivos de bloques sin procesar .
En los medios extraíbles , a veces se utilizan formatos de archivo (como archivos tar en cinta magnética , que empaquetan datos de archivos de extremo a extremo) en lugar de sistemas de archivos porque son más portátiles y más simples de transmitir .
En las computadoras integradas, es común mapear en memoria el contenido de un dispositivo de almacenamiento masivo (generalmente ROM o memoria flash) para que su contenido pueda recorrerse como estructuras de datos en memoria o ejecutarse directamente por programas.
En 2003, seis años después de su introducción, había más de 250 millones de dispositivos de reproducción de DVD en todo el mundo, contando reproductores de DVD, PC con DVD y consolas de juegos con DVD.