El almacenamiento de datos en cinta magnética es un sistema para almacenar información digital en cinta magnética mediante grabación digital .
La cinta era un medio importante para el almacenamiento de datos primarios en las primeras computadoras, que generalmente usaban grandes carretes abiertos de cinta de 7 pistas y, más tarde, de 9 pistas . La cinta magnética moderna se empaqueta más comúnmente en cartuchos y casetes, como la serie Linear Tape-Open (LTO) [1] y la IBM 3592 , ampliamente admitidas . El dispositivo que realiza la escritura o lectura de datos se denomina unidad de cinta . Los cargadores automáticos y las bibliotecas de cintas se usan a menudo para automatizar el manejo e intercambio de cartuchos. La compatibilidad era importante para permitir la transferencia de datos.
El almacenamiento de datos en cinta [2] se utiliza ahora más para realizar copias de seguridad del sistema, [3] archivar datos e intercambiar datos. El bajo coste de la cinta ha permitido que siga siendo viable para el almacenamiento y archivo a largo plazo. [4]
Inicialmente, la cinta magnética para el almacenamiento de datos se enrollaba en carretes de 10,5 pulgadas (27 cm) . [5] Este estándar para los grandes sistemas informáticos persistió hasta finales de la década de 1980, con una capacidad en constante aumento debido a sustratos más delgados y cambios en la codificación. Los cartuchos de cinta y los casetes estuvieron disponibles a partir de mediados de la década de 1970 y se usaban con frecuencia en sistemas informáticos pequeños. Con la introducción del cartucho IBM 3480 en 1984, descrito como "aproximadamente una cuarta parte del tamaño ... pero almacenaba hasta un 20 por ciento más de datos", [6] los grandes sistemas informáticos comenzaron a alejarse de las cintas de carrete abierto y a acercarse a los cartuchos. [7]
La cinta magnética se utilizó por primera vez para grabar datos informáticos en 1951 en el UNIVAC I. [ 8] El medio de grabación de la unidad UNISERVO era una fina tira de metal de bronce fosforoso niquelado de 0,5 pulgadas (12,7 mm) de ancho . La densidad de grabación era de 128 caracteres por pulgada (198 micrómetros por carácter) en ocho pistas a una velocidad lineal de 100 pulgadas/s (2,54 m/s), lo que producía una velocidad de datos de 12.800 caracteres por segundo. De las ocho pistas, seis eran de datos, una era de paridad y una era de reloj o pista de temporización. Teniendo en cuenta el espacio vacío entre los bloques de cinta, la velocidad de transferencia real era de unos 7.200 caracteres por segundo. Un pequeño carrete de cinta mylar proporcionaba separación entre la cinta metálica y el cabezal de lectura/escritura. [9]
Las computadoras IBM de la década de 1950 usaban cinta recubierta de óxido férrico similar a la que se usaba en la grabación de audio. La tecnología de IBM pronto se convirtió en el estándar de facto de la industria . Las dimensiones de la cinta magnética eran de 0,5 pulgadas (12,7 mm) de ancho y se enrollaban en carretes extraíbles. Había diferentes longitudes de cinta disponibles, con 1200 pies (370 m) y 2400 pies (730 m) en milésimas de pulgada y medio espesor siendo algo estándar. [ aclaración necesaria ] Durante la década de 1980, longitudes de cinta más largas, como 3600 pies (1100 m), estuvieron disponibles usando una película PET mucho más delgada . La mayoría de las unidades de cinta podían admitir un tamaño máximo de carrete de 10,5 pulgadas (267 mm). Un llamado mini-carrete era común para conjuntos de datos más pequeños, como para la distribución de software. Estos eran carretes de 7 pulgadas (18 cm), a menudo sin longitud fija: la cinta se dimensionaba para adaptarse a la cantidad de datos grabados en ella como una medida de ahorro de costos. [ cita requerida ]
CDC utilizó cintas magnéticas de 1 ⁄ 2 pulgada (13 mm) compatibles con IBM , pero también ofreció una variante de 1 pulgada de ancho (25 mm), con 14 pistas (12 pistas de datos correspondientes a la palabra de 12 bits de los procesadores periféricos de la serie CDC 6000 , más 2 bits de paridad) en la unidad CDC 626. [10]
Las primeras unidades de cinta de IBM, como la IBM 727 y la IBM 729 , eran unidades mecánicamente sofisticadas que se colocaban sobre el suelo y que utilizaban columnas de vacío para almacenar en búfer largos bucles de cinta en forma de U. Entre el servocontrol de los potentes motores de los carretes, un accionamiento de cabrestante de baja masa y la tensión controlada y de baja fricción de las columnas de vacío, se podía lograr un arranque y una parada rápidos de la cinta en la interfaz cinta-cabezal. [a] La aceleración rápida es posible porque la masa de la cinta en las columnas de vacío es pequeña; la longitud de la cinta almacenada en búfer en las columnas proporciona tiempo para acelerar los carretes de alta inercia . Cuando estaban activos, los dos carretes de cinta introducían o extraían cinta de las columnas de vacío, girando de forma intermitente en ráfagas rápidas y no sincronizadas, lo que daba como resultado una acción visualmente impactante. Las tomas de archivo de estas unidades de cinta con columnas de vacío en movimiento eran emblemáticamente representativas de las computadoras en las películas y la televisión. [11]
Las primeras cintas de media pulgada tenían siete pistas de datos paralelas a lo largo de la cinta, lo que permitía escribir caracteres de 6 bits más 1 bit de paridad en toda la cinta. Esto se conocía como cinta de 7 pistas . Con la introducción del mainframe IBM System/360 , se introdujeron las cintas de 9 pistas para admitir los nuevos caracteres de 8 bits que utilizaba. El final de un archivo se designaba mediante un patrón grabado especial llamado marca de cinta , y el final de los datos grabados en una cinta mediante dos marcas de cinta sucesivas. El comienzo y el final físicos de la cinta utilizable se indicaban mediante tiras adhesivas reflectantes de papel de aluminio colocadas en la parte posterior. [ cita requerida ]
La densidad de grabación aumentó con el tiempo. Las densidades comunes de 7 pistas comenzaron en 200 caracteres por pulgada (CPI), luego 556 y finalmente 800; las cintas de 9 pistas tenían densidades de 800 (usando NRZI ), luego 1600 (usando PE ) y finalmente 6250 (usando GCR ). Esto se traduce en aproximadamente 5 megabytes a 140 megabytes por bobina de cinta de longitud estándar (2400 pies, 730 m). La densidad efectiva también aumentó a medida que el espacio entre bloques ( espacio entre grabaciones ) disminuyó de 3 ⁄ 4 pulgadas (19 mm) nominales en una bobina de cinta de 7 pistas a 0,30 pulgadas (7,6 mm) nominales en una bobina de cinta de 9 pistas de 6250 bpi [ aclaración necesaria ] [12]
Al menos en parte debido al éxito del System/360 y la estandarización resultante de los códigos de caracteres de 8 bits y el direccionamiento de bytes, las cintas de 9 pistas fueron ampliamente utilizadas en toda la industria informática durante las décadas de 1970 y 1980. [13] IBM discontinuó los nuevos productos de carrete a carrete y los reemplazó con productos basados en cartuchos a partir de la introducción en 1984 de la familia 3480 basada en cartuchos . [ cita requerida ]
LINCtape y su derivado, DECtape , eran variaciones de esta "cinta redonda". Eran esencialmente un medio de almacenamiento personal, [14] utilizaban cintas de 0,75 pulgadas (19 mm) de ancho y presentaban una pista de formato fija que, a diferencia de la cinta estándar, hacía posible leer y reescribir bloques repetidamente en el mismo lugar. Las LINCtapes y DECtapes tenían una capacidad y una velocidad de transferencia de datos similares a los disquetes que las reemplazaron, pero sus tiempos de acceso eran del orden de treinta segundos a un minuto. [ cita requerida ]
En el contexto de la cinta magnética, el término casete o cartucho significa una longitud de cinta magnética en una carcasa de plástico con uno o dos carretes para controlar el movimiento de la cinta. El tipo de embalaje afecta los tiempos de carga y descarga, así como la longitud de cinta que se puede contener. En un cartucho de un solo carrete, hay un carrete de recogida en la unidad, mientras que un cartucho de dos carretes tiene tanto carretes de recogida como de suministro en el cartucho. Una unidad de cinta utiliza uno o más motores controlados con precisión para enrollar la cinta de un carrete al otro, pasando por un cabezal de lectura/escritura a medida que lo hace. [ cita requerida ]
Un tipo diferente es el cartucho de cinta sin fin , que tiene un bucle continuo de cinta enrollado en un carrete especial que permite retirar la cinta desde el centro del carrete y luego enrollarla alrededor del borde, por lo que no es necesario rebobinarla para repetir el proceso. Este tipo es similar a un cartucho de un solo carrete en el sentido de que no hay un carrete de recogida dentro de la unidad de cinta. [ cita requerida ]
La unidad Hypertape IBM 7340 , presentada en 1961, utilizaba un casete de doble carrete con una cinta de 1 pulgada de ancho (2,5 cm) capaz de contener 2 millones de caracteres de seis bits por casete. [ cita requerida ]
En las décadas de 1970 y 1980, los casetes compactos de audio se usaban con frecuencia como un sistema de almacenamiento de datos económico para computadoras domésticas , [b] o en algunos casos para diagnósticos o código de arranque para sistemas más grandes como el Burroughs B1700 . [16] Los casetes compactos son lógicamente, así como físicamente, secuenciales; deben rebobinarse y leerse desde el principio para cargar datos. Los primeros cartuchos estaban disponibles antes de que las computadoras personales tuvieran unidades de disco asequibles, y podían usarse como dispositivos de acceso aleatorio , rebobinando y posicionando automáticamente la cinta, aunque con tiempos de acceso de muchos segundos.
En 1984, IBM presentó la familia 3480 de cartuchos de un solo carrete y unidades de cinta, que luego fueron fabricados por varios proveedores hasta al menos 2004. Inicialmente, la familia ofrecía 200 megabytes por cartucho, pero con el tiempo la capacidad aumentó hasta los 2,4 gigabytes por cartucho. La DLT (cinta lineal digital), también una cinta basada en cartucho, estuvo disponible a principios de 1984, pero a partir de 2007 se detuvo el desarrollo futuro en favor de la LTO. [ cita requerida ]
En 2003, IBM presentó la familia 3592 para reemplazar a la IBM 3590. Si bien el nombre es similar, no hay compatibilidad entre la 3590 y la 3592. Al igual que la 3590 y la 3480 anteriores, este formato de cinta tiene una cinta de 1 ⁄ 2 pulgada (13 mm) enrollada en un cartucho de un solo carrete. Inicialmente presentada para admitir 300 gigabytes, la sexta generación lanzada en 2018 admite una capacidad nativa de 20 terabytes. [17]
El cartucho de cinta lineal abierta (LTO) de un solo rollo se anunció en 1997 con 100 gigabytes y en su octava generación admite 12 terabytes en el mismo tamaño de cartucho. A partir de 2019, [update]LTO ha desplazado por completo a todas las demás tecnologías de cinta en aplicaciones informáticas, con la excepción de algunas de la familia IBM 3592 en la gama alta. [ cita requerida ]
Bytes por pulgada (BPI) es la métrica para la densidad con la que se almacenan los datos en medios magnéticos. El término BPI puede referirse abits por pulgada ,[18]pero más a menudo se refiere abytespor pulgada.[19]
El término BPI puede significar bytes por pulgada cuando las pistas de un formato particular están organizadas por bytes, como en las cintas de nueve pistas. [20]
El ancho del medio es el criterio de clasificación principal para las tecnologías de cinta. Históricamente, media pulgada (13 mm) ha sido el ancho de cinta más común para el almacenamiento de datos de alta capacidad. [21] Existen muchos otros tamaños y la mayoría se desarrollaron para tener un empaque más pequeño o una mayor capacidad. [22]
El método de grabación también es una forma importante de clasificar las tecnologías de cinta, y generalmente se divide en dos categorías: lineal y de escaneo. [ cita requerida ]
El método lineal organiza los datos en pistas paralelas largas que abarcan toda la longitud de la cinta. Varios cabezales de cinta escriben simultáneamente pistas de cinta paralelas en un único medio. Este método se utilizó en las primeras unidades de cinta. Es el método de grabación más simple, pero también tiene la menor densidad de datos. [ cita requerida ]
Una variación de la tecnología lineal es la grabación en serpentina lineal, que utiliza más pistas que cabezales de cinta. Cada cabezal sigue escribiendo una pista a la vez. Después de realizar una pasada por toda la longitud de la cinta, todos los cabezales se mueven ligeramente y realizan otra pasada en la dirección inversa, escribiendo otro conjunto de pistas. Este procedimiento se repite hasta que se hayan leído o escrito todas las pistas. Al utilizar el método de serpentina lineal, el medio de cinta puede tener muchas más pistas que cabezales de lectura/escritura. En comparación con la grabación lineal simple, que utiliza la misma longitud de cinta y el mismo número de cabezales, la capacidad de almacenamiento de datos es sustancialmente mayor. [ cita requerida ]
Los métodos de grabación por escaneo escriben pistas cortas y densas a lo ancho del soporte de cinta, no a lo largo. Los cabezales de cinta se colocan en un tambor o disco que gira rápidamente mientras la cinta, que se mueve relativamente despacio, pasa por él. [ cita requerida ]
Un método temprano utilizado para obtener una velocidad de datos más alta que el método lineal predominante fue el escaneo transversal . En este método, un disco giratorio con los cabezales de cinta incrustados en el borde exterior se coloca perpendicularmente a la trayectoria de la cinta. Este método se utiliza en los grabadores de datos de instrumentación DCRsi de Ampex y en el antiguo sistema de cinta de vídeo cuádruplex de Ampex . Otro método temprano fue el escaneo arqueado . En este método, los cabezales están en la cara de un disco giratorio que se coloca plano contra la cinta. La trayectoria de los cabezales de la cinta forma un arco. [ cita requerida ]
La grabación con barrido helicoidal escribe pistas cortas y densas en forma diagonal . Este método se utiliza en prácticamente todos los sistemas de cintas de vídeo actuales y en varios formatos de cintas de datos. [ cita requerida ]
En un formato típico, los datos se escriben en la cinta en bloques con espacios entre ellos, y cada bloque se escribe en una sola operación con la cinta funcionando continuamente durante la escritura. Sin embargo, dado que la velocidad a la que se escriben o leen los datos en la unidad de cinta varía, una unidad de cinta generalmente tiene que lidiar con una diferencia entre la velocidad a la que los datos entran y salen de la cinta y la velocidad a la que los datos son suministrados o demandados por su host. [ cita requerida ]
Se han utilizado varios métodos, solos o en combinación, para hacer frente a esta diferencia. Si el host no puede seguir el ritmo de la velocidad de transferencia de la unidad de cinta, se puede detener la unidad, hacer una copia de seguridad y reiniciarla (lo que se conoce como shoe-shining ). Se puede utilizar un búfer de memoria grande para poner en cola los datos. En el pasado, el tamaño del bloque del host afectaba la densidad de datos en la cinta, pero en las unidades modernas, los datos se organizan normalmente en bloques de tamaño fijo que pueden o no estar comprimidos o cifrados, y el tamaño del bloque del host ya no afecta la densidad de datos en la cinta. Las unidades de cinta modernas ofrecen una función de adaptación de velocidad, donde la unidad puede reducir dinámicamente la velocidad física de la cinta según sea necesario para evitar el shoe-shining. [23]
En el pasado, el tamaño del espacio entre bloques era constante, mientras que el tamaño del bloque de datos se basaba en el tamaño del bloque del host, lo que afectaba la capacidad de la cinta (por ejemplo, en el almacenamiento de datos de clave de conteo ). En la mayoría de las unidades modernas, esto ya no es así. Las unidades de tipo Linear Tape-Open utilizan un bloque de tamaño fijo para la cinta (una arquitectura de bloque fijo ), independientemente del tamaño del bloque del host, y el espacio entre bloques es variable para ayudar a que la velocidad coincida durante las escrituras. [ cita requerida ]
En las unidades con compresión, la compresibilidad de los datos afectará la capacidad. [ ¿Cómo? ]
La cinta se caracteriza por el acceso secuencial a los datos. Si bien la cinta puede proporcionar una transferencia rápida de datos, se necesitan decenas de segundos para cargar un casete y posicionar el cabezal de la cinta en los datos seleccionados. Por el contrario, la tecnología de disco duro puede realizar la acción equivalente en decenas de milisegundos (3 órdenes de magnitud más rápido) y se puede pensar que ofrece acceso aleatorio a los datos. [ cita requerida ]
Los sistemas de archivos requieren que los datos y metadatos se almacenen en el medio de almacenamiento de datos. Almacenar metadatos en un lugar y datos en otro, como se hace con los sistemas de archivos basados en disco, requiere una actividad de reposicionamiento. Como resultado, la mayoría de los sistemas de cinta utilizan un sistema de archivos simplificado en el que los archivos se direccionan por número, no por nombre de archivo. Los metadatos como el nombre de archivo o la hora de modificación normalmente no se almacenan en absoluto. Las etiquetas de cinta almacenan dichos metadatos y se utilizan para intercambiar datos entre sistemas. Se han creado herramientas de copia de seguridad y archivador de archivos para empaquetar múltiples archivos junto con los metadatos relacionados en un solo archivo de cinta. Las unidades de cinta serpentina (por ejemplo, QIC ) ofrecen un tiempo de acceso mejorado al cambiar a la pista adecuada; las particiones de cinta se utilizan para la información del directorio. [24] El sistema de archivos de cinta lineal es un método de almacenamiento de metadatos de archivos en una parte separada de la cinta. Esto hace posible copiar y pegar archivos o directorios en una cinta como si fuera un disco, pero no cambia la naturaleza fundamental del acceso secuencial de la cinta. [ cita requerida ]
La cinta tiene un tiempo de acceso aleatorio largo, ya que la pletina debe enrollar un promedio de un tercio de la longitud de la cinta para pasar de una posición arbitraria a otra. Los sistemas de cinta intentan aliviar la latencia larga intrínseca, ya sea mediante indexación, donde se mantiene una tabla de búsqueda separada ( directorio de cinta ) que proporciona la ubicación física de la cinta para un número de bloque de datos determinado (una necesidad para las unidades serpentinas), o marcando los bloques con una marca de cinta que se puede detectar mientras se enrolla la cinta a alta velocidad. [ cita requerida ]
La mayoría de las unidades de cinta incluyen ahora algún tipo de compresión de datos sin pérdida . Hay varios algoritmos que proporcionan resultados similares: LZW [ cita requerida ] (ampliamente compatible), IDRC (Exabyte), ALDC (IBM, QIC) y DLZ1 (DLT). [ cita requerida ] Integrados en el hardware de la unidad de cinta, estos comprimen un búfer relativamente pequeño de datos a la vez, por lo que no pueden lograr una compresión extremadamente alta incluso de datos altamente redundantes. Una relación de 2:1 es típica, con algunos proveedores que afirman 2,6:1 o 3:1. La relación realmente obtenida depende de la naturaleza de los datos, por lo que no se puede confiar en la relación de compresión al especificar la capacidad del equipo, por ejemplo, una unidad que afirma una capacidad comprimida de 500 GB puede no ser adecuada para realizar una copia de seguridad de 500 GB de datos reales. Los datos que ya están almacenados de manera eficiente pueden no permitir una compresión significativa y una base de datos dispersa puede ofrecer factores mucho mayores. La compresión de software puede lograr resultados mucho mejores con datos dispersos, pero utiliza el procesador de la computadora host y puede ralentizar la copia de seguridad si la computadora host no puede comprimir tan rápido como se escriben los datos. [ cita requerida ]
Los algoritmos de compresión utilizados en productos de gama baja no son óptimamente efectivos, y se pueden obtener mejores resultados desactivando la compresión de hardware y utilizando en su lugar la compresión de software (y el cifrado si se desea). [ cita requerida ]
Los archivos de texto sin formato, imágenes sin procesar y bases de datos ( TXT , ASCII , BMP , DBF , etc.) suelen comprimirse mucho mejor que otros tipos de datos almacenados en sistemas informáticos. Por el contrario, los datos cifrados y los datos precomprimidos ( PGP , ZIP , JPEG , MPEG , MP3 , etc.) normalmente aumentan de tamaño [c] si se aplica compresión de datos. En algunos casos, esta expansión de datos puede ser de hasta un 15 %. [ cita requerida ]
Existen estándares para cifrar cintas. [25] El cifrado se utiliza para que, incluso si una cinta es robada, los ladrones no puedan utilizar los datos que contiene. La gestión de claves es crucial para mantener la seguridad. La compresión es más eficiente si se realiza antes del cifrado, ya que los datos cifrados no se pueden comprimir de forma eficaz debido a la entropía que introduce. Algunas unidades de cinta empresariales incluyen hardware que puede cifrar datos rápidamente. [26]
Algunos cartuchos de cinta, en particular los cartuchos LTO , tienen pequeños chips de almacenamiento de datos asociados integrados para registrar metadatos sobre la cinta, como el tipo de codificación, el tamaño del almacenamiento, las fechas y otra información. También es común que los cartuchos de cinta tengan códigos de barras en sus etiquetas para ayudar a una biblioteca de cintas automatizada. [27]
La cinta sigue siendo viable en los centros de datos modernos porque: [28] [29] [30]
Los niveles de almacenamiento en la nube con menor costo pueden ser respaldados por cinta. [31]
En 2002, Imation recibió una subvención de 11,9 millones de dólares del Instituto Nacional de Estándares y Tecnología de Estados Unidos para investigar cómo aumentar la capacidad de datos de la cinta magnética. [32]
En 2014, Sony e IBM anunciaron que habían podido grabar 148 gigabits por pulgada cuadrada con medios de cinta magnética desarrollados utilizando una nueva tecnología de formación de película delgada al vacío capaz de formar partículas de cristal extremadamente finas, una tecnología de almacenamiento en cinta con la mayor densidad de datos de cinta magnética reportada, 148 Gbit/in² (23 Gbit/cm²), lo que potencialmente permite una capacidad de cinta nativa de 185 TB. [33] [34] Fue desarrollado aún más por Sony , con un anuncio en 2017, sobre la densidad de datos reportada de 201 Gbit/in² (31 Gbit/cm²), dando una capacidad de cinta comprimida estándar de 330 TB. [35]
En mayo de 2014, Fujifilm siguió los pasos de Sony y anunció que desarrollaría un cartucho de cinta de 154 TB junto con IBM , que tendrá una densidad de almacenamiento de datos por área de 85,9 GBit/in² (13,3 mil millones de bits por cm²) en una cinta de partículas magnéticas lineales. [36] La tecnología desarrollada por Fujifilm, llamada NANOCUBIC, reduce el volumen de partículas de la cinta magnética BaFe, aumentando simultáneamente la suavidad de la cinta, aumentando la relación señal/ruido durante la lectura y la escritura al tiempo que permite una respuesta de alta frecuencia. [ cita requerida ]
En diciembre de 2020, Fujifilm e IBM anunciaron una tecnología que podría conducir a un casete de cinta con una capacidad de 580 terabytes, utilizando ferrita de estroncio como medio de grabación. [37]
... sustituyó al estándar ...
... se convirtió en algo de rigor en muchas computadoras diferentes, desde mainframes hasta minis.
La cinta aún ofrece varios beneficios que el almacenamiento en la nube no ofrece