stringtranslate.com

Almacenamiento de datos informáticos

1  GiB de SDRAM montado en una computadora . Un ejemplo de almacenamiento primario .
Unidad de disco duro (HDD) PATA de 15  GB de 1999. Cuando se conecta a una computadora, sirve como almacenamiento secundario .
Cartucho de cinta SDLT de 160  GB , un ejemplo de almacenamiento fuera de línea . Cuando se utiliza dentro de una biblioteca de cintas robótica , se clasifica como almacenamiento terciario .
Unidad de lectura/escritura de DVD con soporte para medios extendidos

El almacenamiento de datos informáticos es una tecnología que consta de componentes informáticos y medios de grabación que se utilizan para retener datos digitales . Es una función central y componente fundamental de las computadoras. [1] : 15-16 

La unidad central de procesamiento (CPU) de una computadora es la que manipula los datos mediante la realización de cálculos. En la práctica, casi todas las computadoras utilizan una jerarquía de almacenamiento , [1] : 468–473  que coloca opciones de almacenamiento rápidas pero costosas y pequeñas cerca de la CPU y opciones más lentas pero menos costosas y más grandes más lejos. Generalmente, las tecnologías rápidas [a] se denominan "memoria", mientras que las tecnologías persistentes más lentas se denominan "almacenamiento".

Incluso los primeros diseños de computadora, la máquina analítica de Charles Babbage y la máquina analítica de Percy Ludgate , distinguían claramente entre procesamiento y memoria (Babbage almacenaba números como rotaciones de engranajes, mientras que Ludgate almacenaba números como desplazamientos de varillas en lanzaderas). Esta distinción se amplió en la arquitectura Von Neumann , donde la CPU consta de dos partes principales: la unidad de control y la unidad lógica aritmética (ALU). El primero controla el flujo de datos entre la CPU y la memoria, mientras que el segundo realiza operaciones aritméticas y lógicas con los datos.

Funcionalidad

Sin una cantidad significativa de memoria, una computadora simplemente podría realizar operaciones fijas y generar el resultado inmediatamente. Habría que reconfigurarlo para cambiar su comportamiento. Esto es aceptable para dispositivos como calculadoras de escritorio , procesadores de señales digitales y otros dispositivos especializados. Las máquinas Von Neumann se diferencian por tener una memoria en la que almacenan sus instrucciones y datos de funcionamiento. [1] : 20  Estas computadoras son más versátiles porque no necesitan reconfigurar su hardware para cada nuevo programa, sino que simplemente pueden reprogramarse con nuevas instrucciones en memoria; también tienden a ser más simples de diseñar, en el sentido de que un procesador relativamente simple puede mantener el estado entre cálculos sucesivos para generar resultados de procedimientos complejos. La mayoría de las computadoras modernas son máquinas von Neumann.

Organización y representación de datos.

Una computadora digital moderna representa datos utilizando el sistema de numeración binario . Texto, números, imágenes, audio y casi cualquier otra forma de información se pueden convertir en una cadena de bits o dígitos binarios, cada uno de los cuales tiene un valor de 0 o 1. La unidad de almacenamiento más común es el byte , igual a 8 bits. Una información puede ser manejada por cualquier computadora o dispositivo cuyo espacio de almacenamiento sea lo suficientemente grande como para acomodar la representación binaria de la información , o simplemente los datos . Por ejemplo, las obras completas de Shakespeare , de unas 1250 páginas impresas, pueden almacenarse en unos cinco megabytes (40 millones de bits) con un byte por carácter.

Los datos se codifican asignando un patrón de bits a cada carácter , dígito u objeto multimedia . Existen muchos estándares para la codificación (por ejemplo , codificaciones de caracteres como ASCII , codificaciones de imágenes como JPEG y codificaciones de vídeo como MPEG-4 ).

Al agregar bits a cada unidad codificada, la redundancia permite que la computadora detecte errores en los datos codificados y los corrija basándose en algoritmos matemáticos. Los errores generalmente ocurren en probabilidades bajas debido a cambios aleatorios de valores de bits, o "fatiga física del bit", pérdida del bit físico en el almacenamiento de su capacidad para mantener un valor distinguible (0 o 1), o debido a errores en inter o intra. -comunicación informática. Un cambio de bit aleatorio (por ejemplo, debido a una radiación aleatoria ) normalmente se corrige tras la detección. Un bit o un grupo de bits físicos que funcionan mal (no siempre se conoce el bit defectuoso específico; la definición del grupo depende del dispositivo de almacenamiento específico) normalmente se bloquea automáticamente, se deja de utilizar por el dispositivo y se reemplaza con otro grupo equivalente que funcione en el dispositivo, donde se restablecen los valores de bits corregidos (si es posible). El método de verificación de redundancia cíclica (CRC) se usa típicamente en comunicaciones y almacenamiento para la detección de errores . Luego se vuelve a intentar un error detectado.

Los métodos de compresión de datos permiten en muchos casos (como en una base de datos) representar una cadena de bits mediante una cadena de bits más corta ("comprimir") y reconstruir la cadena original ("descomprimir") cuando sea necesario. Esto utiliza sustancialmente menos almacenamiento (decenas de por ciento) para muchos tipos de datos a costa de más cálculos (comprimir y descomprimir cuando sea necesario). Antes de decidir si mantener ciertos datos comprimidos o no, se realiza un análisis de la compensación entre el ahorro de costos de almacenamiento y los costos de los cálculos relacionados y los posibles retrasos en la disponibilidad de los datos.

Por razones de seguridad , ciertos tipos de datos (por ejemplo, información de tarjetas de crédito ) pueden mantenerse cifrados en el almacenamiento para evitar la posibilidad de reconstrucción no autorizada de información a partir de fragmentos de instantáneas de almacenamiento.

Jerarquía de almacenamiento

Varias formas de almacenamiento, divididas según su distancia a la unidad central de procesamiento . Los componentes fundamentales de una computadora de propósito general son la unidad aritmética y lógica , los circuitos de control , el espacio de almacenamiento y los dispositivos de entrada/salida . Tecnología y capacidad como en las computadoras domésticas comunes alrededor de 2005.

Generalmente, cuanto más bajo esté un almacenamiento en la jerarquía, menor será su ancho de banda y mayor será su latencia de acceso desde la CPU. Esta división tradicional del almacenamiento en almacenamiento primario, secundario, terciario y fuera de línea también se rige por el costo por bit.

En el uso contemporáneo, la memoria suele ser una memoria de lectura y escritura de semiconductores rápida pero temporal , generalmente DRAM (RAM dinámica) u otros dispositivos similares. El almacenamiento consta de dispositivos de almacenamiento y sus medios a los que la CPU no puede acceder directamente ( almacenamiento secundario o terciario ), generalmente unidades de disco duro , unidades de discos ópticos y otros dispositivos más lentos que la RAM pero no volátiles (que retienen el contenido cuando se apagan). [2]

Históricamente, la memoria , según la tecnología, se ha denominado memoria central , memoria central , almacenamiento central , tambor , memoria principal , almacenamiento real o memoria interna . Mientras tanto, los dispositivos de almacenamiento persistente más lentos se han denominado almacenamiento secundario , memoria externa o almacenamiento auxiliar/periférico .

Almacenamiento primario

El almacenamiento primario (también conocido como memoria principal , memoria interna o memoria principal ), a menudo denominado simplemente memoria , es el único al que la CPU puede acceder directamente. La CPU lee continuamente las instrucciones almacenadas allí y las ejecuta según sea necesario. Los datos que se utilicen activamente también se almacenarán allí de forma uniforme.

Históricamente, las primeras computadoras utilizaban líneas de retardo , tubos Williams o tambores magnéticos giratorios como almacenamiento primario. En 1954, esos métodos poco fiables fueron reemplazados en su mayoría por memorias de núcleo magnético . La memoria central siguió siendo dominante hasta la década de 1970, cuando los avances en la tecnología de circuitos integrados permitieron que la memoria semiconductora se volviera económicamente competitiva.

Esto condujo a la moderna memoria de acceso aleatorio (RAM). Es de tamaño pequeño, ligero, pero bastante caro al mismo tiempo. Los tipos particulares de RAM utilizados para el almacenamiento primario son volátiles , lo que significa que pierden la información cuando no están encendidos. Además de almacenar programas abiertos, sirve como caché de disco y búfer de escritura para mejorar el rendimiento de lectura y escritura. Los sistemas operativos toman prestada capacidad de RAM para el almacenamiento en caché siempre que no sea necesaria para ejecutar el software. [3] La memoria adicional se puede utilizar como unidad RAM para el almacenamiento temporal de datos de alta velocidad.

Como se muestra en el diagrama, tradicionalmente hay dos subcapas más del almacenamiento primario, además de la RAM principal de gran capacidad:

La memoria principal está conectada directa o indirectamente a la unidad central de procesamiento a través de un bus de memoria . En realidad son dos buses (no en el diagrama): un bus de direcciones y un bus de datos . En primer lugar, la CPU envía un número a través de un bus de direcciones, un número llamado dirección de memoria , que indica la ubicación deseada de los datos. Luego lee o escribe los datos en las celdas de memoria utilizando el bus de datos. Además, una unidad de gestión de memoria (MMU) es un pequeño dispositivo entre la CPU y la RAM que recalcula la dirección de memoria real, por ejemplo para proporcionar una abstracción de la memoria virtual u otras tareas.

Como los tipos de RAM utilizados para el almacenamiento primario son volátiles (no inicializados al inicio), una computadora que contenga solo dicho almacenamiento no tendría una fuente desde la cual leer las instrucciones para iniciar la computadora. Por lo tanto, el almacenamiento primario no volátil que contiene un pequeño programa de inicio ( BIOS ) se utiliza para arrancar la computadora, es decir, para leer un programa más grande desde el almacenamiento secundario no volátil a la RAM y comenzar a ejecutarlo. Una tecnología no volátil utilizada para este propósito se llama ROM, para memoria de sólo lectura (la terminología puede resultar algo confusa ya que la mayoría de los tipos de ROM también son capaces de acceso aleatorio ).

Muchos tipos de "ROM" no son literalmente de sólo lectura , ya que es posible actualizarlos; sin embargo, es lento y la memoria debe borrarse en grandes porciones antes de poder reescribirse. Algunos sistemas integrados ejecutan programas directamente desde la ROM (o similar), porque dichos programas rara vez se modifican. Las computadoras estándar no almacenan programas no rudimentarios en ROM y, más bien, utilizan grandes capacidades de almacenamiento secundario, que tampoco es volátil y no es tan costoso.

Recientemente, almacenamiento primario y almacenamiento secundario en algunos usos hacen referencia a lo que históricamente se denominó, respectivamente, almacenamiento secundario y almacenamiento terciario . [4]

Almacenamiento secundario

El almacenamiento secundario (también conocido como memoria externa o almacenamiento auxiliar ) se diferencia del almacenamiento primario en que la CPU no puede acceder directamente a él. La computadora generalmente usa sus canales de entrada/salida para acceder al almacenamiento secundario y transferir los datos deseados al almacenamiento primario. El almacenamiento secundario no es volátil (retiene los datos cuando se corta la alimentación). Los sistemas informáticos modernos suelen tener dos órdenes de magnitud más de almacenamiento secundario que el almacenamiento primario porque el almacenamiento secundario es menos costoso.

En las computadoras modernas, las unidades de disco duro (HDD) o unidades de estado sólido (SSD) se suelen utilizar como almacenamiento secundario. El tiempo de acceso por byte para HDD o SSD generalmente se mide en milisegundos (milmillonésimas de segundo), mientras que el tiempo de acceso por byte para el almacenamiento primario se mide en nanosegundos (milmillonésimas de segundo). Por tanto, el almacenamiento secundario es significativamente más lento que el almacenamiento primario. Los dispositivos de almacenamiento óptico giratorio , como las unidades de CD y DVD , tienen tiempos de acceso aún más prolongados. Otros ejemplos de tecnologías de almacenamiento secundario incluyen unidades flash USB , disquetes , cintas magnéticas , cintas de papel , tarjetas perforadas y discos RAM .

Una vez que el cabezal de lectura/escritura del disco en los HDD alcanza la ubicación adecuada y los datos, es muy rápido acceder a los datos posteriores en la pista. Para reducir el tiempo de búsqueda y la latencia rotacional, los datos se transfieren hacia y desde discos en grandes bloques contiguos. El acceso secuencial o en bloques a los discos es mucho más rápido que el acceso aleatorio, y se han desarrollado muchos paradigmas sofisticados para diseñar algoritmos eficientes basados ​​en el acceso secuencial y en bloques. Otra forma de reducir el cuello de botella de E/S es utilizar varios discos en paralelo para aumentar el ancho de banda entre la memoria primaria y secundaria. [5]

El almacenamiento secundario suele formatearse según un formato de sistema de archivos , que proporciona la abstracción necesaria para organizar los datos en archivos y directorios , al mismo tiempo que proporciona metadatos que describen el propietario de un determinado archivo, el tiempo de acceso, los permisos de acceso y otra información.

La mayoría de los sistemas operativos de computadora utilizan el concepto de memoria virtual , lo que permite la utilización de más capacidad de almacenamiento primario de la que está físicamente disponible en el sistema. A medida que la memoria primaria se llena, el sistema mueve los fragmentos ( páginas ) menos utilizados a un archivo de intercambio o un archivo de página en el almacenamiento secundario, recuperándolos más tarde cuando sea necesario. Si se mueven muchas páginas a un almacenamiento secundario más lento, el rendimiento del sistema se degrada.

Almacenamiento terciario

Una gran biblioteca de cintas , con cartuchos de cinta colocados en estantes en el frente y un brazo robótico que se mueve en la parte posterior. La altura visible de la biblioteca es de unos 180 cm.

El almacenamiento terciario o memoria terciaria [6] es un nivel por debajo del almacenamiento secundario. Normalmente, se trata de un mecanismo robótico que montará (insertará) y desmontará medios de almacenamiento masivo extraíbles en un dispositivo de almacenamiento según las demandas del sistema; Estos datos a menudo se copian en un almacenamiento secundario antes de su uso. Se utiliza principalmente para archivar información a la que se accede con poca frecuencia, ya que es mucho más lento que el almacenamiento secundario (por ejemplo, de 5 a 60 segundos frente a 1 a 10 milisegundos). Esto es principalmente útil para almacenes de datos extraordinariamente grandes, a los que se accede sin operadores humanos. Los ejemplos típicos incluyen bibliotecas de cintas y máquinas de discos ópticas .

Cuando una computadora necesita leer información del almacenamiento terciario, primero consultará una base de datos de catálogo para determinar qué cinta o disco contiene la información. A continuación, la computadora indicará a un brazo robótico que recoja el medio y lo coloque en una unidad. Cuando la computadora haya terminado de leer la información, el brazo robótico devolverá el medio a su lugar en la biblioteca.

El almacenamiento terciario también se conoce como almacenamiento nearline porque está "casi en línea". La distinción formal entre almacenamiento en línea, casi en línea y fuera de línea es: [7]

Por ejemplo, las unidades de disco duro giratorias siempre activas son almacenamiento en línea, mientras que las unidades giratorias que dejan de girar automáticamente, como en conjuntos masivos de discos inactivos ( MAID ), son almacenamiento cercano a la línea. Los medios extraíbles, como los cartuchos de cinta que se pueden cargar automáticamente, como en las bibliotecas de cintas , son almacenamiento nearline, mientras que los cartuchos de cinta que se deben cargar manualmente son almacenamiento fuera de línea.

Almacenamiento fuera de línea

El almacenamiento fuera de línea es el almacenamiento de datos informáticos en un medio o dispositivo que no está bajo el control de una unidad de procesamiento . [8] El medio se graba, generalmente en un dispositivo de almacenamiento secundario o terciario, y luego se retira o desconecta físicamente. Debe ser insertado o conectado por un operador humano antes de que una computadora pueda acceder a él nuevamente. A diferencia del almacenamiento terciario, no se puede acceder a él sin interacción humana.

El almacenamiento fuera de línea se utiliza para transferir información , ya que el medio separado puede transportarse físicamente fácilmente. Además, es útil para casos de desastre, donde, por ejemplo, un incendio destruye los datos originales, un medio en una ubicación remota no se verá afectado, lo que permite la recuperación ante desastres . El almacenamiento fuera de línea aumenta la seguridad general de la información , ya que es físicamente inaccesible desde una computadora y la confidencialidad o integridad de los datos no puede verse afectada por técnicas de ataque informáticas. Además, si rara vez se accede a la información almacenada con fines de archivo, el almacenamiento fuera de línea es menos costoso que el almacenamiento terciario.

En las computadoras personales modernas, la mayoría de los medios de almacenamiento secundarios y terciarios también se utilizan para almacenamiento fuera de línea. Los discos ópticos y los dispositivos de memoria flash son los más populares y, en mucha menor medida, los discos duros extraíbles; Los ejemplos más antiguos incluyen disquetes y discos Zip. En los usos empresariales, predominan los cartuchos de cinta magnética; Los ejemplos más antiguos incluyen cintas magnéticas de bobina abierta y tarjetas perforadas.

Características del almacenamiento

Un módulo de 1 GiB de RAM DDR2 para computadora portátil

Las tecnologías de almacenamiento en todos los niveles de la jerarquía de almacenamiento se pueden diferenciar evaluando ciertas características centrales, así como midiendo características específicas de una implementación particular. Estas características centrales son la volatilidad, la mutabilidad, la accesibilidad y la direccionabilidad. Para cualquier implementación particular de cualquier tecnología de almacenamiento, las características que vale la pena medir son la capacidad y el rendimiento.

Volatilidad

La memoria no volátil retiene la información almacenada incluso si no recibe energía eléctrica constantemente. Es adecuado para el almacenamiento de información a largo plazo. La memoria volátil requiere energía constante para mantener la información almacenada. Las tecnologías de memoria más rápidas son las volátiles, aunque esa no es una regla universal. Dado que se requiere que el almacenamiento primario sea muy rápido, utiliza predominantemente memoria volátil.

La memoria dinámica de acceso aleatorio es una forma de memoria volátil que también requiere que la información almacenada se vuelva a leer y reescribir o actualizar periódicamente , de lo contrario desaparecería. La memoria estática de acceso aleatorio es una forma de memoria volátil similar a la DRAM, con la excepción de que nunca necesita actualizarse mientras haya energía; pierde su contenido cuando se corta el suministro eléctrico.

Se puede utilizar una fuente de alimentación ininterrumpida (UPS) para darle a una computadora un breve período de tiempo para mover información del almacenamiento volátil primario al almacenamiento no volátil antes de que se agoten las baterías. Algunos sistemas, por ejemplo EMC Symmetrix , tienen baterías integradas que mantienen el almacenamiento volátil durante varios minutos.

Mutabilidad

Almacenamiento de lectura/escritura o almacenamiento mutable
Permite sobrescribir información en cualquier momento. Una computadora sin cierta cantidad de almacenamiento de lectura/escritura para fines de almacenamiento primario sería inútil para muchas tareas. Las computadoras modernas suelen utilizar almacenamiento de lectura/escritura también como almacenamiento secundario.
Escritura lenta, almacenamiento de lectura rápida
Almacenamiento de lectura/escritura que permite sobrescribir la información varias veces, pero siendo la operación de escritura mucho más lenta que la operación de lectura. Los ejemplos incluyen CD-RW y SSD .
Escribir una vez almacenamiento
Write once read many (WORM) permite que la información se escriba solo una vez en algún momento después de la fabricación. Los ejemplos incluyen memoria de sólo lectura programable por semiconductores y CD-R .
Almacenamiento de solo lectura
Conserva la información almacenada en el momento de la fabricación. Los ejemplos incluyen circuitos integrados de ROM de máscara y CD-ROM .

Accesibilidad

Acceso aleatorio
Se puede acceder a cualquier ubicación almacenada en cualquier momento en aproximadamente la misma cantidad de tiempo. Esta característica es muy adecuada para el almacenamiento primario y secundario. La mayoría de las memorias semiconductoras , memorias flash y unidades de disco duro brindan acceso aleatorio, aunque tanto las memorias semiconductoras como las flash tienen una latencia mínima en comparación con las unidades de disco duro, ya que no es necesario mover piezas mecánicas.
Acceso secuencial
El acceso a las informaciones será en orden serial, uno tras otro; por lo tanto, el tiempo para acceder a una determinada información depende de a qué información se accedió por última vez. Esta característica es típica del almacenamiento fuera de línea.

Direccionabilidad

Direccionable por ubicación
Cada unidad de información almacenada accesible individualmente se selecciona con su dirección de memoria numérica . En las computadoras modernas, el almacenamiento direccionable por ubicación generalmente se limita al almacenamiento primario, al que acceden internamente los programas de computadora, ya que la direccionabilidad por ubicación es muy eficiente, pero onerosa para los humanos.
Archivo direccionable
La información se divide en archivos de longitud variable y se selecciona un archivo en particular con nombres de directorio y archivos legibles por humanos . El dispositivo subyacente todavía es direccionable por ubicación, pero el sistema operativo de una computadora proporciona la abstracción del sistema de archivos para que la operación sea más comprensible. En las computadoras modernas, el almacenamiento secundario, terciario y fuera de línea utiliza sistemas de archivos.
Direccionable por contenido
Cada unidad de información accesible individualmente se selecciona en función de (parte de) los contenidos allí almacenados. El almacenamiento direccionable por contenido se puede implementar mediante software (programa informático) o hardware (dispositivo informático), siendo el hardware una opción más rápida pero más cara. La memoria direccionable de contenido de hardware se utiliza a menudo en la memoria caché de la CPU de una computadora .

Capacidad

Capacidad bruta
La cantidad total de información almacenada que puede contener un dispositivo o medio de almacenamiento. Se expresa como una cantidad de bits o bytes (por ejemplo, 10,4 megabytes ).
Densidad de almacenamiento de memoria
La compacidad de la información almacenada. Es la capacidad de almacenamiento de un medio dividida por una unidad de longitud, área o volumen (por ejemplo, 1,2 megabytes por pulgada cuadrada).

Actuación

Latencia
El tiempo que lleva acceder a una ubicación particular del almacenamiento. La unidad de medida relevante suele ser el nanosegundo para el almacenamiento primario, el milisegundo para el almacenamiento secundario y el segundo para el almacenamiento terciario. Puede tener sentido separar la latencia de lectura y la latencia de escritura (especialmente para la memoria no volátil) y, en el caso del almacenamiento de acceso secuencial, la latencia mínima, máxima y promedio.
Rendimiento
La velocidad a la que se puede leer o escribir información en el almacenamiento. En el almacenamiento de datos informáticos, el rendimiento suele expresarse en términos de megabytes por segundo (MB/s), aunque también se puede utilizar la velocidad de bits . Al igual que con la latencia, es posible que sea necesario diferenciar la velocidad de lectura y la velocidad de escritura. Además, acceder a los medios de forma secuencial, en lugar de aleatoriamente, normalmente produce el máximo rendimiento.
Granularidad
El tamaño del "fragmento" más grande de datos al que se puede acceder eficientemente como una sola unidad, por ejemplo, sin introducir latencia adicional.
Fiabilidad
La probabilidad de cambio espontáneo del valor del bit en diversas condiciones, o tasa general de fallas .

Se pueden utilizar utilidades como hdparm y sar para medir el rendimiento de IO en Linux.

Energía usada

Seguridad

El cifrado de disco completo , el cifrado de discos virtuales y de volúmenes y el cifrado de archivos/carpetas están disponibles para la mayoría de los dispositivos de almacenamiento. [dieciséis]

El cifrado de memoria de hardware está disponible en la arquitectura Intel y admite cifrado de memoria total (TME) y cifrado de memoria granular de página con múltiples claves (MKTME). [17] [18] y en la generación SPARC M7 desde octubre de 2015. [19]

Vulnerabilidad y confiabilidad

La advertencia del software SMART sugiere una falla inminente del disco duro.

Los distintos tipos de almacenamiento de datos tienen diferentes puntos de falla y varios métodos de análisis predictivo de fallas .

Las vulnerabilidades que pueden provocar instantáneamente una pérdida total son los fallos de los cabezales de los discos duros mecánicos y los fallos de los componentes electrónicos del almacenamiento flash.

Detección de errores

Medición de la tasa de error en un DVD+R . Los errores menores son corregibles y están dentro de un rango saludable.

La falla inminente en las unidades de disco duro se puede estimar utilizando datos de diagnóstico SMART que incluyen las horas de operación y el recuento de giros, aunque su confiabilidad está en duda. [20]

El almacenamiento flash puede experimentar velocidades de transferencia descendentes como resultado de la acumulación de errores, que el controlador de memoria flash intenta corregir.

La salud de los medios ópticos se puede determinar midiendo errores menores corregibles , de los cuales un recuento alto significa medios deteriorados y/o de baja calidad. Demasiados errores menores consecutivos pueden provocar daños en los datos. No todos los proveedores y modelos de unidades ópticas admiten el escaneo de errores. [21]

Medios de almacenamiento

A partir de 2011 , los medios de almacenamiento de datos más utilizados son los semiconductores, magnéticos y ópticos, mientras que el papel todavía tiene un uso limitado. Se propone desarrollar algunas otras tecnologías de almacenamiento fundamentales, como las matrices totalmente flash (AFA).

Semiconductor

La memoria semiconductora utiliza chips de circuitos integrados (IC) basados ​​en semiconductores para almacenar información. Los datos normalmente se almacenan en celdas de memoria de semiconductores de óxido metálico (MOS) . Un chip de memoria semiconductor puede contener millones de celdas de memoria, que consisten en pequeños transistores de efecto de campo MOS (MOSFET) y/o condensadores MOS . Existen formas volátiles y no volátiles de memoria semiconductora; la primera utiliza MOSFET estándar y la segunda utiliza MOSFET de puerta flotante .

En las computadoras modernas, el almacenamiento primario consiste casi exclusivamente en memoria de acceso aleatorio (RAM) de semiconductores volátiles dinámicos , particularmente memoria dinámica de acceso aleatorio (DRAM). Desde principios de siglo, un tipo de memoria semiconductora de puerta flotante no volátil conocida como memoria flash ha ganado constantemente participación como almacenamiento fuera de línea para computadoras domésticas. La memoria semiconductora no volátil también se utiliza para almacenamiento secundario en diversos dispositivos electrónicos avanzados y computadoras especializadas diseñadas para ellos.

Ya en 2006, los fabricantes de computadoras portátiles y de escritorio comenzaron a utilizar unidades de estado sólido (SSD) basadas en flash como opciones de configuración predeterminadas para el almacenamiento secundario, además de o en lugar del HDD más tradicional. [22] [23] [24] [25] [26]

Magnético

El almacenamiento magnético utiliza diferentes patrones de magnetización en una superficie recubierta magnéticamente para almacenar información. El almacenamiento magnético no es volátil . Se accede a la información utilizando uno o más cabezales de lectura/escritura que pueden contener uno o más transductores de grabación. Un cabezal de lectura/escritura solo cubre una parte de la superficie, por lo que el cabezal, el medio o ambos deben moverse con respecto a otro para poder acceder a los datos. En las computadoras modernas, el almacenamiento magnético tomará estas formas:

En las primeras computadoras, el almacenamiento magnético también se usaba como:

El almacenamiento magnético no tiene un límite definido de ciclos de reescritura, como el almacenamiento flash y los medios ópticos regrabables, ya que la alteración de los campos magnéticos no provoca desgaste físico. Más bien, su vida útil está limitada por las piezas mecánicas. [27] [28]

Óptico

El almacenamiento óptico , el típico disco óptico , almacena información en deformidades en la superficie de un disco circular y lee esta información iluminando la superficie con un diodo láser y observando el reflejo. El almacenamiento en disco óptico no es volátil . Las deformidades pueden ser permanentes (medios de solo lectura), formadas una vez (medios de escritura una vez) o reversibles (medios grabables o de lectura/escritura). Los siguientes formularios son de uso común a partir de 2009 : [29]

El almacenamiento en disco magnetoóptico es un almacenamiento en disco óptico en el que el estado magnético de una superficie ferromagnética almacena información. La información se lee ópticamente y se escribe combinando métodos magnéticos y ópticos. El almacenamiento en disco magnetoóptico es un almacenamiento no volátil , de acceso secuencial , de escritura lenta y de lectura rápida que se utiliza para almacenamiento terciario y fuera de línea.

También se ha propuesto el almacenamiento de datos ópticos 3D .

También se ha propuesto la fusión por magnetización inducida por luz en fotoconductores magnéticos para el almacenamiento magnetoóptico de alta velocidad y bajo consumo de energía. [30]

Papel

El almacenamiento de datos en papel , normalmente en forma de cinta de papel o tarjetas perforadas , se ha utilizado durante mucho tiempo para almacenar información para su procesamiento automático, especialmente antes de que existieran las computadoras de uso general. La información se registró perforando agujeros en el medio de papel o cartón y se leyó mecánicamente (o más tarde ópticamente) para determinar si una ubicación particular en el medio era sólida o contenía un agujero. Los códigos de barras hacen posible que los objetos que se venden o transportan tengan adjunta de forma segura cierta información legible por computadora.

Se pueden realizar copias de seguridad en papel de cantidades relativamente pequeñas de datos digitales (en comparación con otros tipos de almacenamiento de datos digitales) como un código de barras matricial para un almacenamiento a muy largo plazo, ya que la longevidad del papel suele superar incluso el almacenamiento de datos magnéticos. [31] [32]

Otros medios o sustratos de almacenamiento

Memoria de tubo de vacío
Un tubo Williams usaba un tubo de rayos catódicos y un tubo Selectron usaba un tubo de vacío grande para almacenar información. Estos dispositivos de almacenamiento primario duraron poco en el mercado, ya que el tubo Williams no era confiable y el tubo Selectron era costoso.
Memoria electroacústica
La memoria de línea de retardo utilizaba ondas sonoras en una sustancia como el mercurio para almacenar información. La memoria de línea de retardo era volátil dinámica, almacenamiento de lectura/escritura secuencial de ciclos y se usaba para almacenamiento primario.
cinta óptica
es un medio de almacenamiento óptico, que generalmente consiste en una tira de plástico larga y estrecha, en la que se pueden escribir patrones y a partir de la cual se pueden leer los patrones. Comparte algunas tecnologías con películas de cine y discos ópticos, pero no es compatible con ninguno de los dos. La motivación detrás del desarrollo de esta tecnología fue la posibilidad de disponer de capacidades de almacenamiento mucho mayores que las cintas magnéticas o los discos ópticos.
Memoria de cambio de fase
utiliza diferentes fases mecánicas de material de cambio de fase para almacenar información en una matriz direccionable X – Y y lee la información observando la resistencia eléctrica variable del material. La memoria de cambio de fase sería un almacenamiento de lectura/escritura de acceso aleatorio no volátil y podría usarse para almacenamiento primario, secundario y fuera de línea. La mayoría de los discos ópticos regrabables y muchos de escritura única ya utilizan material de cambio de fase para almacenar información.
Almacenamiento de datos holográficos
almacena información ópticamente dentro de cristales o fotopolímeros . El almacenamiento holográfico puede utilizar todo el volumen del medio de almacenamiento, a diferencia del almacenamiento en disco óptico, que se limita a una pequeña cantidad de capas superficiales. El almacenamiento holográfico sería no volátil, de acceso secuencial y de escritura única o de lectura/escritura. Podría usarse para almacenamiento secundario y fuera de línea. Consulte Disco versátil holográfico (HVD).
memoria molecular
almacena información en polímero que puede almacenar carga eléctrica. La memoria molecular podría ser especialmente adecuada para el almacenamiento primario. La capacidad teórica de almacenamiento de la memoria molecular es de 10 terabits por pulgada cuadrada (16 Gbit/mm 2 ). [33]
Fotoconductores magnéticos
almacena información magnética, que puede modificarse mediante iluminación con poca luz. [30]
ADN
almacena información en los nucleótidos del ADN . Se hizo por primera vez en 2012, cuando los investigadores alcanzaron una proporción de 1,28 petabytes por gramo de ADN. En marzo de 2017, los científicos informaron que un nuevo algoritmo llamado fuente de ADN alcanzó el 85% del límite teórico, 215 petabytes por gramo de ADN. [34] [35] [36] [37]

Tecnologías relacionadas

Redundancia

Si bien el mal funcionamiento de un grupo de bits puede resolverse mediante mecanismos de detección y corrección de errores (ver arriba), el mal funcionamiento del dispositivo de almacenamiento requiere soluciones diferentes. Las siguientes soluciones se utilizan habitualmente y son válidas para la mayoría de los dispositivos de almacenamiento:

La duplicación de dispositivos y el RAID típico están diseñados para manejar una falla de un solo dispositivo en el grupo de dispositivos RAID. Sin embargo, si ocurre una segunda falla antes de que el grupo RAID esté completamente reparado desde la primera falla, entonces se pueden perder datos. La probabilidad de que se produzca un único fallo suele ser pequeña. Por tanto, la probabilidad de dos fallos en el mismo grupo RAID en proximidad temporal es mucho menor (aproximadamente la probabilidad al cuadrado, es decir, multiplicada por sí misma). Si una base de datos no puede tolerar ni siquiera una probabilidad tan pequeña de pérdida de datos, entonces el grupo RAID se replica (duplica). En muchos casos, dicha duplicación se realiza de forma remota geográficamente, en una matriz de almacenamiento diferente, para manejar la recuperación ante desastres (consulte recuperación ante desastres más arriba).

Conectividad de red

Un almacenamiento secundario o terciario puede conectarse a una computadora utilizando redes informáticas . Este concepto no se aplica al almacenamiento primario, que se comparte en menor grado entre varios procesadores.

Almacenamiento robótico

En dispositivos robóticos de almacenamiento terciario se pueden almacenar grandes cantidades de cintas magnéticas individuales y de discos ópticos o magnetoópticos. En el campo del almacenamiento en cinta se les conoce como bibliotecas de cintas , y en el campo del almacenamiento óptico , máquinas de discos ópticas o bibliotecas de discos ópticos por analogía. Las formas más pequeñas de cualquiera de las tecnologías que contienen un solo dispositivo de accionamiento se denominan cargadores automáticos o cambiadores automáticos .

Los dispositivos de almacenamiento de acceso robótico pueden tener varias ranuras, cada una con medios individuales y, por lo general, uno o más robots recolectores que atraviesan las ranuras y cargan medios en las unidades integradas. La disposición de las ranuras y los dispositivos de recogida afecta al rendimiento. Las características importantes de dicho almacenamiento son las posibles opciones de expansión: agregar ranuras, módulos, unidades, robots. Las bibliotecas de cintas pueden tener de 10 a más de 100.000 ranuras y proporcionar terabytes o petabytes de información cercana a la línea. Las máquinas de discos ópticas son soluciones algo más pequeñas, de hasta 1.000 ranuras.

El almacenamiento robótico se utiliza para copias de seguridad y para archivos de alta capacidad en las industrias médica, de imágenes y de vídeo. La gestión de almacenamiento jerárquico es una estrategia de archivo más conocida que consiste en migrar automáticamente archivos que no se utilizan desde hace mucho tiempo desde un almacenamiento rápido en el disco duro a bibliotecas o máquinas de discos. Si los archivos son necesarios, se recuperan en el disco.

Ver también

Temas de almacenamiento primario

Temas de almacenamiento secundario, terciario y fuera de línea.

Conferencias sobre almacenamiento de datos.

Notas

  1. ^ La mayoría de las computadoras contemporáneas utilizan tecnologías volátiles (que pierden datos cuando se corta la energía); Las primeras computadoras utilizaban tecnologías tanto volátiles como persistentes.

Referencias

Dominio publico Este artículo incorpora material de dominio público de la Norma Federal 1037C. Administración de Servicios Generales . Archivado desde el original el 22 de enero de 2022.

  1. ^ a b C Patterson, David A.; Hennessy, John L. (2005). Organización y diseño de computadoras: la interfaz hardware / software (3ª ed.). Ámsterdam : Editores Morgan Kaufmann . ISBN 1-55860-604-1. OCLC  56213091.
  2. ^ Almacenamiento como se define en Microsoft Computing Dictionary, 4ª edición. (c) 1999 o en The Authoritative Dictionary of IEEE Standard Terms, 7.ª edición, (c) 2000.
  3. ^ "Documentación para /proc/sys/vm/: la documentación del kernel de Linux".
  4. ^ "Almacenamiento primario o hardware de almacenamiento (muestra el uso del término" almacenamiento primario "que significa "almacenamiento en disco duro")". searchstorage.techtarget.com . Archivado desde el original el 10 de septiembre de 2008 . Consultado el 18 de junio de 2011 .
  5. ^ JS Vitter (2008). Algoritmos y estructuras de datos para memoria externa (PDF) . Serie sobre fundamentos y tendencias de la informática teórica. Hannover, MA: ahora Editores. ISBN 978-1-60198-106-6. Archivado (PDF) desde el original el 4 de enero de 2011.
  6. ^ "Una tesis sobre almacenamiento terciario" (PDF) . Archivado (PDF) desde el original el 27 de septiembre de 2007 . Consultado el 18 de junio de 2011 .
  7. ^ Pearson, Tony (2010). "Uso correcto del término nearline". IBM Developer-works, dentro del almacenamiento del sistema . Archivado desde el original el 24 de noviembre de 2015 . Consultado el 16 de agosto de 2015 .
  8. ^ Sistema Nacional de Comunicaciones (7 de agosto de 1996). Norma Federal 1037C – Telecomunicaciones: Glosario de Términos de Telecomunicaciones (Reporte técnico). Administración de Servicios Generales. FS-1037C. Archivado desde el original el 2 de marzo de 2009 . Consultado el 8 de octubre de 2007 .Véase también el artículo Norma federal 1037C .
  9. ^ "Calculadora de ahorro de energía". Archivado desde el original el 21 de diciembre de 2008.
  10. ^ "¿Qué parte del [re]drive es realmente ecológico?". Tecnología sencilla . Archivado desde el original el 5 de agosto de 2008.
  11. ^ Mike Chin (8 de marzo de 2004). "¿El Silent PC Future tiene 2,5 pulgadas de ancho?". Archivado desde el original el 20 de julio de 2008 . Consultado el 2 de agosto de 2008 .
  12. ^ Mike Chin (18 de septiembre de 2002). "Discos duros recomendados". Archivado desde el original el 5 de septiembre de 2008 . Consultado el 2 de agosto de 2008 .
  13. ^ Disco duro flash IDE "Super Talent's 2,5". El informe técnico . 12 de julio de 2006. p. 13. Archivado desde el original el 26 de enero de 2012. Consultado el 18 de junio de 2011 .
  14. ^ "Consumo de energía: hardware de Tom: ¿obsoletismo del disco duro convencional? Vista previa de la unidad flash de 32 GB de Samsung". tomshardware.com . 20 de septiembre de 2006 . Consultado el 18 de junio de 2011 .
  15. ^ ab Aleksey Meyev (23 de abril de 2008). "SSD, i-RAM y discos duros tradicionales". Laboratorios X-bit. Archivado desde el original el 18 de diciembre de 2008.
  16. ^ "Guía de tecnologías de cifrado de almacenamiento para dispositivos de usuario final" (PDF) . Instituto Nacional de Estándares y Tecnología de EE. UU. Noviembre de 2007.
  17. ^ "Especificaciones de cifrado" (PDF) . software.intel.com. Archivado (PDF) desde el original el 9 de octubre de 2022 . Consultado el 28 de diciembre de 2019 .
  18. ^ "Una API propuesta para el cifrado de memoria completa". Lwn.net . Consultado el 28 de diciembre de 2019 .
  19. ^ "Introducción a SPARC M7 y la memoria segura de silicio (SSM)". swisdev.oracle.com. Archivado desde el original el 21 de enero de 2019 . Consultado el 28 de diciembre de 2019 .
  20. ^ "Lo que realmente nos dicen los errores del disco duro SMART". Contrafuego . 6 de octubre de 2016.
  21. ^ "QPxTool - comprobar la calidad". qpxtool.sourceforge.io .
  22. ^ "La nueva computadora portátil Samsung reemplaza el disco duro con flash". Tecnología extrema . 23 de mayo de 2006. Archivado desde el original el 30 de diciembre de 2010 . Consultado el 18 de junio de 2011 .
  23. ^ "Toshiba arroja el sombrero al anillo de almacenamiento flash de la computadora portátil". technewsworld.com . Archivado desde el original el 18 de marzo de 2012 . Consultado el 18 de junio de 2011 .
  24. ^ "Mac Pro: opciones de almacenamiento y RAID para su Mac Pro". Manzana. 27 de julio de 2006. Archivado desde el original el 6 de junio de 2013 . Consultado el 18 de junio de 2011 .
  25. ^ "MacBook Air: lo mejor del iPad se combina con lo mejor de Mac". Manzana. Archivado desde el original el 27 de mayo de 2013 . Consultado el 18 de junio de 2011 .
  26. ^ "MacBook Air reemplaza el disco duro estándar de una computadora portátil por almacenamiento flash de estado sólido". noticias.inventhelp.com . 15 de noviembre de 2010. Archivado desde el original el 23 de agosto de 2011 . Consultado el 18 de junio de 2011 .
  27. ^ "Comparación de la resistencia de SSD y HDD en la era de los SSD QLC" (PDF) . Tecnología de micras. Archivado (PDF) desde el original el 9 de octubre de 2022.
  28. ^ "Comparación de SSD y HDD: una comparación completa de las unidades de almacenamiento". www.stellarinfo.co.in .
  29. ^ "Preguntas frecuentes sobre DVD: una referencia completa de las tecnologías de DVD". Archivado desde el original el 22 de agosto de 2009.
  30. ^ ab Náfrádi, Bálint (24 de noviembre de 2016). "Magnetismo ópticamente conmutado en perovskita fotovoltaica CH3NH3 (Mn: Pb) I3". Comunicaciones de la naturaleza . 7 : 13406. arXiv : 1611.08205 . Código Bib : 2016NatCo...713406N. doi : 10.1038/ncomms13406. PMC 5123013 . PMID  27882917. 
  31. ^ "Una solución de copia de seguridad en papel (no tan estúpida como parece)". 14 de agosto de 2012.
  32. ^ Sterling, Bruce (16 de agosto de 2012). "Copia de seguridad en papel PaperBack". Cableado .
  33. ^ "Un nuevo método de autoensamblaje de elementos a nanoescala podría transformar la industria del almacenamiento de datos". sciencedaily.com . 1 de marzo de 2009. Archivado desde el original el 1 de marzo de 2009 . Consultado el 18 de junio de 2011 .
  34. ^ Yong, Ed. "Esta mota de ADN contiene una película, un virus informático y una tarjeta de regalo de Amazon". El Atlántico . Archivado desde el original el 3 de marzo de 2017 . Consultado el 3 de marzo de 2017 .
  35. ^ "Los investigadores almacenan el sistema operativo de la computadora y un cortometraje sobre el ADN". phys.org . Archivado desde el original el 2 de marzo de 2017 . Consultado el 3 de marzo de 2017 .
  36. ^ "El ADN podría almacenar todos los datos del mundo en una sola habitación". Revista de ciencia. 2 de marzo de 2017. Archivado desde el original el 2 de marzo de 2017 . Consultado el 3 de marzo de 2017 .
  37. ^ Erlich, Yaniv; Zielinski, Dina (2 de marzo de 2017). "DNA Fountain permite una arquitectura de almacenamiento robusta y eficiente". Ciencia . 355 (6328): 950–954. Código Bib : 2017 Ciencia... 355..950E. doi : 10.1126/ciencia.aaj2038. PMID  28254941. S2CID  13470340.
  38. ^ "Recuperación ante desastres en la nube de AWS". 18 de agosto de 2023.

Otras lecturas