Las unidades de capacidad de almacenamiento de datos más utilizadas son el bit , la capacidad de un sistema que tiene solo dos estados, y el byte (u octeto ), que equivale a ocho bits. A partir de estos, se pueden formar múltiplos de estas unidades con los prefijos del SI (prefijos de potencia de diez) o los prefijos binarios IEC más nuevos (prefijos de potencia de dos).
Unidades primarias
En 1928, Ralph Hartley observó un principio fundamental de almacenamiento, [1] que fue formalizado por Claude Shannon en 1945: la información que se puede almacenar en un sistema es proporcional al logaritmo de N estados posibles de ese sistema, denotado log b N . Cambiar la base del logaritmo de b a un número diferente c tiene el efecto de multiplicar el valor del logaritmo por una constante fija, a saber, log c N = (log c b ) log b N . Por lo tanto, la elección de la base b determina la unidad utilizada para medir la información. En particular, si b es un entero positivo , entonces la unidad es la cantidad de información que se puede almacenar en un sistema con b estados posibles.
Cuando b es 2, la unidad es el shannon , igual al contenido de información de un "bit" (una combinación de dígito binario [2] ). Un sistema con 8 estados posibles, por ejemplo, puede almacenar hasta log 2 8 = 3 bits de información. Otras unidades que han recibido nombre incluyen:
Base b = 3
La unidad se llama " trit " y es igual a log 2 3 (≈ 1,585) bits. [3]
Base b = 10
La unidad se llama dígito decimal , hartley , ban , decit o dit , y es igual a log 2 10 (≈ 3,322) bits. [1] [4] [5] [6]
La unidad se llama nat , nit o nepit (del neperiano ) y equivale a log 2 e (≈ 1,443) bits. [1]
Trit, ban y nat rara vez se utilizan para medir la capacidad de almacenamiento; pero nat, en particular, se utiliza a menudo en la teoría de la información, porque los logaritmos naturales son matemáticamente más convenientes que los logaritmos en otras bases.
Unidades derivadas de bit
Se utilizan varios nombres convencionales para colecciones o grupos de bits.
Byte
Históricamente, un byte era el número de bits utilizados para codificar un carácter de texto en la computadora, que dependía de la arquitectura del hardware de la computadora, pero hoy casi siempre significa ocho bits, es decir, un octeto . Un byte de 8 bits puede representar 256 (2 8 ) valores distintos, como números enteros no negativos de 0 a 255, o números enteros con signo de −128 a 127. El estándar IEEE 1541-2002 especifica "B" (mayúscula) como el símbolo para byte ( IEC 80000-13 usa "o" para octeto en francés, [nb 1] pero también permite "B" en inglés). Los bytes, o múltiplos de los mismos, casi siempre se usan para especificar los tamaños de los archivos de computadora y la capacidad de las unidades de almacenamiento. La mayoría de las computadoras y dispositivos periféricos modernos están diseñados para manipular datos en bytes completos o grupos de bytes, en lugar de bits individuales.
Picar
Un grupo de cuatro bits, o medio byte, a veces se denomina nibble , nybble o nyble. Esta unidad se utiliza con mayor frecuencia en el contexto de representaciones de números hexadecimales , ya que un nibble tiene la misma cantidad de valores posibles que un dígito hexadecimal. [7]
Palabra, bloque y página
Los ordenadores suelen manipular bits en grupos de un tamaño fijo, convencionalmente llamados palabras . El número de bits de una palabra suele definirse por el tamaño de los registros de la CPU del ordenador , o por el número de bits de datos que se extraen de su memoria principal en una sola operación. En la arquitectura IA-32 más comúnmente conocida como x86-32, una palabra son 32 bits, pero otras arquitecturas pasadas y actuales utilizan palabras con 4, 8, 9, 12, 13, 16, 18, 20, 21, 22, 24, 25, 29, 30, 31, 32, 33, 35, 36, 38, 39, 40, 42, 44, 48, 50, 52, 54, 56, 60, 64, 72 [8] bits u otros.
Las memorias caché de las computadoras suelen funcionar en bloques de memoria que constan de varias palabras consecutivas. Estas unidades se denominan habitualmente bloques de caché o, en el caso de las memorias caché de las CPU , líneas de caché .
Los términos para grandes cantidades de bits se pueden formar utilizando el rango estándar de prefijos del SI para potencias de 10, por ejemplo, kilo = 10 3 = 1000 (como en kilobit o kbit), mega = 10 6 = 1 000 000 (como en megabit o Mbit) y giga = 10 9 = 1 000 000 000 (como en gigabit o Gbit). Estos prefijos se utilizan con más frecuencia para múltiplos de bytes, como en kilobyte (1 kB = 8000 bit), megabyte (1 MB = 8 000 000 bit ) y gigabyte (1 GB = 8 000 000 000 bit ).
Sin embargo, por razones técnicas, las capacidades de las memorias de las computadoras y algunas unidades de almacenamiento suelen ser múltiplos de una gran potencia de dos, como 2 · 28 = 268 435 456 bytes. Para evitar números tan difíciles de manejar, la gente a menudo ha reutilizado los prefijos del SI para que signifiquen la potencia de dos más cercana, por ejemplo, usando el prefijo kilo para 2 · 10 = 1024, mega para 2 · 20 = 1 048 576 y giga para 2 · 30 = 1 073 741 824 , y así sucesivamente. Por ejemplo, un chip de memoria de acceso aleatorio con una capacidad de 2 · 28 bytes se denominaría chip de 256 megabytes. La siguiente tabla ilustra estas diferencias.
En el pasado, se ha utilizado la K mayúscula en lugar de la k minúscula para indicar 1024 en lugar de 1000. Sin embargo, este uso no se aplicó de manera consistente.
Por otra parte, para los sistemas de almacenamiento externo (como los discos ópticos ), los prefijos del SI se utilizan comúnmente con sus valores decimales (potencias de 10). Muchos intentos han buscado resolver la confusión proporcionando notaciones alternativas para múltiplos de potencias de dos. La Comisión Electrotécnica Internacional (IEC) emitió un estándar para este propósito al definir una serie de prefijos binarios que utilizan 1024 en lugar de 1000 como el radix principal: [9]
El estándar de memoria JEDEC JESD88F señala que las definiciones de kilo (K), giga (G) y mega (M) basadas en potencias de dos se incluyen solo para reflejar el uso común, pero por lo demás quedan obsoletas. [10]
Ejemplos de tallas
1 bit: Respuesta a una pregunta de sí/no
1 byte: un número del 0 al 255
90 bytes: suficiente para almacenar una línea de texto típica de un libro
200 TB: la unidad de estado sólido más grande construida (predicción para mediados de 2022)
1,6 PB (1600 TB): cantidad de almacenamiento posible en un servidor 2U (récord mundial a partir de 2021, utilizando unidades de estado sólido de 100 TB). [11]
1.3 ZB: Predicción del volumen de todo Internet en 2016
Unidades obsoletas e inusuales
Se han nombrado otras unidades de almacenamiento de información:
4 bits: carácter (en Intel 4004 [23] ; sin embargo, los caracteres suelen tener 8 bits de ancho o más en otros procesadores); para otros, consulte nibble
128 bits: hexlet, [35] [40] párrafo (en procesadores Intel x86 ) [41] [42]
256 bytes: página (en procesadores Intel 4004, [23] 8080 y 8086, [41] también muchos otros procesadores de 8 bits; normalmente mucho más grandes en muchos procesadores de 16 bits/32 bits)
ISO 80000-13 (Cantidades y unidades – Parte 13: Ciencia y tecnología de la información)
Notas
^ Sin embargo, si se ignora la directriz del SI de incluir un espacio antes de la unidad, la abreviatura IEC 80000-13 "o" para octetos puede confundirse con el sufijo "o" para indicar números octales en la convención Intel .
Referencias
^ abc Abramson, Norman (1963). Teoría de la información y codificación . McGraw-Hill .
^ Mackenzie, Charles E. (1980). Conjuntos de caracteres codificados, historia y desarrollo (PDF) . Serie de programación de sistemas (1.ª edición). Addison-Wesley Publishing Company, Inc. pág. xii. ISBN978-0-201-14460-4. LCCN 77-90165. Archivado (PDF) del original el 26 de mayo de 2016. Consultado el 25 de agosto de 2019 .
^ Shanmugam (2006). Sistemas informáticos digitales y analógicos .
^ Jaeger, Gregg (2007). Información cuántica: una visión general.
^ Kumar, I. Ravi (2001). Teoría estadística integral de la comunicación .
^ Nybble en dictionary reference.com; fuente: Jargon File 4.2.0, consultado el 12 de agosto de 2007
^ Beebe, Nelson HF (22 de agosto de 2017). "Capítulo I. Aritmética de números enteros". Manual de cálculo de funciones matemáticas: programación con la biblioteca de software portátil MathCW (1.ª edición). Salt Lake City, UT, EE. UU.: Springer International Publishing AG . pág. 970. doi :10.1007/978-3-319-64110-2. ISBN .978-3-319-64109-6. Código LCCN 2017947446. S2CID 30244721.
^ La norma ISO /IEC es la ISO/IEC 80000-13 :2008. Esta norma anula y reemplaza las subcláusulas 3.8 y 3.9 de la IEC 60027-2:2005. El único cambio significativo es la adición de definiciones explícitas para algunas magnitudes. Catálogo en línea de ISO
^ "Diccionario de términos para tecnología de estado sólido – 7.ª edición". Asociación de tecnología de estado sólido JEDEC. Febrero de 2018. págs. 100, 118, 135. JESD88F . Consultado el 25 de junio de 2021 .
^ Maleval, Jean Jacques (12 de febrero de 2021). "Nimbus Data SSD certificadas para su uso con servidores Dell EMC PowerEdge". StorageNewsletter . Consultado el 30 de mayo de 2024 .
^ abc Horak, Ray (2007). Diccionario Webster de telecomunicaciones del Nuevo Mundo. John Wiley & Sons . pág. 402. ISBN9-78047022571-4.
^ "Unibit".
^ ab Steinbuch, Karl W .; Wagner, Siegfried W., eds. (1967) [1962]. Escrito en Karlsruhe, Alemania. Taschenbuch der Nachrichtenverarbeitung (en alemán) (2 ed.). Berlín / Heidelberg / Nueva York: Springer-Verlag OHG . págs. 835–836. LCCN 67-21079. Título N° 1036.
^ ab Steinbuch, Karl W .; Weber, Wolfgang; Heinemann, Traute, eds. (1974) [1967]. Escrito en Karlsruhe / Bochum. Taschenbuch der Informatik - Band III - Anwendungen und spezielle Systeme der Nachrichtenverarbeitung (en alemán). vol. 3 (3 ed.). Berlín / Heidelberg / Nueva York: Springer Verlag . págs. 357–358. ISBN3-540-06242-4. Número de LCCN 73-80607.
^ Bertram, H. Neal (1994). Teoría de la grabación magnética (1.ª ed.). Cambridge University Press . ISBN0-521-44973-1. 9-780521-449731. […] La escritura de un impulso implicaría escribir un dibit o dos transiciones arbitrariamente cercanas entre sí. […]
^ Control Data 8092 TeleProgrammer: Manual de referencia de programación (PDF) . Minneapolis, Minnesota, EE. UU.: Control Data Corporation . 1964. IDP 107a. Archivado (PDF) desde el original el 25 de mayo de 2020 . Consultado el 27 de julio de 2020 .
^ ab Svoboda, Antonín ; White, Donnamaie E. (2016) [2012, 1985, 1979-08-01]. Técnicas avanzadas de diseño de circuitos lógicos (PDF) (edición electrónica reimpresa y reescrita). Garland STPM Press (edición original) / WhitePubs Enterprises, Inc. (reedición). ISBN0-8240-7014-3LCCN 78-31384. Archivado (PDF) del original el 14 de abril de 2017. Consultado el 15 de abril de 2017 .[1][2]
^ Pablo, Reinhold (2013). Elektrotechnik und Elektronik für Informatiker - Grundgebiete der Elektronik (en alemán). vol. 2. BG Teubner Stuttgart / Springer . ISBN978-3-32296652-0. Recuperado el 3 de agosto de 2015 .
^ Böhme, Gert; Nacido, Werner; Wagner, B.; Schwarze, G. (2 de julio de 2013) [1969]. Reichenbach, Jürgen (ed.). Programmierung von Prozeßrechnern. Reihe Automatisierungstechnik (en alemán). vol. 79. VEB Verlag Technik [de] Berlín, reimpresión: Springer Verlag . doi :10.1007/978-3-663-02721-8. ISBN978-3-663-00808-8. 9/3/4185.
^ ab "Términos y abreviaturas / 4.1 Cruce de límites de página". Manual de programación en lenguaje ensamblador MCS-4 - Manual de programación del sistema de microcomputadoras INTELLEC 4 (PDF) (edición preliminar). Santa Clara, California, EE. UU.: Intel Corporation . Diciembre de 1973. págs. v, 2-6, 4-1. MCS-030-1273-1. Archivado (PDF) desde el original el 2020-03-01 . Consultado el 2020-03-02 . […] Bit : la unidad de información más pequeña que se puede representar. (Un bit puede estar en uno de dos estados: I 0 o 1). […] Byte : un grupo de 8 bits contiguos que ocupan una sola ubicación de memoria. […] Carácter : un grupo de 4 bits de datos contiguos. […] Los programas se almacenan en la ROM o en la RAM de programa, ambas divididas en páginas . Cada página consta de 256 ubicaciones de 8 bits. Las direcciones 0 a 255 comprenden la primera página, las 256 a 511 comprenden la segunda página, y así sucesivamente. […](NB. Este manual de Intel 4004 utiliza el término carácter para referirse a entidades de datos de 4 bits en lugar de 8 bits . Intel pasó a utilizar el término más común "nibble" para entidades de 4 bits en su documentación para el procesador siguiente, el 4040 , ya en 1974.)
^ Steinbuch, Karl W. , ed. (1962). Escrito en Karlsruhe, Alemania. Taschenbuch der Nachrichtenverarbeitung (en alemán) (1 ed.). Berlín / Gotinga / Nueva York: Springer-Verlag OHG . pag. 1076. LCCN 62-14511.
^ Crispin, Mark R. (2005). RFC 4042: UTF-9 y UTF-18 .
^ Estándar IEEE para aritmética de punto flotante. 29 de agosto de 2008. págs. 1–70. doi :10.1109/IEEESTD.2008.4610935. ISBN978-0-7381-5752-8. Recuperado el 10 de febrero de 2016 .
^ Müller, Jean-Michel; Brisebarre, Nicolás; de Dinechin, Florent; Jeannerod, Claude-Pierre; Lefèvre, Vicente; Melquiond, Guillaume; Revol, Nathalie ; Stehlé, Damián; Torres, Serge (2010). Manual de aritmética de coma flotante (1 ed.). Birkhäuser . doi :10.1007/978-0-8176-4705-6. ISBN978-0-8176-4704-9. Número de serie LCCN 2009939668.
^ Erle, Mark A. (21 de noviembre de 2008). Algoritmos y diseños de hardware para la multiplicación decimal (tesis). Universidad de Lehigh (publicada en 2009). ISBN978-1-10904228-3. 1109042280 . Consultado el 10 de febrero de 2016 .
^ Kneusel, Ronald T. (2015). Números y computadoras. Springer Verlag . ISBN9783319172606. 3319172603 . Consultado el 10 de febrero de 2016 .
^ Zbiciak, Joe. "Documentación rápida y sencilla de AS1600" . Consultado el 28 de abril de 2013 .
^ "315 Sistema de procesamiento electrónico de datos" (PDF) . NCR . Noviembre de 1965. NCR MPN ST-5008-15. Archivado (PDF) desde el original el 24 de mayo de 2016 . Consultado el 28 de enero de 2015 .
^ Bardin, Hillel (1963). "NCR 315 Seminar" (PDF) . Comunicado sobre el uso de computadoras . 2 (3). Archivado (PDF) desde el original el 24 de mayo de 2016.
^ Schneider, Carl (2013) [1970]. Datenverarbeitungs-Lexikon [ Léxico de tecnología de la información ] (en alemán) (reimpresión de tapa blanda de tapa dura, 1ª ed.). Wiesbaden, Alemania: Springer Fachmedien Wiesbaden GmbH / Betriebswirtschaftlicher Verlag Dr. Th. Gabler GmbH . págs.201, 308. doi :10.1007/978-3-663-13618-7. ISBN978-3-409-31831-0. Consultado el 24 de mayo de 2016 . […] losa , Abk. aus syllable = Silbe, the kleinste adressierbare Informationseinheit für 12 bit zur Übertragung von dos Alphazeichen oder tres numerischen Zeichen. (NCR) […] Hardware: Datenstruktur: NCR 315-100 / NCR 315-RMC; Idioma del artículo: Silbe; Puntas: 12; Bytes: –; Dezimalziffern: 3; Tiempo: 2; Gleitkommadarstellung: fest verdrahtet; Mantisa: 4 Silben; Exponente: 1 Silbe (11 Stellen + 1 Vorzeichen) […] [ losa , abbr. para sílaba = sílaba, unidad de información direccionable más pequeña para 12 bits para la transferencia de dos caracteres alfabéticos o tres caracteres numéricos. (NCR) […] Hardware: Estructura de datos: NCR 315-100 / NCR 315-RMC ; Longitud de palabra : Sílaba ; Bits : 12; Bytes : –; Dígitos decimales : 3; Caracteres: 2; Formato de punto flotante : cableado; Significando : 4 sílabas; Exponente : 1 sílaba (11 dígitos + 1 prefijo)]
^ abcd Estándar IEEE para una arquitectura de microprocesador de 32 bits. Instituto de Ingenieros Eléctricos y Electrónicos, Inc. 1995. págs. 5-7. doi :10.1109/IEEESTD.1995.79519. ISBN1-55937-428-4. Recuperado el 10 de febrero de 2016 .(NB. El estándar define dobletes, cuatriciclos, octetos y hextetos como 2, 4, 8 y 16 bytes , dando los números de bits (16, 32, 64 y 128) solo como un significado secundario. Esto puede ser importante dado que históricamente los bytes no siempre se entendieron como 8 bits ( octetos ).)
^ abc Knuth, Donald Ervin (15 de febrero de 2004) [1999]. Fascículo 1: MMIX (PDF) (0.ª impresión, 15.ª ed.). Stanford University : Addison-Wesley . Archivado (PDF) desde el original el 30 de marzo de 2017 . Consultado el 30 de marzo de 2017 .
^ de Raymond, Eric S. (1996). El nuevo diccionario del hacker (3.ª edición). MIT Press. pág. 333. ISBN0262680920.
^ Böszörményi, László; Hölzl, Günther; Pirker, Emaneul (febrero de 1999). Escrito en Salzburgo, Austria. Zinterhof, Peter; Vajteršic, Marian; Uhl, Andreas (eds.). Computación en clúster paralelo con IEEE1394–1995 . Computación paralela: 4.ª conferencia internacional ACPC, que incluye temas especiales sobre numérica paralela (ParNum '99) y computación paralela en procesamiento de imágenes, procesamiento de vídeo y multimedia. Actas: Notas de clase en informática 1557. Berlín, Alemania: Springer Verlag .
^ Actas del Simposio sobre experiencias con sistemas distribuidos y multiprocesadores (SEDMS). Vol. 4. Asociación USENIX . 1993.
^ ab "1. Introducción: Alineación de segmentos". Utilidades de la familia 8086: Guía del usuario para sistemas de desarrollo basados en 8080/8085 (PDF) . Revisión E (A620/5821 6K DD ed.). Santa Clara, California, EE. UU.: Intel Corporation . Mayo de 1982 [1980, 1978]. pág. 1-6. Número de pedido: 9800639-04. Archivado (PDF) desde el original el 29 de febrero de 2020 . Consultado el 29 de febrero de 2020 .
^ Brousentsov, NP; Maslov, SP; Ramil Alvarez, J.; Zhogolev, EA "Desarrollo de computadoras ternarias en la Universidad Estatal de Moscú" . Consultado el 20 de enero de 2010 .
^ Estados Unidos 4319227, Malinowski, Christopher W.; Rinderle, Heinz & Siegle, Martin, "Sistema de señalización de tres estados", publicado el 9 de marzo de 1982, asignado a AEG-Telefunken
^ "US4319227". Google .
^ "US4319227" (PDF) . Imágenes de patentes .
Enlaces externos
Representación de valores numéricos y unidades del SI en cadenas de caracteres para intercambios de información