stringtranslate.com

Unidades de información

En informática digital y telecomunicaciones , una unidad de información es la capacidad de algún sistema de almacenamiento de datos estándar o canal de comunicación , que se utiliza para medir las capacidades de otros sistemas y canales. En teoría de la información , las unidades de información también se utilizan para medir la información contenida en los mensajes y la entropía de variables aleatorias.

Las unidades de capacidad de almacenamiento de datos más utilizadas son el bit , la capacidad de un sistema que tiene solo dos estados, y el byte (u octeto ), que equivale a ocho bits. A partir de estos, se pueden formar múltiplos de estas unidades con los prefijos del SI (prefijos de potencia de diez) o los prefijos binarios IEC más nuevos (prefijos de potencia de dos).

Unidades primarias

Comparación de unidades de información: bit , trit , nat , ban . La cantidad de información es la altura de las barras. El nivel verde oscuro es la unidad "nat".

En 1928, Ralph Hartley observó un principio fundamental de almacenamiento, [1] que fue formalizado por Claude Shannon en 1945: la información que se puede almacenar en un sistema es proporcional al logaritmo de N estados posibles de ese sistema, denotado log b N . Cambiar la base del logaritmo de b a un número diferente c tiene el efecto de multiplicar el valor del logaritmo por una constante fija, a saber, log c N = (log c b ) log b N . Por lo tanto, la elección de la base b determina la unidad utilizada para medir la información. En particular, si b es un entero positivo , entonces la unidad es la cantidad de información que se puede almacenar en un sistema con b estados posibles.

Cuando b es 2, la unidad es el shannon , igual al contenido de información de un "bit" (una combinación de dígito binario [2] ). Un sistema con 8 estados posibles, por ejemplo, puede almacenar hasta log 2 8 = 3 bits de información. Otras unidades que han recibido nombre incluyen:

Base b  = 3
La unidad se llama " trit " y es igual a log 2 3 (≈ 1,585) bits. [3]
Base b  = 10
La unidad se llama dígito decimal , hartley , ban , decit o dit , y es igual a log 2  10 (≈ 3,322) bits. [1] [4] [5] [6]
Base b  =  e , la base de los logaritmos naturales
La unidad se llama nat , nit o nepit (del neperiano ) y equivale a log 2 e (≈ 1,443) bits. [1]

Trit, ban y nat rara vez se utilizan para medir la capacidad de almacenamiento; pero nat, en particular, se utiliza a menudo en la teoría de la información, porque los logaritmos naturales son matemáticamente más convenientes que los logaritmos en otras bases.

Unidades derivadas de bit

Se utilizan varios nombres convencionales para colecciones o grupos de bits.

Byte

Históricamente, un byte era el número de bits utilizados para codificar un carácter de texto en la computadora, que dependía de la arquitectura del hardware de la computadora, pero hoy casi siempre significa ocho bits, es decir, un octeto . Un byte de 8 bits puede representar 256 (2 8 ) valores distintos, como números enteros no negativos de 0 a 255, o números enteros con signo de −128 a 127. El estándar IEEE 1541-2002 especifica "B" (mayúscula) como el símbolo para byte ( IEC 80000-13 usa "o" para octeto en francés, [nb 1] pero también permite "B" en inglés). Los bytes, o múltiplos de los mismos, casi siempre se usan para especificar los tamaños de los archivos de computadora y la capacidad de las unidades de almacenamiento. La mayoría de las computadoras y dispositivos periféricos modernos están diseñados para manipular datos en bytes completos o grupos de bytes, en lugar de bits individuales.

Picar

Un grupo de cuatro bits, o medio byte, a veces se denomina nibble , nybble o nyble. Esta unidad se utiliza con mayor frecuencia en el contexto de representaciones de números hexadecimales , ya que un nibble tiene la misma cantidad de valores posibles que un dígito hexadecimal. [7]

Palabra, bloque y página

Los ordenadores suelen manipular bits en grupos de un tamaño fijo, convencionalmente llamados palabras . El número de bits de una palabra suele definirse por el tamaño de los registros de la CPU del ordenador , o por el número de bits de datos que se extraen de su memoria principal en una sola operación. En la arquitectura IA-32 más comúnmente conocida como x86-32, una palabra son 32 bits, pero otras arquitecturas pasadas y actuales utilizan palabras con 4, 8, 9, 12, 13, 16, 18, 20, 21, 22, 24, 25, 29, 30, 31, 32, 33, 35, 36, 38, 39, 40, 42, 44, 48, 50, 52, 54, 56, 60, 64, 72 [8] bits u otros.

Algunas instrucciones de máquina y formatos de números de computadora utilizan dos palabras (una "palabra doble" o "dword"), o cuatro palabras (una "palabra cuádruple" o "quad").

Las memorias caché de las computadoras suelen funcionar en bloques de memoria que constan de varias palabras consecutivas. Estas unidades se denominan habitualmente bloques de caché o, en el caso de las memorias caché de las CPU , líneas de caché .

Los sistemas de memoria virtual dividen el almacenamiento principal de la computadora en unidades aún más grandes, tradicionalmente llamadas páginas .

Múltiplos sistemáticos

Los términos para grandes cantidades de bits se pueden formar utilizando el rango estándar de prefijos del SI para potencias de 10, por ejemplo, kilo  = 10 3  = 1000 (como en kilobit o kbit), mega  = 10 6  = 1 000 000 (como en megabit o Mbit) y giga  = 10 9 = 1 000 000 000 (como en gigabit o Gbit). Estos prefijos se utilizan con más frecuencia para múltiplos de bytes, como en kilobyte (1 kB = 8000 bit), megabyte (1 MB = 8 000 000 bit ) y gigabyte (1 GB = 8 000 000 000 bit ).

Sin embargo, por razones técnicas, las capacidades de las memorias de las computadoras y algunas unidades de almacenamiento suelen ser múltiplos de una gran potencia de dos, como 2 · 28  = 268 435 456 bytes. Para evitar números tan difíciles de manejar, la gente a menudo ha reutilizado los prefijos del SI para que signifiquen la potencia de dos más cercana, por ejemplo, utilizando el prefijo kilo para 2 · 10  = 1024, mega para 2 · 20  = 1 048 576 y giga para 2 · 30  = 1 073 741 824 , y así sucesivamente. Por ejemplo, un chip de memoria de acceso aleatorio con una capacidad de 2 · 28 bytes se denominaría chip de 256 megabytes. La siguiente tabla ilustra estas diferencias.

En el pasado, se ha utilizado la K mayúscula en lugar de la k minúscula para indicar 1024 en lugar de 1000. Sin embargo, este uso no se aplicó de manera consistente.

Por otra parte, para los sistemas de almacenamiento externo (como los discos ópticos ), los prefijos del SI se utilizan comúnmente con sus valores decimales (potencias de 10). Muchos intentos han buscado resolver la confusión proporcionando notaciones alternativas para múltiplos de potencias de dos. La Comisión Electrotécnica Internacional (IEC) emitió un estándar para este propósito al definir una serie de prefijos binarios que utilizan 1024 en lugar de 1000 como el radix principal: [9]

El estándar de memoria JEDEC JESD88F señala que las definiciones de kilo (K), giga (G) y mega (M) basadas en potencias de dos se incluyen solo para reflejar el uso común, pero por lo demás quedan obsoletas. [10]

Ejemplos de tallas

Unidades obsoletas e inusuales

Se han nombrado otras unidades de almacenamiento de información:

Algunos de estos nombres son jerga , están obsoletos o se usan sólo en contextos muy restringidos.

Véase también

Notas

  1. ^ Sin embargo, si se ignora la directriz del SI de incluir un espacio antes de la unidad, la abreviatura IEC 80000-13 "o" para octetos puede confundirse con el sufijo "o" para indicar números octales en la convención Intel .

Referencias

  1. ^ abc Abramson, Norman (1963). Teoría de la información y codificación . McGraw-Hill .
  2. ^ Mackenzie, Charles E. (1980). Conjuntos de caracteres codificados, historia y desarrollo (PDF) . Serie de programación de sistemas (1.ª edición). Addison-Wesley Publishing Company, Inc. pág. xii. ISBN 978-0-201-14460-4. LCCN  77-90165. Archivado (PDF) del original el 26 de mayo de 2016. Consultado el 25 de agosto de 2019 .
  3. ^ ab Knuth, Donald Ervin . El arte de la programación informática: algoritmos seminuméricos . Vol. 2. Addison Wesley .
  4. ^ Shanmugam (2006). Sistemas informáticos digitales y analógicos .
  5. ^ Jaeger, Gregg (2007). Información cuántica: una visión general.
  6. ^ Kumar, I. Ravi (2001). Teoría estadística integral de la comunicación .
  7. ^ Nybble en dictionary reference.com; fuente: Jargon File 4.2.0, consultado el 12 de agosto de 2007
  8. ^ Beebe, Nelson HF (22 de agosto de 2017). "Capítulo I. Aritmética de números enteros". Manual de cálculo de funciones matemáticas: programación con la biblioteca de software portátil MathCW (1.ª edición). Salt Lake City, UT, EE. UU.: Springer International Publishing AG . pág. 970. doi :10.1007/978-3-319-64110-2. ISBN . 978-3-319-64109-6. Código LCCN  2017947446. S2CID  30244721.
  9. ^ La norma ISO /IEC es la ISO/IEC 80000-13 :2008. Esta norma anula y reemplaza las subcláusulas 3.8 y 3.9 de la IEC 60027-2:2005. El único cambio significativo es la adición de definiciones explícitas para algunas magnitudes. Catálogo en línea de ISO
  10. ^ "Diccionario de términos para tecnología de estado sólido – 7.ª edición". Asociación de tecnología de estado sólido JEDEC. Febrero de 2018. págs. 100, 118, 135. JESD88F . Consultado el 25 de junio de 2021 .
  11. ^ Maleval, Jean Jacques (12 de febrero de 2021). "Nimbus Data SSD certificadas para su uso con servidores Dell EMC PowerEdge". StorageNewsletter . Consultado el 30 de mayo de 2024 .
  12. ^ abc Horak, Ray (2007). Diccionario Webster de telecomunicaciones del Nuevo Mundo. John Wiley & Sons . pág. 402. ISBN 9-78047022571-4.
  13. ^ "Unibit".
  14. ^ ab Steinbuch, Karl W .; Wagner, Siegfried W., eds. (1967) [1962]. Escrito en Karlsruhe, Alemania. Taschenbuch der Nachrichtenverarbeitung (en alemán) (2 ed.). Berlín / Heidelberg / Nueva York: Springer-Verlag OHG . págs. 835–836. LCCN  67-21079. Título N° 1036.
  15. ^ ab Steinbuch, Karl W .; Weber, Wolfgang; Heinemann, Traute, eds. (1974) [1967]. Escrito en Karlsruhe / Bochum. Taschenbuch der Informatik - Band III - Anwendungen und spezielle Systeme der Nachrichtenverarbeitung (en alemán). vol. 3 (3 ed.). Berlín / Heidelberg / Nueva York: Springer Verlag . págs. 357–358. ISBN 3-540-06242-4. Número de LCCN  73-80607.
  16. ^ Bertram, H. Neal (1994). Teoría de la grabación magnética (1.ª ed.). Cambridge University Press . ISBN 0-521-44973-1. 9-780521-449731. […] La escritura de un impulso implicaría escribir un dibit o dos transiciones arbitrariamente cercanas entre sí. […]
  17. ^ Weisstein, Eric. W. "Crumb". MathWorld . Consultado el 2 de agosto de 2015 .
  18. ^ Control Data 8092 TeleProgrammer: Manual de referencia de programación (PDF) . Minneapolis, Minnesota, EE. UU.: Control Data Corporation . 1964. IDP 107a. Archivado (PDF) desde el original el 25 de mayo de 2020 . Consultado el 27 de julio de 2020 .
  19. ^ Knuth, Donald Ervin . El arte de la programación informática: algoritmos combinatorios , parte 1. Vol. 4a. Addison Wesley .
  20. ^ ab Svoboda, Antonín ; White, Donnamaie E. (2016) [2012, 1985, 1979-08-01]. Técnicas avanzadas de diseño de circuitos lógicos (PDF) (edición electrónica reimpresa y reescrita). Garland STPM Press (edición original) / WhitePubs Enterprises, Inc. (reedición). ISBN 0-8240-7014-3LCCN  78-31384. Archivado (PDF) del original el 14 de abril de 2017. Consultado el 15 de abril de 2017 .[1][2]
  21. ^ Pablo, Reinhold (2013). Elektrotechnik und Elektronik für Informatiker - Grundgebiete der Elektronik (en alemán). vol. 2. BG Teubner Stuttgart / Springer . ISBN 978-3-32296652-0. Recuperado el 3 de agosto de 2015 .
  22. ^ Böhme, Gert; Nacido, Werner; Wagner, B.; Schwarze, G. (2 de julio de 2013) [1969]. Reichenbach, Jürgen (ed.). Programmierung von Prozeßrechnern. Reihe Automatisierungstechnik (en alemán). vol. 79. VEB Verlag Technik  [de] Berlín, reimpresión: Springer Verlag . doi :10.1007/978-3-663-02721-8. ISBN 978-3-663-00808-8. 9/3/4185.
  23. ^ ab "Términos y abreviaturas / 4.1 Cruce de límites de página". Manual de programación en lenguaje ensamblador MCS-4 - Manual de programación del sistema de microcomputadoras INTELLEC 4 (PDF) (edición preliminar). Santa Clara, California, EE. UU.: Intel Corporation . Diciembre de 1973. págs. v, 2-6, 4-1. MCS-030-1273-1. Archivado (PDF) desde el original el 2020-03-01 . Consultado el 2020-03-02 . […] Bit : la unidad de información más pequeña que se puede representar. (Un bit puede estar en uno de dos estados: I 0 o 1). […] Byte : un grupo de 8 bits contiguos que ocupan una sola ubicación de memoria. […] Carácter : un grupo de 4 bits de datos contiguos. […] Los programas se almacenan en la ROM o en la RAM de programa, las cuales se dividen en páginas . Cada página consta de 256 ubicaciones de 8 bits. Las direcciones 0 a 255 comprenden la primera página, las 256 a 511 comprenden la segunda página, y así sucesivamente. […](NB. Este manual de Intel 4004 utiliza el término carácter para referirse a entidades de datos de 4 bits en lugar de 8 bits . Intel pasó a utilizar el término más común "nibble" para entidades de 4 bits en su documentación para el procesador siguiente, el 4040 , ya en 1974.)
  24. ^ abc Speiser, Ambrosius Paul (1965) [1961]. Digitale Rechenanlagen - Grundlagen / Schaltungstechnik / Arbeitsweise / Betriebssicherheit [ Computadoras digitales - Conceptos básicos / Circuitos / Operación / Confiabilidad ] (en alemán) (2 ed.). ETH Zürich , Zúrich, Suiza: Springer-Verlag / IBM . págs.6, 34, 165, 183, 208, 213, 215. LCCN  65-14624. 0978.
  25. ^ Steinbuch, Karl W. , ed. (1962). Escrito en Karlsruhe, Alemania. Taschenbuch der Nachrichtenverarbeitung (en alemán) (1 ed.). Berlín / Gotinga / Nueva York: Springer-Verlag OHG . pag. 1076. LCCN  62-14511.
  26. ^ Crispin, Mark R. (2005). RFC 4042: UTF-9 y UTF-18 .
  27. ^ Estándar IEEE para aritmética de punto flotante. 29 de agosto de 2008. págs. 1–70. doi :10.1109/IEEESTD.2008.4610935. ISBN 978-0-7381-5752-8. Recuperado el 10 de febrero de 2016 .
  28. ^ Müller, Jean-Michel; Brisebarre, Nicolás; de Dinechin, Florent; Jeannerod, Claude-Pierre; Lefèvre, Vicente; Melquiond, Guillaume; Revol, Nathalie ; Stehlé, Damián; Torres, Serge (2010). Manual de aritmética de coma flotante (1 ed.). Birkhäuser . doi :10.1007/978-0-8176-4705-6. ISBN 978-0-8176-4704-9. Número de serie LCCN  2009939668.
  29. ^ Erle, Mark A. (21 de noviembre de 2008). Algoritmos y diseños de hardware para la multiplicación decimal (tesis). Universidad de Lehigh (publicada en 2009). ISBN 978-1-10904228-3. 1109042280 . Consultado el 10 de febrero de 2016 .
  30. ^ Kneusel, Ronald T. (2015). Números y computadoras. Springer Verlag . ISBN 9783319172606. 3319172603 . Consultado el 10 de febrero de 2016 .
  31. ^ Zbiciak, Joe. "Documentación rápida y sencilla de AS1600" . Consultado el 28 de abril de 2013 .
  32. ^ "315 Sistema de procesamiento electrónico de datos" (PDF) . NCR . Noviembre de 1965. NCR MPN ST-5008-15. Archivado (PDF) desde el original el 24 de mayo de 2016 . Consultado el 28 de enero de 2015 .
  33. ^ Bardin, Hillel (1963). "NCR 315 Seminar" (PDF) . Comunicado sobre el uso de computadoras . 2 (3). Archivado (PDF) desde el original el 24 de mayo de 2016.
  34. ^ Schneider, Carl (2013) [1970]. Datenverarbeitungs-Lexikon [ Léxico de tecnología de la información ] (en alemán) (reimpresión de tapa blanda de tapa dura, 1ª ed.). Wiesbaden, Alemania: Springer Fachmedien Wiesbaden GmbH / Betriebswirtschaftlicher Verlag Dr. Th. Gabler GmbH . págs.201, 308. doi :10.1007/978-3-663-13618-7. ISBN 978-3-409-31831-0. Consultado el 24 de mayo de 2016 . […] losa , Abk. aus syllable  = Silbe, die kleinste adressierbare Informationseinheit für 12 bit zur Übertragung von dos Alphazeichen oder tres numerischen Zeichen. (NCR) […] Hardware: Datenstruktur: NCR 315-100 / NCR 315-RMC; Idioma del artículo: Silbe; Puntas: 12; Bytes: –; Dezimalziffern: 3; Tiempo: 2; Gleitkommadarstellung: fest verdrahtet; Mantisa: 4 Silben; Exponente: 1 Silbe (11 Stellen + 1 Vorzeichen) […] [ losa , abbr. para sílaba  = sílaba, unidad de información direccionable más pequeña para 12 bits para la transferencia de dos caracteres alfabéticos o tres caracteres numéricos. (NCR) […] Hardware: Estructura de datos: NCR 315-100  / NCR 315-RMC ; Longitud de palabra : Sílaba ; Bits : 12; Bytes : –; Dígitos decimales : 3; Caracteres: 2; Formato de punto flotante : cableado; Significando : 4 sílabas; Exponente : 1 sílaba (11 dígitos + 1 prefijo)]
  35. ^ abcd Estándar IEEE para una arquitectura de microprocesador de 32 bits. Instituto de Ingenieros Eléctricos y Electrónicos, Inc. 1995. págs. 5-7. doi :10.1109/IEEESTD.1995.79519. ISBN 1-55937-428-4. Recuperado el 10 de febrero de 2016 .(NB. El estándar define dobletes, cuatriciclos, octetos y hextetos como 2, 4, 8 y 16 bytes , dando los números de bits (16, 32, 64 y 128) solo como un significado secundario. Esto puede ser importante dado que históricamente los bytes no siempre se entendieron como 8 bits ( octetos ).)
  36. ^ abc Knuth, Donald Ervin (15 de febrero de 2004) [1999]. Fascículo 1: MMIX (PDF) (0.ª impresión, 15.ª ed.). Stanford University : Addison-Wesley . Archivado (PDF) desde el original el 30 de marzo de 2017 . Consultado el 30 de marzo de 2017 .
  37. ^ de Raymond, Eric S. (1996). El nuevo diccionario del hacker (3.ª edición). MIT Press. pág. 333. ISBN 0262680920.
  38. ^ Böszörményi, László; Hölzl, Günther; Pirker, Emaneul (febrero de 1999). Escrito en Salzburgo, Austria. Zinterhof, Peter; Vajteršic, Marian; Uhl, Andreas (eds.). Computación en clúster paralelo con IEEE1394–1995 . Computación paralela: 4.ª conferencia internacional ACPC que incluye temas especiales sobre numérica paralela (ParNum '99) y computación paralela en procesamiento de imágenes, procesamiento de vídeo y multimedia. Actas: Notas de clase en informática 1557. Berlín, Alemania: Springer Verlag .
  39. ^ Nicoud, Jean-Daniel (1986). Calculatrices (en francés). vol. 14 (2 ed.). Lausana: Prensas politécnicas romandes. ISBN 2-88074054-1.
  40. ^ Actas del Simposio sobre experiencias con sistemas distribuidos y multiprocesadores (SEDMS). Vol. 4. Asociación USENIX . 1993.
  41. ^ ab "1. Introducción: Alineación de segmentos". Utilidades de la familia 8086: Guía del usuario para sistemas de desarrollo basados ​​en 8080/8085 (PDF) . Revisión E (A620/5821 6K DD ed.). Santa Clara, California, EE. UU.: Intel Corporation . Mayo de 1982 [1980, 1978]. pág. 1-6. Número de pedido: 9800639-04. Archivado (PDF) desde el original el 29 de febrero de 2020 . Consultado el 29 de febrero de 2020 .
  42. ^ Dewar, Robert Berriedale Keith ; Smosna, Matthew (1990). Microprocesadores: la visión de un programador (1.ª ed.). Courant Institute , New York University , Nueva York, EE. UU.: McGraw-Hill Publishing Company . pág. 85. ISBN 0-07-016638-2. Número de LCCN  89-77320.(xviii+462 páginas)
  43. ^ Brousentsov, NP; Maslov, SP; Ramil Alvarez, J.; Zhogolev, EA "Desarrollo de computadoras ternarias en la Universidad Estatal de Moscú" . Consultado el 20 de enero de 2010 .
  44. ^ Estados Unidos 4319227, Malinowski, Christopher W.; Rinderle, Heinz & Siegle, Martin, "Sistema de señalización de tres estados", publicado el 9 de marzo de 1982, asignado a AEG-Telefunken 
  45. ^ "US4319227". Google .
  46. ^ "US4319227" (PDF) . Imágenes de patentes .

Enlaces externos