stringtranslate.com

Unidades de información

En informática y telecomunicaciones digitales , una unidad de información es la capacidad de algún sistema de almacenamiento de datos estándar o canal de comunicación , utilizado para medir las capacidades de otros sistemas y canales. En teoría de la información , las unidades de información también se utilizan para medir la información contenida en los mensajes y la entropía de variables aleatorias.

Las unidades de capacidad de almacenamiento de datos más utilizadas son el bit , la capacidad de un sistema que tiene sólo dos estados, y el byte (u octeto ), que equivale a ocho bits. Se pueden formar múltiplos de estas unidades a partir de éstas con los prefijos SI (prefijos de potencia de diez) o los prefijos binarios IEC más nuevos (prefijos de potencia de dos).

Unidades primarias

Comparación de unidades de información: bit , trit , nat , ban . La cantidad de información es la altura de las barras. El nivel verde oscuro es la unidad "nat".

En 1928, Ralph Hartley observó un principio fundamental de almacenamiento, [1] que fue formalizado aún más por Claude Shannon en 1945: la información que se puede almacenar en un sistema es proporcional al logaritmo de N posibles estados de ese sistema, denotado log b N . Cambiar la base del logaritmo de b a un número diferente c tiene el efecto de multiplicar el valor del logaritmo por una constante fija, es decir, log c N = (log c b ) log b N . Por tanto, la elección de la base b determina la unidad utilizada para medir la información. En particular, si b es un número entero positivo , entonces la unidad es la cantidad de información que se puede almacenar en un sistema con b estados posibles.

Cuando b es 2, la unidad es el shannon , igual al contenido de información de un "bit" (un acrónimo de dígito binario [2] ). Un sistema con 8 estados posibles, por ejemplo, puede almacenar hasta log 2 8 = 3 bits de información. Otras unidades que han sido nombradas incluyen:

Base b  = 3
la unidad se llama " trit ", y es igual a log 2 3 (≈ 1,585) bits. [3]
Base b  = 10
la unidad se llama dígito decimal , hartley , ban , decit o dit , y es igual a log 2  10 (≈ 3,322) bits. [1] [4] [5] [6]
Base b  =  e , la base de los logaritmos naturales
la unidad se llama nat , nit o nepit (del neperiano ) y vale log 2 e (≈ 1,443) bits. [1]

Los términos trit, ban y nat rara vez se utilizan para medir la capacidad de almacenamiento; pero el nat, en particular, se utiliza a menudo en teoría de la información, porque los logaritmos naturales son matemáticamente más convenientes que los logaritmos en otras bases.

Unidades derivadas del bit

Se utilizan varios nombres convencionales para colecciones o grupos de bits.

Byte

Históricamente, un byte era la cantidad de bits utilizados para codificar un carácter de texto en la computadora, lo que dependía de la arquitectura del hardware de la computadora; pero hoy en día casi siempre significa ocho bits, es decir, un octeto . Un byte puede representar 256 (2 8 ) valores distintos, como enteros no negativos de 0 a 255 o enteros con signo de −128 a 127. El estándar IEEE 1541-2002 especifica "B" (mayúscula) como símbolo de byte ( IEC 80000-13 usa "o" para octeto en francés, [nb 1] pero también permite "B" en inglés, que es lo que realmente se usa). Los bytes, o múltiplos de ellos, casi siempre se utilizan para especificar el tamaño de los archivos informáticos y la capacidad de las unidades de almacenamiento. La mayoría de las computadoras y dispositivos periféricos modernos están diseñados para manipular datos en bytes completos o grupos de bytes, en lugar de bits individuales.

Picar

Un grupo de cuatro bits, o medio byte, a veces se denomina nibble , nybble o nyble. Esta unidad se utiliza con mayor frecuencia en el contexto de representaciones de números hexadecimales , ya que un mordisco tiene la misma cantidad de información que un dígito hexadecimal. [7]

Miga

Un grupo de dos bits o un cuarto de byte se llamaba migaja, [8] y se usaba a menudo en las primeras computadoras de 8 bits (ver Atari 2600 , ZX Spectrum ). [ cita necesaria ] Ahora está en gran parte desaparecido.

Palabra, bloque y página

Las computadoras suelen manipular bits en grupos de un tamaño fijo, llamados convencionalmente palabras . La cantidad de bits en una palabra generalmente se define por el tamaño de los registros en la CPU de la computadora , o por la cantidad de bits de datos que se recuperan de su memoria principal en una sola operación. En la arquitectura IA-32 más comúnmente conocida como x86-32, una palabra tiene 32 bits, pero otras arquitecturas pasadas y actuales usan palabras con 4, 8, 9, 12, 13, 16, 18, 20, 21, 22, 24. , 25, 29, 30, 31, 32, 33, 35, 36, 38, 39, 40, 42, 44, 48, 50, 52, 54, 56, 60, 64, 72 [9] bits u otros .

Algunas instrucciones de máquina y formatos de números de computadora utilizan dos palabras (una "palabra doble" o "dword") o cuatro palabras (una "palabra cuádruple" o "cuádruple").

Los cachés de memoria de las computadoras generalmente operan en bloques de memoria que constan de varias palabras consecutivas. Estas unidades se denominan habitualmente bloques de caché o, en cachés de CPU , líneas de caché .

Los sistemas de memoria virtual dividen el almacenamiento principal de la computadora en unidades aún más grandes, tradicionalmente llamadas páginas .

Múltiplos sistemáticos

Los términos para grandes cantidades de bits se pueden formar usando el rango estándar de prefijos SI para potencias de 10, por ejemplo, kilo  = 10 3  = 1000 (como en kilobit o kbit), mega  = 10 6  = 1 000 000 (como en megabit o Mbit) y giga  = 10 9 = 1 000 000 000 (como en gigabit o Gbit). Estos prefijos se utilizan con mayor frecuencia para múltiplos de bytes, como en kilobyte (1 kB = 8000 bits), megabyte (1 MB = 8 000 000 bits ) y gigabyte (1 GB = 8 000 000 000 bits ).

Sin embargo, por razones técnicas, las capacidades de las memorias de las computadoras y de algunas unidades de almacenamiento suelen ser múltiplos de una potencia grande de dos, como por ejemplo 2 28  = 268 435 456 bytes. Para evitar números tan difíciles de manejar, la gente a menudo ha reutilizado los prefijos SI para que signifiquen la potencia de dos más cercana, por ejemplo, usando el prefijo kilo para 2 10  = 1024, mega para 2 20  = 1 048 576 y giga para 2 30  = 1 073. 741 824 , y así sucesivamente. Por ejemplo, un chip de memoria de acceso aleatorio con una capacidad de 228 bytes se denominaría chip de 256 megabytes. La siguiente tabla ilustra estas diferencias.

En el pasado, se usaba la K mayúscula en lugar de la k minúscula para indicar 1024 en lugar de 1000. Sin embargo, este uso nunca se aplicó de manera consistente.

Por otro lado, para los sistemas de almacenamiento externo (como los discos ópticos ), se suelen utilizar los prefijos SI con sus valores decimales (potencias de 10). Muchos intentos han buscado resolver la confusión proporcionando notaciones alternativas para múltiplos de potencia de dos. En 1998, la Comisión Electrotécnica Internacional (IEC) emitió un estándar para este propósito definiendo una serie de prefijos binarios que utilizan 1024 en lugar de 1000 como base principal: [10]

El estándar de memoria JEDEC JESD88F señala que las definiciones de kilo (K), giga (G) y mega (M) basadas en potencias de dos se incluyen solo para reflejar el uso común, pero por lo demás están en desuso. [11]

Ejemplos de tamaño

Unidades obsoletas e inusuales

Se han nombrado varias otras unidades de almacenamiento de información:

Algunos de estos nombres son jerga , están obsoletos o se usan sólo en contextos muy restringidos.

Ver también

Notas

  1. ^ Sin embargo, la abreviatura "o" de IEC 80000-13 para octetos se puede confundir con el sufijo "o" para indicar números octales en la convención de Intel .

Referencias

  1. ^ a b C Abramson, Norman (1963). Teoría de la información y codificación . McGraw-Hill .
  2. ^ Mackenzie, Charles E. (1980). Conjuntos de caracteres codificados, historia y desarrollo (1 ed.). Addison-Wesley Publishing Company, Inc. pág. xii. ISBN 0-201-14460-3. LCCN  77-90165 . Consultado el 22 de mayo de 2016 .[1]
  3. ^ ab Knuth, Donald Ervin . El arte de la programación informática: algoritmos seminuméricos . vol. 2. Addison Wesley .
  4. ^ Shanmugam (2006). Sistemas informáticos digitales y analógicos .
  5. ^ Jaeger, Gregg (2007). Información cuántica: una descripción general.
  6. ^ Kumar, I. Ravi (2001). Teoría Estadística Integral de la Comunicación .
  7. ^ Nybble en diccionario reference.com; procedente de Jargon File 4.2.0, consultado el 12 de agosto de 2007
  8. ^ ab Weisstein, Eric. W. "Migaja". MundoMatemático . Consultado el 2 de agosto de 2015 .
  9. ^ Beebe, Nelson HF (22 de agosto de 2017). "Capítulo I. Aritmética de números enteros". Manual de computación de funciones matemáticas: programación utilizando la biblioteca de software portátil MathCW (1 ed.). Salt Lake City, UT, EE. UU.: Springer International Publishing AG . pag. 970. doi :10.1007/978-3-319-64110-2. ISBN 978-3-319-64109-6. LCCN  2017947446. S2CID  30244721.
  10. ^ El estándar ISO /IEC es ISO/IEC 80000 -13:2008. Esta norma anula y reemplaza las subcláusulas 3.8 y 3.9 de IEC 60027-2:2005. El único cambio significativo es la adición de definiciones explícitas para algunas cantidades. Catálogo en línea ISO
  11. ^ Asociación de Tecnología de Estado Sólido JEDEC (febrero de 2018). "Diccionario de términos para tecnología de estado sólido - 7ª edición". JESD88F . Consultado el 25 de junio de 2021 .
  12. ^ abc Horak, Ray (2007). Diccionario Webster del Nuevo Mundo de Telecomunicaciones. John Wiley e hijos . pag. 402.ISBN _ 9-78047022571-4.
  13. ^ "Unibit".
  14. ^ ab Steinbuch, Karl W .; Wagner, Siegfried W., eds. (1967) [1962]. Escrito en Karlsruhe, Alemania. Taschenbuch der Nachrichtenverarbeitung (en alemán) (2 ed.). Berlín / Heidelberg / Nueva York: Springer-Verlag OHG . págs. 835–836. LCCN  67-21079. Título N° 1036.
  15. ^ ab Steinbuch, Karl W .; Weber, Wolfgang; Heinemann, Traute, eds. (1974) [1967]. Escrito en Karlsruhe / Bochum. Taschenbuch der Informatik - Band III - Anwendungen und spezielle Systeme der Nachrichtenverarbeitung (en alemán). vol. 3 (3 ed.). Berlín / Heidelberg / Nueva York: Springer Verlag . págs. 357–358. ISBN 3-540-06242-4. LCCN  73-80607.
  16. ^ Bertram, H.Neal (1994). Teoría de la grabación magnética (1 ed.). Prensa de la Universidad de Cambridge . ISBN 0-521-44973-1. 9-780521-449731. […] La escritura de un impulso implicaría escribir un dibit o dos transiciones arbitrariamente juntas. […]
  17. ^ Teleprogramador de datos de control 8092: manual de referencia de programación (PDF) . Minneapolis, Minnesota, EE. UU.: Control Data Corporation . 1964. Desplazados internos 107a. Archivado (PDF) desde el original el 25 de mayo de 2020 . Consultado el 27 de julio de 2020 .
  18. ^ Knuth, Donald Ervin . El arte de la programación informática: algoritmos combinatorios, parte 1 . vol. 4a. Addison Wesley .
  19. ^ ab Svoboda, Antonín ; Blanco, Donnamaie E. (2016) [2012, 1985, 1979-08-01]. Técnicas avanzadas de diseño de circuitos lógicos (PDF) (edición electrónica reescrito). Garland STPM Press (edición original) / WhitePubs Enterprises, Inc. (reedición). ISBN 0-8240-7014-3. LCCN  78-31384. Archivado (PDF) desde el original el 14 de abril de 2017 . Consultado el 15 de abril de 2017 .[2][3]
  20. ^ Pablo, Reinhold (2013). Elektrotechnik und Elektronik für Informatiker - Grundgebiete der Elektronik (en alemán). vol. 2. BG Teubner Stuttgart / Springer . ISBN 978-3-32296652-0. Consultado el 3 de agosto de 2015 .
  21. ^ Böhme, Gert; Nacido, Werner; Wagner, B.; Schwarze, G. (2 de julio de 2013) [1969]. Reichenbach, Jürgen (ed.). Programmierung von Prozeßrechnern. Reihe Automatisierungstechnik (en alemán). vol. 79. VEB Verlag Technik  [de] Berlín, reimpresión: Springer Verlag . doi :10.1007/978-3-663-02721-8. ISBN 978-3-663-00808-8. 3/9/4185.
  22. ^ ab "Términos y abreviaturas / 4.1 Cruzar los límites de las páginas". Manual de programación en lenguaje ensamblador MCS-4: manual de programación del sistema de microcomputadora INTELLEC 4 (PDF) (edición preliminar). Santa Clara, California, Estados Unidos: Intel Corporation . Diciembre de 1973. págs. V, 2-6, 4-1. MCS-030-1273-1. Archivado (PDF) desde el original el 1 de marzo de 2020 . Consultado el 2 de marzo de 2020 . […] Bit : la unidad de información más pequeña que se puede representar. (Un bit puede estar en uno de dos estados: 0 o 1). […] Byte : grupo de 8 bits contiguos que ocupan una única ubicación de memoria. […] Carácter : un grupo de 4 bits de datos contiguos. […] los programas se guardan en la ROM o en la RAM del programa, y ​​ambos están divididos en páginas . Cada página consta de 256 ubicaciones de 8 bits. Las direcciones 0 a 255 comprenden la primera página, 256-511 comprenden la segunda página, y así sucesivamente. […](NB. Este manual de Intel 4004 utiliza el término carácter que se refiere a entidades de datos de 4 bits en lugar de 8 bits . Intel cambió a usar el término más común nibble para entidades de 4 bits en su documentación para el siguiente procesador 4040 ya en 1974. )
  23. ^ abc Speiser, Ambrosius Paul (1965) [1961]. Digitale Rechenanlagen - Grundlagen / Schaltungstechnik / Arbeitsweise / Betriebssicherheit [ Computadoras digitales - Conceptos básicos / Circuitos / Operación / Confiabilidad ] (en alemán) (2 ed.). ETH Zürich , Zúrich, Suiza: Springer-Verlag / IBM . págs.6, 34, 165, 183, 208, 213, 215. LCCN  65-14624. 0978.
  24. ^ Steinbuch, Karl W. , ed. (1962). Escrito en Karlsruhe, Alemania. Taschenbuch der Nachrichtenverarbeitung (en alemán) (1 ed.). Berlín / Gotinga / Nueva York: Springer-Verlag OHG . pag. 1076. LCCN  62-14511.
  25. ^ Crispin, Mark R. (2005). RFC 4042: UTF-9 y UTF-18 .
  26. ^ Estándar IEEE para aritmética de punto flotante. 2008-08-29. págs. 1–70. doi :10.1109/IEEESTD.2008.4610935. ISBN 978-0-7381-5752-8. Consultado el 10 de febrero de 2016 .
  27. ^ Müller, Jean-Michel; Brisebarre, Nicolás; de Dinechin, Florent; Jeannerod, Claude-Pierre; Lefèvre, Vicente; Melquiond, Guillaume; Revol, Nathalie ; Stehlé, Damián; Torres, Serge (2010). Manual de aritmética de coma flotante (1 ed.). Birkhäuser . doi :10.1007/978-0-8176-4705-6. ISBN 978-0-8176-4704-9. LCCN  2009939668.
  28. ^ Erle, Mark A. (21 de noviembre de 2008). Algoritmos y diseños de hardware para multiplicación decimal (Tesis). Universidad de Lehigh (publicado en 2009). ISBN 978-1-10904228-3. 1109042280 . Consultado el 10 de febrero de 2016 .
  29. ^ Kneusel, Ronald T. (2015). Números y Computadoras. Springer Verlag . ISBN 9783319172606. 3319172603 . Consultado el 10 de febrero de 2016 .
  30. ^ Zbiciak, Joe. "Documentación rápida y sucia de AS1600" . Consultado el 28 de abril de 2013 .
  31. ^ "Sistema de procesamiento electrónico de datos 315" (PDF) . NCR . Noviembre de 1965. NCR MPN ST-5008-15. Archivado (PDF) desde el original el 24 de mayo de 2016 . Consultado el 28 de enero de 2015 .
  32. ^ Bardin, Hillel (1963). «Seminario NCR 315» (PDF) . Comunicado sobre el uso de la computadora . 2 (3). Archivado (PDF) desde el original el 24 de mayo de 2016.
  33. ^ Schneider, Carl (2013) [1970]. Datenverarbeitungs-Lexikon [ Léxico de tecnología de la información ] (en alemán) (reimpresión de tapa blanda de tapa dura, 1ª ed.). Wiesbaden, Alemania: Springer Fachmedien Wiesbaden GmbH / Betriebswirtschaftlicher Verlag Dr. Th. Gabler GmbH . págs.201, 308. doi :10.1007/978-3-663-13618-7. ISBN 978-3-409-31831-0. Consultado el 24 de mayo de 2016 . […] losa , Abk. aus syllable  = Silbe, die kleinste adressierbare Informationseinheit für 12 bit zur Übertragung von dos Alphazeichen oder tres numerischen Zeichen. (NCR) […] Hardware: Datenstruktur: NCR 315-100 / NCR 315-RMC; Idioma del artículo: Silbe; Puntas: 12; Bytes: –; Dezimalziffern: 3; Tiempo: 2; Gleitkommadarstellung: fest verdrahtet; Mantisa: 4 Silben; Exponente: 1 Silbe (11 Stellen + 1 Vorzeichen) […] [ losa , abbr. para sílaba  = sílaba, unidad de información direccionable más pequeña de 12 bits para la transferencia de dos caracteres alfabéticos o tres caracteres numéricos. (NCR) […] Hardware: Estructura de datos: NCR 315-100  / NCR 315-RMC ; Longitud de la palabra : Sílaba ; Puntas : 12; Bytes : –; Dígitos decimales : 3; Personajes: 2; Formato de coma flotante : cableado; Significativo : 4 sílabas; Exponente : 1 sílaba (11 dígitos + 1 prefijo)]
  34. ^ Estándar abcd IEEE para una arquitectura de microprocesador de 32 bits. Instituto de Ingenieros Eléctricos y Electrónicos, Inc. 1995. págs. 5–7. doi :10.1109/IEEESTD.1995.79519. ISBN 1-55937-428-4. Consultado el 10 de febrero de 2016 .(NB. El estándar define dobletes, cuartetos, octlets y hexlets como 2, 4, 8 y 16 bytes , dando los números de bits (16, 32, 64 y 128) sólo como un significado secundario. Esto podría ser importante dado que los bytes Históricamente no siempre se entendió que significaban 8 bits ( octetos ).)
  35. ^ abc Knuth, Donald Ervin (15 de febrero de 2004) [1999]. Fascículo 1: MMIX (PDF) (0.ª impresión, 15.ª ed.). Universidad de Stanford : Addison-Wesley . Archivado (PDF) desde el original el 30 de marzo de 2017 . Consultado el 30 de marzo de 2017 .
  36. ^ ab Raymond, Eric S. (1996). El diccionario del nuevo hacker (3 ed.). Prensa del MIT. pag. 333.ISBN _ 0262680920.
  37. ^ Böszörményi, László; Hölzl, Günther; Pirker, Emaneul (febrero de 1999). Escrito en Salzburgo, Austria. Zinterhof, Peter; Vajteršic, Marian; Uhl, Andreas (eds.). Computación en clústeres paralelos con IEEE1394–1995 . Computación paralela: 4ta Conferencia Internacional ACPC que incluye temas especiales sobre números paralelos (ParNum '99) y computación paralela en procesamiento de imágenes, procesamiento de video y multimedia. Actas: Apuntes de conferencias sobre informática 1557 . Berlín, Alemania: Springer Verlag .
  38. ^ Nicoud, Jean-Daniel (1986). Calculatrices (en francés). vol. 14 (2 ed.). Lausana: Prensas politécnicas romandes. ISBN 2-88074054-1.
  39. ^ Actas . Simposio de Experiencias con Sistemas Distribuidos y Multiprocesadores (SEDMS). vol. 4. Asociación USENIX . 1993.
  40. ^ ab "1. Introducción: alineación de segmentos". 8086 Family Utilities: guía del usuario para sistemas de desarrollo basados ​​en 8080/8085 (PDF) . Revisión E (A620/5821 6K DD ed.). Santa Clara, California, Estados Unidos: Intel Corporation . Mayo de 1982 [1980, 1978]. pag. 1-6. Número de pedido: 9800639-04. Archivado (PDF) desde el original el 29 de febrero de 2020 . Consultado el 29 de febrero de 2020 .
  41. ^ Dewar, Robert Berriedale Keith ; Smosna, Mateo (1990). Microprocesadores: la visión de un programador (1 ed.). Instituto Courant , Universidad de Nueva York , Nueva York, Estados Unidos: McGraw-Hill Publishing Company . pag. 85.ISBN _ 0-07-016638-2. LCCN  89-77320.(xviii+462 páginas)
  42. ^ Brousentsov, NP; Maslov, SP; Ramil Álvarez, J.; Zhogolev, EA "Desarrollo de ordenadores ternarios en la Universidad Estatal de Moscú" . Consultado el 20 de enero de 2010 .
  43. ^ Estados Unidos 4319227, Malinowski, Christopher W.; Rinderle, Heinz & Siegle, Martin, "Sistema de señalización de tres estados", publicado el 9 de marzo de 1982, asignado a AEG-Telefunken 
  44. ^ "US4319227". Google .
  45. ^ "US4319227" (PDF) . Imágenes de patentes .

enlaces externos