La explosión de información es el rápido aumento de la cantidad de información o datos publicados y los efectos de esta abundancia. [1] A medida que crece la cantidad de datos disponibles, el problema de gestionar la información se vuelve más difícil, lo que puede conducir a una sobrecarga de información . El Oxford English Dictionary en línea indica el uso de la frase en un artículo del New Statesman de marzo de 1964 . [2] El New York Times utilizó por primera vez la frase en su contenido editorial en un artículo de Walter Sullivan del 7 de junio de 1964, en el que describió la frase como "muy discutida". (p11.) [3] El primer uso conocido de la frase fue en un discurso sobre televisión pronunciado por el presidente de NBC, Pat Weaver, en el Institute of Practitioners of Advertising de Londres el 27 de septiembre de 1955. El discurso fue retransmitido por la estación de radio WSUI en Iowa. y extraído del periódico Daily Iowan dos meses después. [4]
Muchos sectores están viendo este rápido aumento en la cantidad de información disponible, como la atención médica, los supermercados y los gobiernos. [5] Otro sector que se está viendo afectado por este fenómeno es el periodismo. Esta profesión, que en el pasado era responsable de la difusión de información, hoy puede verse suprimida por la sobreabundancia de información. [6]
Desde la década de 1970 existen técnicas para recopilar conocimientos a partir de una sobreabundancia de información electrónica (por ejemplo, la fusión de datos puede ayudar en la extracción de datos ). Otra técnica habitual para abordar tal cantidad de información es la investigación cualitativa . [7] Estos enfoques tienen como objetivo organizar la información, sintetizarla, categorizarla y sistematizarla para que sea más utilizable y fácil de buscar.
Una nueva métrica que se está utilizando en un intento de caracterizar el crecimiento de la información específica de una persona es el almacenamiento en disco por persona (DSP), que se mide en megabytes/persona (donde megabytes son 10,6 bytes y se abrevia como MB). DSP global (GDSP) es el espacio total en unidad de disco rígido (en MB) de unidades nuevas vendidas en un año dividido por la población mundial de ese año. La métrica GDSP es una medida burda de cuánto almacenamiento en disco podría usarse para recopilar datos específicos de cada persona sobre la población mundial. [5] En 1983, se vendieron en todo el mundo un millón de unidades fijas con un total estimado de 90 terabytes ; Las unidades de 30 MB tenían el segmento de mercado más grande. [9] En 1996, se vendieron 105 millones de unidades, por un total de 160.623 terabytes, siendo las unidades de 1 y 2 gigabytes las que lideraban la industria. [10] Para el año 2000, con las unidades de 20 GB liderando la industria, se proyecta que las unidades rígidas vendidas durante el año alcanzarán un total de 2.829.288 terabytes. Las ventas de unidades de disco rígido alcanzarán los 34 mil millones de dólares en 1997.
Según Latanya Sweeney , hoy en día existen tres tendencias en la recopilación de datos:
Tipo 1. Ampliación del número de campos que se recopilan, conocida como tendencia de “recopilar más”.
Tipo 2. Reemplazar una recopilación de datos agregados existente por una específica de una persona, conocida como tendencia de “recopilar específicamente”.
Tipo 3. Reúna información iniciando una nueva recopilación de datos específicos de una persona, conocida como tendencia "recójala si puedes". [5]
Dado que "información" en los medios electrónicos se utiliza a menudo como sinónimo de "datos", el término explosión de información está estrechamente relacionado con el concepto de inundación de datos (también denominado diluvio de datos ). A veces también se utiliza el término inundación de información . Básicamente, todo esto se reduce a la cantidad cada vez mayor de datos electrónicos intercambiados por unidad de tiempo. La conciencia sobre las cantidades de datos no manejables creció junto con la llegada de un procesamiento de datos cada vez más potente desde mediados de los años 1960. [11]
Aunque la abundancia de información puede ser beneficiosa en varios niveles, algunos problemas pueden ser motivo de preocupación, como la privacidad , las pautas legales y éticas, el filtrado y la precisión de los datos. [12] El filtrado se refiere a encontrar información útil en medio de tantos datos, lo que se relaciona con el trabajo de los científicos de datos. Un ejemplo típico de necesidad de filtrado de datos ( minería de datos ) es el sector sanitario, ya que en los próximos años se dispondrá de EHR ( Historias Clínicas Electrónicas ) de los pacientes. Con tanta información disponible, los médicos deberán poder identificar patrones y seleccionar datos importantes para el diagnóstico del paciente. [12] Por otro lado, según algunos expertos, tener tantos datos públicos disponibles dificulta proporcionar datos que sean realmente anónimos. [5] Otro punto a tener en cuenta son los lineamientos legales y éticos, que se refieren a quién será el propietario de los datos y con qué frecuencia está obligado a divulgarlos y por cuánto tiempo. [12] Con tantas fuentes de datos, otro problema será la precisión de los mismos. Una fuente que no es de confianza puede ser cuestionada por otras, ordenando un nuevo conjunto de datos, provocando una repetición en la información. [12] Según Edward Huth, otra preocupación es la accesibilidad y el costo de dicha información. [13] La tasa de accesibilidad podría mejorarse reduciendo los costos o aumentando la utilidad de la información. La reducción de costes, según el autor, podría ser realizada por las asociaciones, que deberían evaluar qué información es relevante y recopilarla de forma más organizada.
En agosto de 2005, había más de 70 millones de servidores web . [14] En septiembre de 2007 [actualizar]había más de 135 millones de servidores web. [15]
Según Technorati , el número de blogs se duplica cada seis meses, con un total de 35,3 millones de blogs en abril de 2006 [árbitro]. [16] Este es un ejemplo de las primeras etapas del crecimiento logístico , donde el crecimiento es aproximadamente exponencial , ya que los blogs son una innovación reciente. A medida que el número de blogs se acerca al número de posibles productores (humanos), se produce la saturación, el crecimiento disminuye y el número de blogs finalmente se estabiliza.
Creo que en los últimos años hemos puesto en marcha una explosión de información.
Cada hombre recibe más información de la que puede manejar actualmente, pero está aprendiendo a manejarla y, a medida que aprende, le hará bien.