La minería de la realidad es la recopilación y el análisis de datos ambientales captados por máquinas relacionados con el comportamiento social humano , con el objetivo de identificar patrones predecibles de comportamiento. En 2008, MIT Technology Review la calificó como una de las "10 tecnologías con más probabilidades de cambiar la forma en que vivimos". [1]
La minería de la realidad estudia las interacciones humanas basándose en el uso de dispositivos inalámbricos como teléfonos móviles y sistemas GPS, lo que proporciona una imagen más precisa de lo que hacen las personas, adónde van y con quién se comunican, en lugar de hacerlo a partir de fuentes más subjetivas como el propio relato de una persona. La minería de la realidad es un aspecto del análisis de la huella digital . [2]
La minería de datos utiliza el Big Data para realizar investigaciones y analizar cómo las personas interactúan con la tecnología todos los días para crear sistemas que permitan un cambio positivo desde el individuo hasta la comunidad global. La minería de datos también se ocupa del agotamiento de datos .
Las personas utilizan teléfonos móviles, tabletas, ordenadores portátiles, cámaras y cualquier dispositivo conectado a Internet para diversos fines, creando así una variedad de datos, desde ubicaciones GPS hasta preguntas frecuentes en Google. Los teléfonos móviles contienen tanta información sobre el individuo que ahora pueden sugerir restaurantes en función de nuestras búsquedas, lugares visitados, preferencias de libros e incluso adivinar el final de las frases que escribimos. Una aplicación sencilla de Reality Mining es escuchar voces y comprender patrones de habla para diagnosticar problemas médicos, como una simple gripe o incluso la aparición temprana de Parkinson. Los teléfonos más potentes también permiten la personalización del calendario y el seguimiento de eventos que muestran comportamientos dentro de los individuos, lo que se considera lo suficientemente importante como para rastrearlo. Los sitios web sociales también permiten a los investigadores ver instantáneas de la vida de una persona siguiendo las actualizaciones de estado en Facebook o los tweets de Twitter. Aún más específico, una aplicación reciente llamada Snapchat permite a los usuarios publicar videos, imágenes o incluso transmisiones en vivo de exactamente lo que están haciendo cuando lo están haciendo, fuertes indicadores de comportamientos e interacciones con el mundo. En 2004, el MIT llevó a cabo el proyecto Reality Mining, en el que se entregó a 100 estudiantes del MIT un Nokia 6600, que los investigadores rastrearon de diversas formas: el número de identificación de la torre de telefonía móvil (una forma muy barata y discreta de medir la ubicación), el estado del teléfono (cargando o inactivo) y cualquier uso de las aplicaciones del teléfono (juegos, navegación web, etc.). Descubrieron que al recopilar este tipo de datos, podían predecir con gran precisión el comportamiento de los estudiantes; por ejemplo, si uno de ellos se despertaba un sábado por la mañana a las 10 de la mañana, los investigadores podían predecir lo que iba a hacer ese día utilizando "comportamientos propios". Esta nueva forma de entender los datos abrió las puertas a nuevas investigaciones y, posiblemente, a investigaciones de encuestas más amplias con estadísticas detalladas y precisas. Hay cientos de sitios web que ofrecen software para teléfonos móviles que rastrearán prácticamente todo lo que hace el teléfono, lo que resulta útil para padres preocupados o personas que desean aumentar su productividad personal. Estos datos se cargan luego en un servidor y se puede acceder a ellos en cualquier momento.
Aunque ya se pueden recopilar muchos datos de los dispositivos personales, estos solo forman una parte de la vida de una persona. Los mineros de la realidad también pueden usar dispositivos biométricos para medir la salud y la actividad física. Hay muchos dispositivos de este tipo, como Fitbit, Nike+ y los relojes GPS Polar y Garmin. Incluso hay una aplicación llamada Sleep Cycle para usuarios de iPhone y Android que mide la calidad del sueño, que incluye la cantidad de sueño e incluso la configuración óptima de las alarmas. Con estos datos, los mineros de la realidad pueden medir la salud real de una persona y los procesos que nos permiten funcionar (o disfuncionar). Los ataques cardíacos generalmente no tienen indicadores longitudinales, pero el uso de todos estos datos o incluso cuando una persona participa en Lifelogging puede crear datos útiles para el campo médico y rastrear los estilos de vida de quienes sufren ataques cardíacos para luego crear pautas preventivas. Hay varias formas de comenzar a Lifelogging, por ejemplo, Google tiene su propio dispositivo llamado Google Glass que tiene un Heads-Up-Display (HUD), un micrófono, un procesador y una cámara. Todas estas son formas de registrar información en directorios específicos.
La forma en que los investigadores han comenzado a observar y registrar comportamientos en grupos grandes fue mediante el uso de credenciales RFID . Los datos también se registran en los lugares de trabajo mediante sistemas de gestión del conocimiento que intentan mejorar la productividad y la eficiencia de los trabajadores, aunque una deficiencia de esto es la incapacidad de converger las culturas sociales y tecnológicas del lugar de trabajo, lo que proporciona datos de comportamiento incompletos. Otra forma de medir grupos más grandes de personas en una comunidad es a través de la asistencia a conferencias. Estos datos permiten a los investigadores saber de dónde son los participantes, la demografía étnica y el número real de personas que asisten al evento. Algunas conferencias utilizan credenciales inteligentes con más funciones que las credenciales RFID estándar. Empresas como Microsoft e IBM las han utilizado para registrar el número de personas con las que interactúan durante la conferencia y permiten que las personas respondan preguntas de la encuesta. Las credenciales inteligentes también registran interacciones vocales y cuándo los asistentes están en ciertos stands e incluso pueden alertar a los trabajadores del stand cuando ciertos perfiles ingresan dentro de un cierto rango del stand. Las credenciales inteligentes tienen ventajas obvias para recopilar datos para los mineros de la realidad. En 2009, una empresa llamada nTag, que luego fue adquirida por Alliance Technology, utilizó la tecnología nTag, que permite a los usuarios incluso recibir una notificación sobre con quién hablar y permite intercambiar tarjetas de visita electrónicamente. Otro tipo de datos que buscan los mineros de realidad son la información climática y medioambiental. Recopilan datos de los barrios empleando sensores de calidad del aire que registran el dióxido de carbono y los óxidos de nitrógeno, así como el clima general. Información como esta podría ayudar a los responsables políticos a decidir si actuar o no o si ver avances. Otra forma de recopilar datos sobre el entorno es a través del Proyecto Noah. El Proyecto Noah fue un esfuerzo para recopilar datos sobre los tipos de especies de plantas mediante el geoetiquetado de imágenes de plantas y hongos que la gente carga, lo que permite a los usuarios ver el tipo de ecosistemas en los que viven. Esto ayuda a las escuelas y a los estudiantes que quieren recopilar datos para proyectos, pero también a los observadores de aves a saber qué tipo de aves hay en la zona.
En términos generales, para esta sección, una ciudad se define por entre 1.000 y 1.000.000 de personas. Una forma de recopilar datos a escala de ciudad es mediante la recopilación de datos sobre el tráfico con semáforos y cámaras de velocidad. También se pueden recopilar datos de informes policiales y escáneres de carreteras, así como GPS de aplicaciones móviles. Con este tipo de datos de tráfico, las ciudades pueden crear rutas que permitan un movimiento y un flujo de tráfico eficientes. Una empresa llamada Inrix, fundada en 2010, ha estado recopilando datos sobre el tráfico y compra datos de operadores de puentes y otros sistemas de transporte. Utiliza estos datos para predecir las rutas de tráfico y el tiempo de congestión. Otra forma de controlar el tráfico es mediante la tecnología Bluetooth, que es una tecnología que Inrix no tiene en cuenta. La Universidad de Maryland completó un proyecto en 2012 que demostró que dos sensores Bluetooth colocados permanentemente a dos millas de distancia podían detectar con precisión la velocidad del tráfico. [3] [4] Todo esto combinado se puede crear para hacer algoritmos de sugerencia de rutas para ayudar a las personas a llegar y salir de los lugares de manera eficiente, y además la ruta puede actualizarse en tiempo real utilizando este tipo de sensores e información. Cabe destacar la start-up notable, ahora subsidiaria de Google, Waze , que también recopilaba datos de los usuarios (de forma anónima) que informaban de accidentes y este juego les ofrecía monedas y recompensas dentro de la aplicación. Para el crimen a escala de la ciudad, la primera forma de recopilar y ver datos es a través de la investigación histórica de informes anteriores dentro de cualquier área. Ahora, algoritmos más complejos colocan automáticamente a los oficiales en lugares de altos índices de criminalidad antes de que se haya cometido ningún delito real. Desde 2005, el Departamento de Policía de Memphis ha estado utilizando un programa llamado Blue CRUSH (Historial estadístico de utilización de reducción criminal) que utiliza los informes policiales y utiliza mapas de calor para distinguir entre áreas de alta y baja criminalidad. Este programa se actualiza semanalmente y permite al departamento de policía cambiar de táctica en consecuencia. El uso de este tipo de datos permitirá a los departamentos de policía interactuar con la sociedad de una manera mucho más significativa, permitiendo también realizar trabajo preventivo en lugar de trabajo de rehabilitación.
A escala nacional, el gobierno desempeña un papel mucho más importante. Los datos del censo son, con diferencia, los más fáciles de obtener. Muchas naciones hacen públicos los resultados de sus censos a través de sitios web desde los que se pueden descargar y visualizar los datos para su posterior análisis. "Además, el Banco Mundial realiza encuestas internacionales y recopila datos del censo de todas las naciones participantes, una especie de ventanilla única para obtener información sobre sus países miembros. Estos datos son de acceso público: se pueden descargar y ordenar y analizar de forma independiente. Es importante destacar que el Banco Mundial ofrece una API abierta que permite a los programadores integrar diversos datos en aplicaciones de software. Utilizando los datos del Banco Mundial, Google ha integrado una sencilla herramienta de visualización en sus resultados de búsqueda; una consulta de búsqueda sobre la población de Botsuana mostrará el número, la fuente fechada del Banco Mundial y un gráfico que muestra los cambios de población a lo largo de décadas". [5] Otra forma de recopilar datos es a través de los registros de datos de llamadas (o registros de detalles de llamadas), que son simplemente un registro de llamadas telefónicas y mensajes de texto con información como la hora y la ubicación tanto del que llama o del remitente como del destinatario. Los registros de datos de llamadas permiten a las compañías telefónicas ver las tendencias de movilidad humana. Las grandes empresas de datos como Google, Facebook y Twitter también permiten a los investigadores rastrear tendencias culturales e incluso cuándo y dónde se asignan recursos en tiempos de desastres naturales.
La mayor preocupación del mundo es la propagación de enfermedades y es una de las mejores aplicaciones de la minería de datos de la realidad. Con la globalización, la capacidad de viajar no tiene precedentes en comparación con historias anteriores. Las Naciones Unidas han creado una agenda llamada Objetivos de Desarrollo del Milenio (ODM), que son ocho objetivos que apuntan a mejorar el mundo. Recopilan datos de población, el primer paso para permitir la formulación de políticas sobre el control de enfermedades, las naciones primero deben recopilar datos sobre viajes aéreos, ya que miles de millones de personas viajan por aire cada año y viajes por mar. Los viajes aéreos transportan más personas cada año que los envíos marítimos, pero la razón principal para recopilar datos sobre los envíos es que los envíos a menudo transportan plagas que transmiten enfermedades, enfermedades transmitidas por alimentos y, a veces, especies invasoras de plantas y animales. La idea de gestionar y recopilar parece monumental, pero el Banco Mundial ya ha comenzado, lo que ayuda a un software estadístico como MAPS, que significa Plan de Acción de Marrakech para las Estadísticas. MAPS tiene como objetivo completar seis objetivos, que incluyen estos tres:
Para las personas que viajan en avión, una fuente de datos es la Asociación Internacional de Transporte Aéreo (IATA), que ha estado recopilando datos sobre aproximadamente el 90% del tráfico aéreo mundial mensualmente desde el año 2000. Estos datos permitieron a los investigadores y profesionales ver la capacidad de propagación de enfermedades desde un lugar determinado de la Tierra. Los barcos transportan aproximadamente el 90% del comercio mundial; en 2001, se implementó el sistema de identificación automática para registrar las "entradas y salidas del tráfico marítimo".