La analítica visual es un campo científico y tecnológico multidisciplinario que surgió de la visualización de la información y la visualización científica . Se centra en cómo se puede facilitar el razonamiento analítico mediante interfaces visuales interactivas . [1]
La analítica visual es "la ciencia del razonamiento analítico facilitado por interfaces visuales interactivas". [2] Puede abordar ciertos problemas cuyo tamaño, complejidad y necesidad de un análisis humano y de máquinas estrechamente acoplado pueden hacerlos de otra manera intratables. [3] La analítica visual promueve los desarrollos científicos y tecnológicos en razonamiento analítico, interacción, transformaciones y representaciones de datos para computación y visualización, informes analíticos y transición tecnológica. [4] Como agenda de investigación, la analítica visual reúne a varias comunidades científicas y técnicas de la ciencia informática, la visualización de la información, las ciencias cognitivas y perceptivas, el diseño interactivo, el diseño gráfico y las ciencias sociales.
El análisis visual integra nuevas herramientas computacionales y basadas en teoría con técnicas interactivas innovadoras y representaciones visuales para permitir el discurso de información humana. El diseño de las herramientas y técnicas se basa en principios cognitivos , de diseño y perceptivos . Esta ciencia del razonamiento analítico proporciona el marco de razonamiento sobre el cual se pueden construir tecnologías de análisis visual tanto estratégicas como tácticas para el análisis, la prevención y la respuesta ante amenazas. El razonamiento analítico es fundamental para la tarea del analista de aplicar los juicios humanos para llegar a conclusiones a partir de una combinación de evidencia y suposiciones. [2]
El análisis visual tiene algunos objetivos y técnicas que se superponen con la visualización de la información y la visualización científica . Actualmente no hay un consenso claro sobre los límites entre estos campos, pero en términos generales las tres áreas se pueden distinguir de la siguiente manera:
La analítica visual busca combinar técnicas de visualización de información con técnicas de transformación computacional y análisis de datos. La visualización de información forma parte de la interfaz directa entre el usuario y la máquina, amplificando las capacidades cognitivas humanas de seis maneras básicas: [2] [5]
Estas capacidades de visualización de información, combinadas con el análisis computacional de datos, se pueden aplicar al razonamiento analítico para respaldar el proceso de búsqueda de sentido.
El análisis visual es un campo multidisciplinario que incluye las siguientes áreas de enfoque: [2]
Las técnicas de razonamiento analítico son el método mediante el cual los usuarios obtienen información profunda que respalda directamente la evaluación de situaciones, la planificación y la toma de decisiones. La analítica visual debe facilitar un juicio humano de alta calidad con una inversión limitada del tiempo de los analistas. Las herramientas de analítica visual deben permitir diversas tareas analíticas como: [2]
Estas tareas se llevarán a cabo mediante una combinación de análisis individual y colaborativo, a menudo bajo una presión extrema de tiempo. El análisis visual debe permitir técnicas analíticas basadas en hipótesis y escenarios, que brinden apoyo al analista para razonar en función de la evidencia disponible. [2]
Las representaciones de datos son formas estructuradas adecuadas para las transformaciones basadas en ordenador. Estas estructuras deben existir en los datos originales o ser derivables de los propios datos. Deben conservar el contenido de información y conocimiento y el contexto relacionado dentro de los datos originales en la mayor medida posible. Las estructuras de las representaciones de datos subyacentes no suelen ser accesibles ni intuitivas para el usuario de la herramienta de análisis visual. Con frecuencia son de naturaleza más compleja que los datos originales y no necesariamente de menor tamaño que estos. Las estructuras de las representaciones de datos pueden contener cientos o miles de dimensiones y ser ininteligibles para una persona, pero deben poder transformarse en representaciones de dimensiones inferiores para su visualización y análisis. [2]
Las teorías de visualización incluyen: [3]
Las representaciones visuales traducen los datos a un formato visible que resalta las características importantes, incluidos los puntos en común y las anomalías. Estas representaciones visuales permiten a los usuarios percibir rápidamente los aspectos más destacados de sus datos. Aumentar el proceso de razonamiento cognitivo con el razonamiento perceptivo mediante representaciones visuales permite que el proceso de razonamiento analítico sea más rápido y más centrado. [2]
La entrada para los conjuntos de datos utilizados en el proceso de análisis visual son fuentes de datos heterogéneas (es decir, Internet, periódicos, libros, experimentos científicos, sistemas expertos ). De estas ricas fuentes, se eligen los conjuntos de datos S = S 1 , ..., S m , donde cada S i , i ∈ (1, ..., m) consta de atributos A i1 , ..., A ik . El objetivo o resultado del proceso es la información I . La información se obtiene directamente del conjunto de visualizaciones creadas V o mediante la confirmación de hipótesis H como resultados de métodos de análisis automatizados. Esta formalización del proceso de análisis visual se ilustra en la siguiente figura. Las flechas representan las transiciones de un conjunto a otro.
Más formalmente, el proceso de análisis visual es una transformación F: S → I , mientras que F es una concatenación de funciones f ∈ {D W , V X , H Y , U Z } definidas de la siguiente manera:
D W describe la funcionalidad básica de preprocesamiento de datos con D W : S → S y W ∈ {T, C, SL, I} incluyendo funciones de transformación de datos D T , funciones de limpieza de datos D C , funciones de selección de datos D SL y funciones de integración de datos D I que son necesarias para que las funciones de análisis sean aplicables al conjunto de datos.
V W , W ∈ {S, H} simboliza las funciones de visualización, que son funciones que visualizan datos V S : S → V o funciones que visualizan hipótesis V H : H → V .
H Y , Y ∈ {S, V} representa el proceso de generación de hipótesis. Distinguimos entre funciones que generan hipótesis a partir de datos H S : S → H y funciones que generan hipótesis a partir de visualizaciones H V : V → H .
Además, las interacciones del usuario U Z , Z ∈ {V, H, CV, CH} son una parte integral del proceso de análisis visual. Las interacciones del usuario pueden afectar solo a las visualizaciones U V : V → V (es decir, seleccionar o hacer zoom), o pueden afectar solo a las hipótesis U H : H → H generando una nueva hipótesis a partir de las dadas. Además, se puede extraer información de las visualizaciones U CV : V → I o de las hipótesis U CH : H → I .
El preprocesamiento de datos típico aplicando funciones de limpieza, integración y transformación de datos se define como D P = D T (D I (D C (S 1 , ..., S n ))) . Después del paso de preprocesamiento, se aplican a los datos métodos de análisis automatizados H S = {f s1 , ..., f sq } (es decir, estadísticas, minería de datos, etc.) o métodos de visualización V S : S → V, V S = {f v1 , ..., f vs } , para revelar patrones como se muestra en la figura anterior. [7]
En general se utiliza el siguiente paradigma para procesar los datos:
Analizar primero – Mostrar lo importante – Ampliar, filtrar y analizar más a fondo – Detalles a pedido [8]