stringtranslate.com

Visualización de datos e información.

El profesor de estadística Edward Tufte describió el gráfico de 1869 de Charles Joseph Minard sobre la invasión de Rusia por la Francia napoleónica como lo que "bien puede ser el mejor gráfico estadístico jamás elaborado", y señaló que captura seis variables en dos dimensiones. [1]

La visualización de datos e información ( data viz/vis o info viz/vis ) [2] es la práctica de diseñar y crear representaciones gráficas o visuales fáciles de comunicar y de entender de una gran cantidad [3] de datos cuantitativos complejos. y datos e información cualitativos con la ayuda de elementos visuales estáticos, dinámicos o interactivos. Por lo general, se basan en datos e información recopilados de un determinado dominio de experiencia , estas visualizaciones están destinadas a una audiencia más amplia para ayudarlos a explorar y descubrir visualmente, comprender, interpretar y obtener conocimientos importantes sobre estructuras, relaciones y correlaciones que de otro modo serían difíciles de identificar. , patrones locales y globales, tendencias, variaciones, constancia, grupos, valores atípicos y agrupaciones inusuales dentro de los datos ( visualización exploratoria ). [4] [5] [6] Cuando está destinado al público en general ( comunicación de masas ) para transmitir una versión concisa de información específica conocida de una manera clara y atractiva ( visualización de presentación o explicativa ), [4] normalmente se denomina información. gráficos .

La visualización de datos se ocupa de presentar visualmente conjuntos de datos brutos principalmente cuantitativos en forma esquemática. Los formatos visuales utilizados en la visualización de datos incluyen tablas , cuadros y gráficos (por ejemplo, gráficos circulares , gráficos de barras , gráficos de líneas , gráficos de áreas , gráficos de conos, gráficos piramidales, gráficos de anillos , histogramas , espectrogramas , gráficos de cohortes, gráficos en cascada , gráficos de embudo , viñetas) . gráficos , etc.), diagramas , gráficos (p. ej. , diagramas de dispersión , diagramas de distribución, diagramas de caja y bigotes ), mapas geoespaciales (como mapas de símbolos proporcionales , mapas de coropletas , mapas de isopletas y mapas de calor ), figuras, matrices de correlación , porcentajes indicadores , etc., que en ocasiones pueden combinarse en un salpicadero .

La visualización de información , por otro lado, se ocupa de conjuntos de datos múltiples, a gran escala y complicados que contienen datos cuantitativos (numéricos), así como información cualitativa (no numérica, es decir, verbal o gráfica) y principalmente abstracta, y su objetivo es agregar valor. a datos sin procesar, mejorar la comprensión de los espectadores, reforzar su cognición y ayudarlos a obtener conocimientos y tomar decisiones mientras navegan e interactúan con la pantalla gráfica respaldada por computadora. Las herramientas visuales utilizadas en la visualización de información incluyen mapas (como mapas de árbol ), animaciones , infografías , diagramas de Sankey , diagramas de flujo , diagramas de redes , redes semánticas , diagramas entidad-relación , diagramas de Venn , líneas de tiempo , mapas mentales , etc.

Las tecnologías emergentes como la realidad virtual , aumentada y mixta tienen el potencial de hacer que la visualización de la información sea más inmersiva, intuitiva, interactiva y fácilmente manipulable y así mejorar la percepción visual y la cognición del usuario . [7] En la visualización de datos e información, el objetivo es presentar y explorar gráficamente datos abstractos, no físicos y no espaciales recopilados de bases de datos , sistemas de información , sistemas de archivos , documentos , datos comerciales y financieros , etc. visualización ), que es diferente del campo de la visualización científica , donde el objetivo es generar imágenes realistas basadas en datos científicos físicos y espaciales para confirmar o rechazar hipótesis ( visualización confirmatoria ). [8]

La visualización de datos eficaz se obtiene correctamente, está contextualizada, es simple y ordenada. Los datos subyacentes son precisos y están actualizados para garantizar que los conocimientos sean confiables. Los elementos gráficos están bien elegidos para los conjuntos de datos dados y son estéticamente atractivos, con formas, colores y otros elementos visuales utilizados deliberadamente de manera significativa y sin distracciones. Las imágenes van acompañadas de textos de apoyo (etiquetas y títulos). Estos componentes verbales y gráficos se complementan entre sí para garantizar una comprensión clara, rápida y memorable. La visualización de información eficaz es consciente de las necesidades, preocupaciones y el nivel de experiencia del público objetivo, guiándolos deliberadamente hacia la conclusión deseada. [9] [3] Esta visualización efectiva se puede utilizar no solo para transmitir ideas especializadas, complejas y basadas en big data a un grupo más amplio de audiencia no técnica de una manera visualmente atractiva, atractiva y accesible, sino también a expertos en el campo y ejecutivos para tomar decisiones, monitorear el desempeño, generar nuevas ideas y estimular la investigación. [9] [4] Además, los científicos de datos, analistas de datos y especialistas en minería de datos utilizan la visualización de datos para comprobar la calidad de los datos, encontrar errores, lagunas inusuales y valores faltantes en los datos, limpiar datos, explorar las estructuras y características de los datos y evaluar los resultados de los modelos basados ​​en datos. [4] En los negocios , la visualización de datos e información puede constituir una parte de la narración de datos , donde se combinan con una estructura narrativa coherente o un argumento para contextualizar los datos analizados y comunicar los conocimientos adquiridos al analizar los datos de forma clara y memorable con el objetivo de convencer a la audiencia para que tome una decisión o realice una acción con el fin de crear valor comercial . [3] [10] Esto se puede contrastar con el campo de los gráficos estadísticos , donde datos estadísticos complejos se comunican gráficamente de manera exacta y precisa entre investigadores y analistas con experiencia estadística para ayudarlos a realizar análisis de datos exploratorios o para transmitir los resultados de tales análisis, donde el atractivo visual, captar la atención sobre un tema determinado y la narración no son tan importantes. [11]

El campo de la visualización de datos e información es de naturaleza interdisciplinaria ya que incorpora principios que se encuentran en las disciplinas de la estadística descriptiva (ya en el siglo XVIII), [12] la comunicación visual , el diseño gráfico , la ciencia cognitiva y, más recientemente, los gráficos interactivos por computadora. e interacción persona-computadora . [13] Dado que la visualización eficaz requiere habilidades de diseño, habilidades estadísticas y habilidades informáticas, autores como Gershon y Page sostienen que es tanto un arte como una ciencia. [14] El campo vecino del análisis visual combina el análisis de datos estadísticos, la visualización de datos e información y el razonamiento analítico humano a través de interfaces visuales interactivas para ayudar a los usuarios humanos a llegar a conclusiones, obtener conocimientos prácticos y tomar decisiones informadas que de otro modo serían difíciles de tomar para las computadoras.

La investigación sobre cómo las personas leen y malinterpretan varios tipos de visualizaciones está ayudando a determinar qué tipos y características de visualizaciones son más comprensibles y efectivas para transmitir información. [15] [16] Por otro lado, las visualizaciones involuntariamente deficientes o intencionalmente engañosas y engañosas ( visualización desinformativa ) pueden funcionar como herramientas poderosas que difunden información errónea , manipulan la percepción pública y desvían la opinión pública hacia una determinada agenda. [17] Por lo tanto, la alfabetización en visualización de datos se ha convertido en un componente importante de la alfabetización en datos e información en la era de la información , similar a los roles desempeñados por la alfabetización textual , matemática y visual en el pasado. [18]

Descripción general

La visualización de datos es uno de los pasos para analizar datos y presentarlos a los usuarios.
Mapa parcial de Internet de principios de 2005 representado como un gráfico, cada línea representa dos direcciones IP , y algo de retraso entre esos dos nodos.

El campo de la visualización de datos e información ha surgido "de la investigación en interacción persona-computadora , informática , gráficos , diseño visual , psicología y métodos comerciales . Se aplica cada vez más como un componente crítico en la investigación científica, bibliotecas digitales , minería de datos , análisis de datos financieros, estudios de mercado, control de producción manufacturera y descubrimiento de fármacos ". [19]

La visualización de datos e información supone que "las representaciones visuales y las técnicas de interacción aprovechan el amplio ancho de banda del ojo humano hacia la mente para permitir a los usuarios ver, explorar y comprender grandes cantidades de información a la vez. La visualización de información se centró en la creación de enfoques para transmitir información abstracta de manera intuitiva." [20]

El análisis de datos es una parte indispensable de toda investigación aplicada y resolución de problemas en la industria. Los enfoques de análisis de datos más fundamentales son la visualización (histogramas, diagramas de dispersión, diagramas de superficie, mapas de árboles, diagramas de coordenadas paralelas, etc.), estadística ( prueba de hipótesis , regresión , PCA , etc.), minería de datos ( minería de asociaciones , etc.) y métodos de aprendizaje automático ( agrupación , clasificación , árboles de decisión , etc.). Entre estos enfoques, la visualización de información o análisis de datos visuales es el que más depende de las habilidades cognitivas de los analistas humanos y permite el descubrimiento de conocimientos no estructurados y procesables que están limitados únicamente por la imaginación y la creatividad humanas. El analista no necesita aprender ningún método sofisticado para poder interpretar las visualizaciones de los datos. La visualización de información también es un esquema de generación de hipótesis, que puede ir seguido, y suele ir seguido, de un análisis más analítico o formal, como la prueba de hipótesis estadística.

Para comunicar información de forma clara y eficiente, la visualización de datos utiliza gráficos estadísticos , diagramas , gráficos de información y otras herramientas. Los datos numéricos se pueden codificar mediante puntos, líneas o barras para comunicar visualmente un mensaje cuantitativo. [21] La visualización eficaz ayuda a los usuarios a analizar y razonar sobre datos y pruebas. [22] Hace que los datos complejos sean más accesibles, comprensibles y utilizables, pero también puede ser reduccionista. [23] Los usuarios pueden tener tareas analíticas particulares, como hacer comparaciones o comprender la causalidad , y el principio de diseño del gráfico (es decir, mostrar comparaciones o mostrar causalidad) sigue la tarea. Las tablas generalmente se usan donde los usuarios buscan una medida específica, mientras que los gráficos de varios tipos se usan para mostrar patrones o relaciones en los datos para una o más variables.

La visualización de datos se refiere a las técnicas utilizadas para comunicar datos o información codificándolos como objetos visuales (por ejemplo, puntos, líneas o barras) contenidos en gráficos. El objetivo es comunicar información de forma clara y eficiente a los usuarios. Es uno de los pasos del análisis de datos o ciencia de datos . Según Vitaly Friedman (2008), el "objetivo principal de la visualización de datos es comunicar información de forma clara y eficaz a través de medios gráficos. Esto no significa que la visualización de datos deba parecer aburrida para ser funcional o extremadamente sofisticada para verse bella. Transmitir ideas". Efectivamente, tanto la forma estética como la funcionalidad deben ir de la mano, proporcionando información sobre un conjunto de datos bastante escaso y complejo al comunicar sus aspectos clave de una manera más intuitiva. Sin embargo, los diseñadores a menudo no logran lograr un equilibrio entre forma y función, creando hermosas visualizaciones de datos que no cumplen su objetivo principal: comunicar información". [24]

De hecho, Fernanda Viegas y Martin M. Wattenberg sugirieron que una visualización ideal no sólo debería comunicar claramente, sino también estimular la participación y la atención del espectador. [25]

La visualización de datos está estrechamente relacionada con los gráficos de información , la visualización de información , la visualización científica , el análisis exploratorio de datos y los gráficos estadísticos . En el nuevo milenio, la visualización de datos se ha convertido en un área activa de investigación, enseñanza y desarrollo. Según Post et al. (2002), ha unido la visualización científica y de la información. [26]

En el entorno comercial, la visualización de datos a menudo se denomina paneles de control . Las infografías son otra forma muy común de visualización de datos.

Principios

Características de las pantallas gráficas efectivas.

El mayor valor de una imagen es cuando nos obliga a notar lo que nunca esperábamos ver.

Juan Tukey [27]

Edward Tufte ha explicado que los usuarios de pantallas de información están ejecutando tareas analíticas particulares , como hacer comparaciones. El principio de diseño del gráfico de información debe respaldar la tarea analítica. [28] Como muestran William Cleveland y Robert McGill, diferentes elementos gráficos logran esto de manera más o menos efectiva. Por ejemplo, los gráficos de puntos y de barras superan a los gráficos circulares. [29]

En su libro de 1983 The Visual Display of Quantitative Information , [30] Edward Tufte define las 'visualizaciones gráficas' y los principios para una visualización gráfica eficaz en el siguiente pasaje: "La excelencia en los gráficos estadísticos consiste en ideas complejas comunicadas con claridad, precisión y eficiencia. Las pantallas gráficas deben:

Los gráficos revelan datos. De hecho, los gráficos pueden ser más precisos y reveladores que los cálculos estadísticos convencionales." [31]

Por ejemplo, el diagrama de Minard muestra las pérdidas sufridas por el ejército de Napoleón en el período 1812-1813. Se trazan seis variables: el tamaño del ejército, su ubicación en una superficie bidimensional (xey), el tiempo, la dirección del movimiento y la temperatura. El ancho de la línea ilustra una comparación (tamaño del ejército en momentos determinados), mientras que el eje de temperatura sugiere una causa del cambio en el tamaño del ejército. Esta visualización multivariada en una superficie bidimensional cuenta una historia que se puede captar de inmediato mientras se identifican los datos de origen para generar credibilidad. Tufte escribió en 1983 que: "Bien puede ser el mejor gráfico estadístico jamás elaborado". [31]

No aplicar estos principios puede dar como resultado gráficos engañosos , distorsionar el mensaje o respaldar una conclusión errónea. Según Tufte, chartjunk se refiere a la decoración interior extraña del gráfico que no realza el mensaje ni a los efectos tridimensionales o de perspectiva gratuitos. Separar innecesariamente la clave explicativa de la imagen misma, obligando al ojo a viajar de un lado a otro desde la imagen hasta la clave, es una forma de "desechos administrativos". Se debe maximizar la proporción de "datos a tinta", borrando la tinta que no sea de datos cuando sea posible. [31]

La Oficina de Presupuesto del Congreso resumió varias de las mejores prácticas para pantallas gráficas en una presentación de junio de 2014. Estos incluían: a) Conocer a su audiencia; b) diseñar gráficos que puedan ser independientes fuera del contexto del informe; y c) Diseñar gráficos que comuniquen los mensajes clave del informe. [32]

Mensajes cuantitativos

El mismo conjunto de datos representado en tres gráficos: El panel superior es un gráfico de barras que representa el flujo de sucesos a lo largo del tiempo (se asemeja al diagrama de Sankey en el original del New York Times [33] ). El panel central es un gráfico de burbujas que cuantifica por separado resultados discretos. El panel inferior es un gráfico circular desglosado que muestra las participaciones relativas de las categorías y las participaciones dentro de las categorías.

El autor Stephen Few describió ocho tipos de mensajes cuantitativos que los usuarios pueden intentar comprender o comunicar a partir de un conjunto de datos y los gráficos asociados utilizados para ayudar a comunicar el mensaje:

  1. Series de tiempo: se captura una sola variable durante un período de tiempo, como la tasa de desempleo o las medidas de temperatura durante un período de 10 años. Se puede utilizar un gráfico de líneas para demostrar la tendencia a lo largo del tiempo.
  2. Clasificación: las subdivisiones categóricas se clasifican en orden ascendente o descendente, como una clasificación del desempeño de ventas (la medida ) por parte de los vendedores (la categoría , donde cada vendedor es una subdivisión categórica ) durante un solo período. Se puede utilizar un gráfico de barras para mostrar la comparación entre los vendedores.
  3. Parte-total: las subdivisiones categóricas se miden como una relación con el todo (es decir, un porcentaje del 100%). Un gráfico circular o de barras puede mostrar la comparación de ratios, como la cuota de mercado representada por los competidores en un mercado.
  4. Desviación: las subdivisiones categóricas se comparan con una referencia, como una comparación de los gastos reales frente a los presupuestados para varios departamentos de una empresa durante un período de tiempo determinado. Un gráfico de barras puede mostrar una comparación entre el importe real y el de referencia.
  5. Distribución de frecuencia: muestra el número de observaciones de una variable particular para un intervalo determinado, como el número de años en los que el rendimiento del mercado de valores se encuentra entre intervalos como 0–10%, 11–20%, etc. Un histograma , un tipo Para este análisis se puede utilizar un gráfico de barras. Un diagrama de caja ayuda a visualizar estadísticas clave sobre la distribución, como la mediana, los cuartiles, los valores atípicos, etc.
  6. Correlación: Comparación entre observaciones representadas por dos variables (X,Y) para determinar si tienden a moverse en direcciones iguales o opuestas. Por ejemplo, trazar el desempleo (X) y la inflación (Y) para una muestra de meses. Normalmente se utiliza un diagrama de dispersión para este mensaje.
  7. Comparación nominal: comparación de subdivisiones categóricas sin ningún orden en particular, como el volumen de ventas por código de producto. Se puede utilizar un gráfico de barras para esta comparación.
  8. Geográfico o geoespacial : comparación de una variable en un mapa o diseño, como la tasa de desempleo por estado o el número de personas en los distintos pisos de un edificio. Un cartograma es un gráfico típico utilizado. [21] [34]

Los analistas que revisan un conjunto de datos pueden considerar si algunos o todos los mensajes y tipos de gráficos anteriores son aplicables a su tarea y audiencia. El proceso de prueba y error para identificar relaciones y mensajes significativos en los datos es parte del análisis exploratorio de datos .

Percepción visual y visualización de datos.

Un ser humano puede distinguir diferencias en la longitud, forma, orientación, distancias y color (matiz) de las líneas fácilmente sin un esfuerzo de procesamiento significativo; estos se denominan " atributos de preatención ". Por ejemplo, puede requerir mucho tiempo y esfuerzo ("procesamiento atento") identificar el número de veces que aparece el dígito "5" en una serie de números; pero si ese dígito es diferente en tamaño, orientación o color, las instancias del dígito se pueden notar rápidamente mediante un procesamiento previo a la atención. [35]

Los gráficos atractivos aprovechan el procesamiento y los atributos previos a la atención y la fuerza relativa de estos atributos. Por ejemplo, dado que los humanos pueden procesar más fácilmente las diferencias en la longitud de las líneas que en el área de superficie, puede ser más efectivo usar un gráfico de barras (que aprovecha la longitud de las líneas para mostrar la comparación) en lugar de gráficos circulares (que usan el área de superficie para mostrar la comparación). ). [35]

Percepción/cognición humana y visualización de datos.

Casi todas las visualizaciones de datos se crean para consumo humano. El conocimiento de la percepción y cognición humana es necesario al diseñar visualizaciones intuitivas. [36] La cognición se refiere a procesos en los seres humanos como la percepción, la atención, el aprendizaje, la memoria, el pensamiento, la formación de conceptos, la lectura y la resolución de problemas. [37] El procesamiento visual humano es eficiente para detectar cambios y hacer comparaciones entre cantidades, tamaños, formas y variaciones de luminosidad. Cuando las propiedades de los datos simbólicos se asignan a propiedades visuales, los humanos pueden navegar a través de grandes cantidades de datos de manera eficiente. Se estima que 2/3 de las neuronas del cerebro pueden participar en el procesamiento visual. La visualización adecuada proporciona un enfoque diferente para mostrar posibles conexiones, relaciones, etc. que no son tan obvias en datos cuantitativos no visualizados. La visualización puede convertirse en un medio de exploración de datos .

Los estudios han demostrado que las personas utilizan en promedio un 19 % menos de recursos cognitivos y un 4,5 % más capaces de recordar detalles al comparar la visualización de datos con el texto. [38]

Historia

Hitos e invenciones seleccionados

El estudio moderno de la visualización comenzó con los gráficos por computadora , que "desde sus inicios se han utilizado para estudiar problemas científicos. Sin embargo, en sus inicios la falta de potencia gráfica a menudo limitaba su utilidad. El énfasis reciente en la visualización comenzó en 1987 con el especial número de Computer Graphics on Visualization in Scientific Computing . Desde entonces se han celebrado varias conferencias y talleres, copatrocinados por la IEEE Computer Society y ACM SIGGRAPH ". [39] Se han dedicado a los temas generales de visualización de datos , visualización de información y visualización científica , y áreas más específicas como la visualización de volúmenes . En 1786, William Playfair publicó los primeros gráficos de presentación.

Localización del espacio de productos , destinada a mostrar la complejidad económica de una economía determinada.
Mapa arbóreo de las exportaciones de Benin (2009) por categoría de producto. Los Treemaps de Exportaciones de Productos son una de las aplicaciones más recientes de este tipo de visualizaciones, desarrollada por el Observatorio de Complejidad Económica de Harvard-MIT .

No existe una "historia" completa de la visualización de datos. No existen relatos que abarquen todo el desarrollo del pensamiento visual y la representación visual de datos, y que cotejen las contribuciones de disciplinas dispares. [40] Michael Friendly y Daniel J Denis de la Universidad de York están involucrados en un proyecto que intenta proporcionar una historia completa de la visualización. Contrariamente a la creencia general, la visualización de datos no es un desarrollo moderno. Desde la prehistoria, los datos estelares o información como la ubicación de las estrellas se visualizaban en las paredes de las cuevas (como las encontradas en la cueva de Lascaux en el sur de Francia) desde el Pleistoceno . [41] Los artefactos físicos como las fichas de arcilla de Mesopotamia (5500 a. C.), los quipus incas (2600 a. C.) y los gráficos de barras de las Islas Marshall (sin fecha) también pueden considerarse como visualizadores de información cuantitativa. [42] [43]

La primera visualización de datos documentada se remonta al año 1160 a. C. con el mapa de papiro de Turín, que ilustra con precisión la distribución de los recursos geológicos y proporciona información sobre la extracción de esos recursos. [44] Dichos mapas pueden clasificarse como cartografía temática , que es un tipo de visualización de datos que presenta y comunica datos e información específicos a través de una ilustración geográfica diseñada para mostrar un tema particular conectado con un área geográfica específica. Las primeras formas documentadas de visualización de datos fueron varios mapas temáticos de diferentes culturas e ideogramas y jeroglíficos que proporcionaban y permitían la interpretación de la información ilustrada. Por ejemplo, las tablillas Lineal B de Micenas proporcionaron una visualización de información sobre el comercio de la Edad del Bronce Final en el Mediterráneo. La idea de coordenadas fue utilizada por los topógrafos del antiguo Egipto para trazar ciudades, las posiciones terrestres y celestiales se ubicaban mediante algo parecido a la latitud y la longitud al menos en el año 200 a. C., y la proyección cartográfica de una Tierra esférica en latitud y longitud por Claudio Ptolomeo [ C.  85 - c.  165 ] en Alejandría servirían como patrones de referencia hasta el siglo XIV. [44]

La invención del papel y el pergamino permitió un mayor desarrollo de las visualizaciones a lo largo de la historia. La figura muestra un gráfico del siglo X o posiblemente XI que pretende ser una ilustración del movimiento planetario, utilizado en un apéndice de un libro de texto en las escuelas de los monasterios. [45] El gráfico aparentemente estaba destinado a representar un gráfico de las inclinaciones de las órbitas planetarias en función del tiempo. Para ello se representaba la zona del zodíaco en un plano con una línea horizontal dividida en treinta partes como eje del tiempo o longitudinal. El eje vertical designa el ancho del zodíaco. La escala horizontal parece haber sido elegida para cada planeta individualmente porque los períodos no pueden conciliarse. El texto adjunto se refiere únicamente a las amplitudes. Las curvas aparentemente no están relacionadas en el tiempo.

Movimientos planetarios

En el siglo XVI, las técnicas e instrumentos para la observación y medición precisas de cantidades físicas y de la posición geográfica y celeste estaban bien desarrollados (por ejemplo, un "cuadrante de pared" construido por Tycho Brahe [1546-1601], que cubría toda una pared en su observatorio). Particularmente importante fue el desarrollo de la triangulación y otros métodos para determinar con precisión las ubicaciones cartográficas. [40] Muy temprano, la medida del tiempo llevó a los estudiosos a desarrollar formas innovadoras de visualizar los datos (por ejemplo, Lorenz Codomann en 1596, Johannes Temporarius en 1596 [46] ).

El filósofo y matemático francés René Descartes y Pierre de Fermat desarrollaron la geometría analítica y el sistema de coordenadas bidimensionales que influyeron en gran medida en los métodos prácticos de visualización y cálculo de valores. El trabajo de Fermat y Blaise Pascal sobre estadística y teoría de la probabilidad sentó las bases de lo que ahora conceptualizamos como datos. [40] Según la Interaction Design Foundation, estos desarrollos permitieron y ayudaron a William Playfair , quien vio el potencial de la comunicación gráfica de datos cuantitativos, a generar y desarrollar métodos gráficos de estadística. [36]

Serie Playfair Time

En la segunda mitad del siglo XX, Jacques Bertin utilizó gráficos cuantitativos para representar información de forma "intuitiva, clara, precisa y eficiente". [36]

John Tukey y Edward Tufte traspasaron los límites de la visualización de datos; Tukey con su nuevo enfoque estadístico de análisis exploratorio de datos y Tufte con su libro "The Visual Display of Quantitative Information" allanaron el camino para perfeccionar las técnicas de visualización de datos para más que los estadísticos. Con el avance de la tecnología llegó el avance de la visualización de datos; comenzando con visualizaciones dibujadas a mano y evolucionando hacia aplicaciones más técnicas, incluidos diseños interactivos que conducen a la visualización de software. [47]

Programas como SAS , SOFA , R , Minitab , Cornerstone y más permiten la visualización de datos en el campo de la estadística. Otras aplicaciones de visualización de datos, más enfocadas y exclusivas para individuos, los lenguajes de programación como D3 , Python y JavaScript ayudan a hacer posible la visualización de datos cuantitativos. Las escuelas privadas también han desarrollado programas para satisfacer la demanda de visualización de datos de aprendizaje y bibliotecas de programación asociadas, incluidos programas gratuitos como The Data Incubator o programas pagos como General Assembly . [48]

A partir del simposio "Data to Discovery" en 2013, ArtCenter College of Design, Caltech y JPL en Pasadena han llevado a cabo un programa anual sobre visualización interactiva de datos. [49] El programa pregunta: ¿Cómo puede la visualización interactiva de datos ayudar a los científicos e ingenieros a explorar sus datos de manera más efectiva? ¿Cómo pueden la informática, el diseño y el pensamiento de diseño ayudar a maximizar los resultados de la investigación? ¿Qué metodologías son más efectivas para aprovechar el conocimiento de estos campos? Al codificar información relacional con características visuales e interactivas apropiadas para ayudar a interrogar y, en última instancia, obtener nuevos conocimientos sobre los datos, el programa desarrolla nuevos enfoques interdisciplinarios para problemas científicos complejos, combinando el pensamiento de diseño y los últimos métodos de la informática, el diseño centrado en el usuario y el diseño de interacción. y gráficos 3D.

Terminología

La visualización de datos implica una terminología específica, parte de la cual se deriva de las estadísticas. Por ejemplo, el autor Stephen Few define dos tipos de datos, que se utilizan en combinación para respaldar un análisis o visualización significativo:

La distinción entre variables cuantitativas y categóricas es importante porque los dos tipos requieren diferentes métodos de visualización.

Dos tipos principales de visualización de información son tablas y gráficos.

Eppler y Lengler han desarrollado la "Tabla periódica de métodos de visualización", un gráfico interactivo que muestra varios métodos de visualización de datos. Incluye seis tipos de métodos de visualización de datos: datos, información, concepto, estrategia, metáfora y compuesto. [52] En "Análisis y diseño de visualización", Tamara Munzner escribe "Los sistemas de visualización basados ​​en computadora proporcionan representaciones visuales de conjuntos de datos diseñados para ayudar a las personas a realizar tareas de manera más efectiva". Munzner sostiene que la visualización "es adecuada cuando es necesario aumentar las capacidades humanas en lugar de reemplazar a las personas con métodos computacionales de toma de decisiones". [53]

Técnicas

Otras técnicas

Interactividad

La visualización de datos interactiva permite acciones directas en un gráfico para cambiar elementos y vincular varios gráficos. [56]

La visualización interactiva de datos ha sido una búsqueda de los estadísticos desde finales de los años 1960. Se pueden encontrar ejemplos de estos avances en la biblioteca de préstamo de vídeos de la Asociación Estadounidense de Estadística . [57]

Las interacciones comunes incluyen:

Otras perspectivas

Existen diferentes enfoques sobre el alcance de la visualización de datos. Un enfoque común es la presentación de la información, como Friedman (2008). Friendly (2008) supone dos partes principales de la visualización de datos: gráficos estadísticos y cartografía temática . [58] En esta línea, el artículo "Visualización de datos: enfoques modernos" (2007) ofrece una descripción general de siete temas de visualización de datos: [59]

Todas estas materias están estrechamente relacionadas con el diseño gráfico y la representación de la información.

Por otro lado, desde una perspectiva informática , Frits H. Post en 2002 categorizó el campo en subcampos: [26] [60]

Dentro de The Harvard Business Review, Scott Berinato desarrolló un marco para abordar la visualización de datos. [61] Para empezar a pensar visualmente, los usuarios deben considerar dos preguntas; 1) Lo que tienes y 2) lo que estás haciendo. El primer paso es identificar qué datos desea visualizar. Se basa en datos, como las ganancias de los últimos diez años, o en una idea conceptual, como cómo está estructurada una organización específica. Una vez respondida esta pregunta, uno puede centrarse en si están intentando comunicar información (visualización declarativa) o intentando descubrir algo (visualización exploratoria). Scott Berinato combina estas preguntas para ofrecer cuatro tipos de comunicación visual, cada uno de los cuales tiene sus propios objetivos. [61]

Estos cuatro tipos de comunicación visual son los siguientes;

Aplicaciones

Los conocimientos de visualización de datos e información se están aplicando en áreas como: [19]

Organización

Los laboratorios académicos e industriales notables en el campo son:

Las conferencias en este campo, clasificadas según su importancia en la investigación de visualización de datos, [63] son:

Para obtener más ejemplos, consulte: Categoría: Organizaciones de gráficos por computadora

Arquitectura de presentación de datos

Una visualización de datos de las redes sociales.

La arquitectura de presentación de datos ( DPA ) es un conjunto de habilidades que busca identificar, localizar, manipular, formatear y presentar datos de tal manera que comuniquen de manera óptima el significado y el conocimiento adecuado.

Históricamente, el término arquitectura de presentación de datos se atribuye a Kelly Lautt: [a] "La arquitectura de presentación de datos (DPA) es un conjunto de habilidades rara vez aplicada y fundamental para el éxito y el valor de la inteligencia empresarial . La arquitectura de presentación de datos une la ciencia de los números, los datos y estadísticas para descubrir información valiosa a partir de los datos y hacerla utilizable, relevante y procesable con las artes de la visualización de datos, las comunicaciones, la psicología organizacional y la gestión del cambio para proporcionar soluciones de inteligencia empresarial con el alcance de los datos, el tiempo de entrega, el formato y las visualizaciones que más respaldar e impulsar de manera efectiva el comportamiento operativo, táctico y estratégico hacia objetivos comerciales (u organizacionales) entendidos. DPA no es un conjunto de habilidades de TI ni de negocios, sino que existe como un campo de especialización separado. A menudo confundida con la visualización de datos, la arquitectura de presentación de datos es un conjunto de habilidades más amplio que incluye determinar qué datos, en qué cronograma y en qué formato exacto se presentarán, no solo la mejor manera de presentar los datos que ya se han elegido. Las habilidades de visualización de datos son un elemento de DPA".

Objetivos

DPA tiene dos objetivos principales:

Alcance

Teniendo en cuenta los objetivos anteriores, el trabajo real de la arquitectura de presentación de datos consta de:

Campos relacionados

El trabajo de DPA comparte puntos en común con varios otros campos, que incluyen:

Ver también

Notas

  1. ^ Los primeros usos públicos formales, registrados del término arquitectura de presentación de datos se produjeron en los tres eventos formales de lanzamiento de Microsoft Office 2007 en diciembre, enero y febrero de 2007-08 en Edmonton, Calgary y Vancouver (Canadá) en una presentación de Kelly Lautt. que describe un sistema de inteligencia de negocios diseñado para mejorar la calidad del servicio en una empresa de celulosa y papel. El término se utilizó y registró en uso público el 16 de diciembre de 2009 en una presentación de Microsoft Canadá sobre el valor de fusionar Business Intelligence con procesos de colaboración corporativa.

Referencias

  1. ^ Corbett, Juan. "Charles Joseph Minard: mapeo de la marcha de Napoleón, 1861". Centro de Ciencias Sociales Espacialmente Integradas. Archivado desde el original el 19 de junio de 2003.(El sitio web de CSISS se ha movido; use el enlace de archivo para el artículo)
  2. ^ Shewan, Dan (5 de octubre de 2016). "Los datos son hermosos: 7 herramientas de visualización de datos para especialistas en marketing digital". Negocio2Comunidad . Archivado desde el original el 12 de noviembre de 2016.
  3. ^ abc Nussbaumer Knaflic, Cole (2 de noviembre de 2015). Contar historias con datos: una guía de visualización de datos para profesionales de negocios . John Wiley e hijos. ISBN 978-1-119-00225-3.
  4. ^ abcd Antony Unwin (31 de enero de 2020). "¿Por qué es importante la visualización de datos? ¿Qué es importante en la visualización de datos?". Revisión de ciencia de datos de Harvard . 2 (1). doi : 10.1162/99608f92.8ae4d525 . Consultado el 27 de marzo de 2023 .
  5. ^ Ananda Mitra (2018), "Gestión y visualización de big data no estructurados", Enciclopedia de ciencia y tecnología de la información (4ª ed.), IGI Global
  6. ^ Bhuvanendra Putchala; Lasya Sreevidya Kanala; Devi Prasanna Donepudi; Hari Kishan Kondaveeti (2023), "Aplicaciones del análisis de big data en informática sanitaria", en Narasimha Rao Vajjhala; Philip Eappen (eds.), Informática de la salud y seguridad del paciente en tiempos de crisis , IGI Global, págs. 175-194
  7. ^ Olshánnikova, Ekaterina; Ometov, Aleksandr; Koucheryavy, Yevgeny; Ollson, Thomas (2015), "Visualización de Big Data con realidad virtual y aumentada: desafíos y agenda de investigación", Journal of Big Data , 2 (22), doi : 10.1186/s40537-015-0031-2
  8. ^ Card, Mackinlay y Shneiderman (1999), Lecturas sobre visualización de información: uso de la visión para pensar , Morgan Kaufmann, págs.{{citation}}: CS1 maint: multiple names: authors list (link)
  9. ^ ab "¿Qué es la visualización de datos?". IBM . Consultado el 27 de marzo de 2023 .
  10. ^ Brent Dykes (2019), Narración de datos eficaz: cómo impulsar el cambio con datos, narrativa y elementos visuales , John Wiley & Sons, p. dieciséis
  11. ^ David C. LeBlanc (2004), Estadística: conceptos y aplicaciones de la ciencia , Jones & Bartlett Learning, p. 35–36
  12. ^ Grandjean, Martín (2022). "Visualización de datos para la historia". Manual de historia pública digital : 291–300. doi :10.1515/9783110430295-024. ISBN 9783110430295.
  13. ^ EH Chi (2013), Un marco para visualizar información , Springer Science & Business Media, p. xxiii
  14. ^ Gersón, Nahúm; Page, Ward (1 de agosto de 2001). "Qué puede hacer la narración por la visualización de información". Comunicaciones de la ACM . 44 (8): 31–37. doi :10.1145/381641.381653. S2CID  7666107.
  15. ^ Mason, Betsy (12 de noviembre de 2019). "Por qué los científicos deben ser mejores en la visualización de datos". Revista Conocible . doi : 10.1146/conocible-110919-1 .
  16. ^ O'Donoghue, Seán I.; Baldi, Benedetta Frida; Clark, Susan J.; Querido, Aaron E.; Hogan, James M.; Kaur, Sandeep; Maier-Hein, Lena; McCarthy, Davis J.; Moore, William J.; Stenau, Esther; Swedlow, Jason R.; Vuong, Jenny; Procter, James B. (20 de julio de 2018). "Visualización de Datos Biomédicos". Revisión anual de la ciencia de datos biomédicos . 1 (1): 275–304. doi :10.1146/annurev-biodatasci-080917-013424. hdl : 10453/125943 . S2CID  199591321 . Consultado el 25 de junio de 2021 .
  17. ^ Leo Yu-Ho Lo; Ayush Gupta; Kento Shigyo; Aoyu Wu; Enrico Bertini; Huamin Qu, mal informado por la visualización: ¿Qué aprendemos de las visualizaciones desinformativas?
  18. ^ Börner, K.; Bueckle, A.; Ginda, M. (2019), "Alfabetización en visualización de datos: definiciones, marcos conceptuales, ejercicios y evaluaciones", Actas de la Academia Nacional de Ciencias , 116 (6): 1857–1864, Bibcode :2019PNAS..116.1857B, doi : 10.1073/pnas.1807180116 , PMC 6369751 , PMID  30718386 
  19. ^ ab Benjamin B. Bederson y Ben Shneiderman (2003). El oficio de la visualización de información: lecturas y reflexiones, Morgan Kaufmann ISBN 1-55860-915-6
  20. ^ James J. Thomas y Kristin A. Cook (Ed.) (2005). Iluminando el camino: la agenda de I+D para el análisis visual Archivado el 29 de septiembre de 2008 en Wayback Machine . Centro Nacional de Visualización y Análisis. p.30
  21. ^ ab "Stephen Few-Perceptual Edge-Seleccionando el gráfico correcto para su mensaje-2004" (PDF) . Archivado (PDF) desde el original el 5 de octubre de 2014 . Consultado el 8 de septiembre de 2014 .
  22. ^ "Diez ejemplos de visualizaciones de datos de mapas interactivos".
  23. ^ Engebretsen, Martín; Helen, Kennedy, eds. (2020-04-16). Visualización de datos en la sociedad. Nieuwe Prinsengracht 89 1018 VR Amsterdam Nederland: Amsterdam University Press. doi :10.5117/9789463722902_ch02. ISBN 978-90-485-4313-7.{{cite book}}: CS1 maint: location (link)
  24. ^ Vitaly Friedman (2008) "Visualización de datos e infografías" Archivado el 22 de julio de 2008 en Wayback Machine en: Graphics , Monday Inspiration, 14 de enero de 2008.
  25. ^ Viegas, Fernanda; Wattenberg, Martín (19 de abril de 2011). "Cómo hacer que los datos parezcan atractivos". CNN . Archivado desde el original el 6 de mayo de 2011 . Consultado el 7 de mayo de 2017 .
  26. ^ ab Frits H. Post, Gregory M. Nielson y Georges-Pierre Bonneau (2002). Visualización de datos: el estado del arte. Trabajo de investigación TU Delft, 2002. Archivado el 7 de octubre de 2009 en Wayback Machine .
  27. ^ Tukey, John (1977). Análisis exploratorio de datos . Addison-Wesley. ISBN 0-201-07616-0.
  28. ^ techatstate (7 de agosto de 2013). "Tech@State: Visualización de datos - Conferencia magistral del Dr. Edward Tufte". Archivado desde el original el 29 de marzo de 2017 . Consultado el 29 de noviembre de 2016 , a través de YouTube.
  29. ^ Cleveland, WS; McGill, R. (1985). "Percepción gráfica y métodos gráficos para el análisis de datos científicos". Ciencia . 229 (4716): 828–33. Código bibliográfico : 1985 Ciencia... 229..828C. doi : 10.1126/ciencia.229.4716.828. PMID  17777913. S2CID  16342041.
  30. ^ Tufte, Edward R. (1983). La visualización visual de información cuantitativa (2ª ed.). Cheshire, Connecticut, EE. UU.: Graphics Press LLC. ISBN 9780318029924.
  31. ^ abc Tufte, Edward (1983). La visualización visual de información cuantitativa. Cheshire, Connecticut: Prensa gráfica. ISBN 0-9613921-4-2. Archivado desde el original el 14 de enero de 2013 . Consultado el 10 de agosto de 2019 .
  32. ^ "Contar historias visuales sobre datos - Oficina de Presupuesto del Congreso". www.cbo.gov . Archivado desde el original el 4 de diciembre de 2014 . Consultado el 27 de noviembre de 2014 .
  33. ^ Buchanan, Larry; Letherby, Lauren (22 de junio de 2022). "¿Quién detiene a un 'chico malo con una pistola'?". Los New York Times . Archivado desde el original el 22 de junio de 2022. Fuente de datos: Centro avanzado de capacitación de respuesta rápida para el cumplimiento de la ley
  34. ^ "Matriz de selección de gráficos de bordes de Stephen Few-Perceptual" (PDF) . Archivado (PDF) desde el original el 5 de octubre de 2014 . Consultado el 8 de septiembre de 2014 .
  35. ^ ab "Steven Few: Aprovechando el poder de la percepción visual, septiembre de 2004" (PDF) . Archivado (PDF) desde el original el 5 de octubre de 2014 . Consultado el 8 de octubre de 2014 .
  36. ^ abc "Visualización de datos para la percepción humana". La Fundación de Diseño de Interacción . Archivado desde el original el 23 de noviembre de 2015 . Consultado el 23 de noviembre de 2015 .
  37. ^ "Visualización" (PDF) . SFU . Conferencia SFU. Archivado desde el original (PDF) el 22 de enero de 2016 . Consultado el 22 de noviembre de 2015 .
  38. ^ Graham, Fiona (17 de abril de 2012). "¿Pueden las imágenes detener la sobrecarga de datos?". Noticias de la BBC . Consultado el 30 de julio de 2020 .
  39. ^ G. Scott Owen (1999). Historia de la visualización Archivado el 8 de octubre de 2012 en Wayback Machine . Consultado el 19 de enero de 2010.
  40. ^ abc amigable, Michael (2008). "Una breve historia de la visualización de datos". Manual de visualización de datos . Springer-Verlag. págs. 15–56. doi :10.1007/978-3-540-33037-0_2. ISBN 9783540330370. S2CID  62626937.
  41. ^ Whitehouse, D. (9 de agosto de 2000). "Descubierto el mapa estelar de la Edad de Hielo". Noticias de la BBC . Archivado desde el original el 6 de enero de 2018 . Consultado el 20 de enero de 2018 .
  42. ^ Dragicevic, Pierre; Jansen, Yvonne (2012). "Lista de visualizaciones físicas y artefactos relacionados". Archivado desde el original el 13 de enero de 2018 . Consultado el 12 de enero de 2018 .
  43. ^ Jansen, Yvonne; Dragicevic, Pierre; Isenberg, Petra ; Alejandro, Jasón; Karnik, Abhijit; Kildal, Johan; Subramanian, Sriram; Hornbaek, Kasper (2015). "Oportunidades y desafíos para la fisicalización de datos". Actas de la 33ª Conferencia Anual de ACM sobre factores humanos en sistemas informáticos : 3227–3236. Archivado desde el original el 13 de enero de 2018 . Consultado el 12 de enero de 2018 .
  44. ^ ab Amistoso, Michael (2001). "Hitos en la historia de la cartografía temática, la gráfica estadística y la visualización de datos". Archivado desde el original el 14 de abril de 2014.
  45. ^ Funkhouser, Howard Gray (enero de 1936). "Una nota sobre un gráfico del siglo X". Osiris . 1 : 260–262. doi :10.1086/368425. JSTOR  301609. S2CID  144492131.
  46. ^ "Visualización de datos: definición, ejemplos, herramientas, consejos [guía 2020]". Consultoría en investigación de mercados . 2020-12-09 . Consultado el 9 de diciembre de 2020 .
  47. ^ Amistoso, Michael (2006). "Una breve historia de la visualización de datos" (PDF) . Universidad de York . Springer-Verlag. Archivado (PDF) desde el original el 8 de mayo de 2016 . Consultado el 22 de noviembre de 2015 .
  48. ^ "Nueva York tiene un nuevo campo de entrenamiento para científicos de datos: es gratis pero más difícil de ingresar que Harvard". Vencer Beat . Archivado desde el original el 15 de febrero de 2016 . Consultado el 21 de febrero de 2016 .
  49. ^ Visualización interactiva de datos
  50. ^ ab Bulmer, Michael (2013). Una introducción portátil al análisis de datos . Universidad de Queensland: Centro de publicación bajo demanda. págs. 4–5. ISBN 978-1-921723-10-0.
  51. ^ "Steven Few: selección del gráfico adecuado para su mensaje, septiembre de 2004" (PDF) . Archivado (PDF) desde el original el 5 de octubre de 2014 . Consultado el 8 de septiembre de 2014 .
  52. ^ Lengler, Ralph; Eppler, Martín. J. ​"Tabla periódica de métodos de visualización". www.visual-literacy.org. Archivado desde el original el 16 de marzo de 2013 . Consultado el 15 de marzo de 2013 .
  53. ^ Münzner, Tamara; Maguire, Eamonn (2015). Análisis y diseño de visualización . Serie de visualización de AK Peters. Boca Ratón Londres Nueva York: CRC Press. ISBN 978-1-4665-0891-0.
  54. ^ Kahn, Brian (17 de junio de 2019). "Esta sorprendente visualización del cambio climático ahora se puede personalizar para cualquier lugar de la Tierra". Gizmodo . Archivado desde el original el 26 de junio de 2019.Desarrollado en mayo de 2018 por Ed Hawkins , Universidad de Reading .
  55. ^ Mooney, Chris (11 de mayo de 2016). "Este científico acaba de cambiar nuestra forma de pensar sobre el cambio climático con un GIF". El Washington Post . Archivado desde el original el 6 de febrero de 2019. Ed Hawkins tomó estos datos de temperatura mensual y los trazó en forma de espiral, de modo que para cada año, hay doce puntos, uno para cada mes, alrededor del centro de un círculo, con temperaturas más cálidas más hacia afuera y temperaturas más frías más cerca hacia adentro.
  56. ^ Swayne, Débora (1999). "Introducción al número especial sobre análisis de datos gráficos interactivos: ¿Qué es la interacción?". Estadística Computacional . 14 (1): 1–6. doi :10.1007/PL00022700. S2CID  86788346.
  57. ^ Asociación Estadounidense de Estadística, Sección de Gráficos Estadísticos. "Biblioteca de préstamo de vídeos". Archivado desde el original el 2021-01-20 . Consultado el 17 de febrero de 2021 .
  58. ^ Michael amigable (2008). «Hitos en la historia de la cartografía temática, los gráficos estadísticos y la visualización de datos» Archivado el 11 de septiembre de 2008 en Wayback Machine .
  59. ^ "Visualización de datos: enfoques modernos" Archivado el 22 de julio de 2008 en Wayback Machine . en: Gráficos , 2 de agosto de 2007
  60. ^ Frits H. Post, Gregory M. Nielson y Georges-Pierre Bonneau (2002). Visualización de datos: el estado del arte Archivado el 7 de octubre de 2009 en Wayback Machine .
  61. ^ abcdef Berinato, Scott (junio de 2016). "Visualizaciones que realmente funcionan". Revisión de negocios de Harvard : 92–100.
  62. ^ Faisal, Sara; Blandford, Ana; Potts, Henry WW (2013). "Dar sentido a la información de salud personal: desafíos para la visualización de información" (PDF) . Revista de Informática en Salud . 19 (3): 198–217. doi :10.1177/1460458212465213. PMID  23981395. S2CID  3825148.
  63. ^ Kosara, Robert (11 de noviembre de 2013). "Una guía para la calidad de diferentes lugares de visualización". Ojos ansiosos . Consultado el 7 de abril de 2017 .

Otras lecturas

enlaces externos