stringtranslate.com

Perforación de datos

La exploración de datos (también desglose ) se refiere a cualquiera de las diversas operaciones y transformaciones en datos tabulares, relacionales y multidimensionales. El término tiene un uso generalizado en diversos contextos, pero se asocia principalmente con software especializado diseñado específicamente para el análisis de datos .

Operaciones comunes de perforación de datos

Hay ciertas operaciones que son comunes a las aplicaciones que permiten la exploración de datos. Entre ellos están:

Operaciones de consulta :

consulta tabular

Las operaciones de consulta tabular consisten en operaciones estándar en tablas de datos.

Entre estas operaciones se encuentran:

Considere el siguiente ejemplo:

Mesa Fred y Wilma (Fig 001) :

 género, fname, lname, hogar masculino, fred, chopin, Polonia masculino, fred, picapiedra, base masculino, fred, durst, estados unidos mujer, wilma, picapiedra, base estados unidos, hembra, rudolph, wilma estados unidos, hembra, wilma webb estados unidos, masculino, fred johnson

Lo anterior es un ejemplo de una tabla de archivo sin formato simple formateada como valores separados por comas. La tabla incluye nombre, apellido, sexo y país de origen de varias personas llamadas fred o wilma. Aunque el ejemplo tiene el formato de esta manera, es importante enfatizar que las operaciones de consulta tabular (así como todas las operaciones de exploración de datos) se pueden aplicar a cualquier tipo de datos imaginable , independientemente del formato subyacente. El único requisito es que los datos sean legibles por la aplicación de software en uso.

consulta dinámica

Una consulta dinámica permite múltiples representaciones de datos según diferentes dimensiones. Este tipo de consulta es similar a la consulta tabular, excepto que también permite representar los datos en formato de resumen, según una jerarquía flexible seleccionada por el usuario . Esta clase de operación de exploración de datos se conoce formalmente (y vagamente) con diferentes nombres, que incluyen consulta cruzada , tabla dinámica , piloto de datos , jerarquía selectiva , intertwingularidad y otros.

Para ilustrar los conceptos básicos de las operaciones de consulta dinámica, considere la tabla de Fred y Wilma (Fig. 001) . Un análisis rápido de los datos revela que la tabla tiene información redundante. Esta redundancia podría consolidarse mediante un esquema o una estructura de árbol o de alguna otra forma. Además, una vez consolidados, los datos podrían tener muchos diseños alternativos diferentes.

Utilizando un esquema de texto simple como resultado, los siguientes diseños alternativos son posibles con una consulta dinámica:

Resumir por género (Fig 001) :

 femenino picapiedra, wilma rudolf, wilma webb, wilma masculino chopin, fred picapiedra, fred valentía, fred johnson, fred  (Dimensiones = género; Campos tabulares = lname, fname;)

Resumir por casa, nombre (Fig 001) :

 base Picapiedra fred wilma Polonia chopin fred EE.UU ...  (Dimensiones = inicio, nombre; campos tabulares = nombre;)

Usos

Las operaciones de consulta dinámica son útiles para resumir un corpus de datos de múltiples maneras, ilustrando así diferentes representaciones de la misma información básica. Aunque este tipo de operación aparece de manera destacada en hojas de cálculo y software de bases de datos de escritorio , podría decirse que su flexibilidad está infrautilizada. Hay muchas aplicaciones que permiten sólo una jerarquía "fija" para representar datos, y esto representa una limitación sustancial.

Exploración

El desglose es lo opuesto al desglose. Por ejemplo, si realiza un análisis detallado para ver los ingresos de un producto, es posible que desee realizar un análisis detallado para ver los ingresos de todos los productos. [1]

Referencias

  1. ^ "Profundizando y profundizando". IBM . 4 de julio de 2018 . Consultado el 5 de mayo de 2020 .