: Exploratory data analysis) es el tratamiento estadístico al que se someten las muestras recogidas durante un proceso de investigación en cualquier campo científico.
Los E.D.A., no necesariamente, se llevan a cabo con una base de datos al uso, ni con una hoja de cálculo convencional; no obstante el programa SPSS y los lenguajes de programación R y Python son las aplicaciones más utilizadas, aunque no las únicas.
Los cálculos estadísticos orientan sobre la fiabilidad de las muestras usadas, aunque no son infalibles, e indican si los resultados obtenidos al calcular las pruebas inferenciales son aceptables, es lo que llamamos nivel de confianza (se debe procurar que este nunca sea inferior al 95% = 0,95).
Este proceso nos es útil también al revisar la descripción de los datos para comprender lo que significa cada característica.
Existen varias actividades al hacer un análisis exploratorio de datos pero en cuanto a la minería de datos los puntos clave que se deben realizar son: Si realizamos de forma correcta los pasos nos facilitaremos el modo de abordar esos datos sin dejar a un lado el objetivo o el propósito para el cual los necesitamos.