Minería de datos educativa

Otro ejemplo son los sistema inteligentes de tutoría, que registran datos cada vez que un alumno presenta una solución a un problema; pueden recoger el momento de la presentación, si la solución coincide con la solución esperada, la cantidad de tiempo que ha pasado desde la última presentación, el orden en que se introdujeron en la interfaz los componentes de la solución, etc.

Estos análisis proporcionan nueva información que sería difícil de discernir fijándonos únicamente en los datos en bruto.

En el campo educativo, se han usado para pronosticar fracaso escolar y poner en práctica acciones que permitan evitarlo.

Esta evolución se inicia cuando toda la información y datos obtenidos se empiezan a almacenar en ordenadores, con continuas mejoras tanto en el acceso a los datos como en la tecnología.

Las relaciones descubiertas deben ser entonces validadas con el fin de evitar errores.

Las relaciones validadas se aplican para hacer predicciones eventos futuros en el ambiente de aprendizaje.

Durante las fases 3 y 4, los datos se visualizan de manera diseminada para facilitar la emisión del juicio humano.

Mucho se ha estudiado para llevar a cabo en las mejores visualizaciones de datos con este fin.

Por ejemplo, la curva de aprendizaje, clásica de los estudios educativos, es un patrón que refleja claramente la relación entre el aprendizaje y la experiencia a través del tiempo.

La clasificación ayuda a acelerar el desarrollo del modelo de predicción tremendamente.

[4]​ Cristóbal Romero y Sebastián Ventura[16]​ elaboraron una lista de aplicaciones primarias del EDM.

[18]​ Pese a que las predicciones y el mercado laboral demandan profesionales especializados en minería de datos, es una incógnita lo que puede suceder con dicho ámbito profesional en el futuro.

La ciencia de datos se encuentra en un estado de crecimiento muy alto, con una alta exigencia para dichos profesionales, lo que supone una gran inversión económica tanto a nivel formativo como laboral, tanto a nivel empresarial como en el ámbito concreto de la educación.

En particular, los datos de estos repositorios son totalmente válidos (ya que son datos reales sobre el rendimiento y aprendizaje de estudiantes reales, en ambientes educacionales, tomados en tareas de aprendizaje), y cada vez más fácilmente accesibles para comenzar una investigación.

Estos puntos permiten a los investigadores ahorrar mucho tiempo en tareas como la búsqueda de individuos (tales como escuelas, profesores y alumnos), organización de los estudios y recopilación de datos, ya que estos se encuentran directamente accesibles.

Aunque el uso de datos previamente recogidos limita los análisis a las cuestiones que conciernen a estos datos, una investigación previa puede resultar extremadamente útil para analizar cuestiones poco relacionadas con los datos tomados, como por ejemplo atributos de los estudiantes tales como comportamiento estratégico o motivación.

Gracias a esta faceta, muchos análisis se han podido repetir sobre distintos sistemas o contextos de aprendizaje.

Históricamente, ha sido muy difícil estudiar cómo las diferencias entre grupos de profesores o clases influencian en aspectos específicos del aprendizaje.