La máquina de Helmholtz (nombrada en honor a Hermann von Helmholtz y su concepto de energía libre de Helmholtz ) es un tipo de red neuronal artificial que puede explicar la estructura oculta de un conjunto de datos al ser entrenada para crear un modelo generativo del conjunto original de datos. [1] La esperanza es que al aprender representaciones económicas de los datos, la estructura subyacente del modelo generativo se aproxime razonablemente a la estructura oculta del conjunto de datos. Una máquina de Helmholtz contiene dos redes, una red de reconocimiento de abajo hacia arriba que toma los datos como entrada y produce una distribución sobre las variables ocultas, y una red "generativa" de arriba hacia abajo que genera valores de las variables ocultas y los datos en sí. En ese momento, las máquinas de Helmholtz eran una de las pocas arquitecturas de aprendizaje que usaban retroalimentación y retroalimentación para garantizar la calidad de los modelos aprendidos. [2]
Las máquinas de Helmholtz se suelen entrenar utilizando un algoritmo de aprendizaje no supervisado , como el algoritmo de vigilia-sueño . [3] Son un precursor de los autocodificadores variacionales , que en cambio se entrenan utilizando retropropagación . Las máquinas de Helmholtz también se pueden utilizar en aplicaciones que requieren un algoritmo de aprendizaje supervisado (por ejemplo, reconocimiento de caracteres o reconocimiento invariante de posición de un objeto dentro de un campo).