La máquina Helmholtz (llamada así por Hermann von Helmholtz y su concepto de energía libre de Helmholtz ) es un tipo de red neuronal artificial que puede explicar la estructura oculta de un conjunto de datos al ser entrenada para crear un modelo generativo del conjunto de datos original. . [1] La esperanza es que al aprender representaciones económicas de los datos, la estructura subyacente del modelo generativo debería aproximarse razonablemente a la estructura oculta del conjunto de datos. Una máquina Helmholtz contiene dos redes, una red de reconocimiento ascendente que toma los datos como entrada y produce una distribución sobre variables ocultas, y una red "generativa" de arriba hacia abajo que genera valores de las variables ocultas y los datos mismos. En ese momento, las máquinas Helmholtz eran una de las pocas arquitecturas de aprendizaje que utilizaban retroalimentación y avance para garantizar la calidad de los modelos aprendidos. [2]
Las máquinas Helmholtz suelen entrenarse mediante un algoritmo de aprendizaje no supervisado , como el algoritmo vigilia-sueño . [3] Son un precursor de los codificadores automáticos variacionales , que en cambio se entrenan mediante retropropagación . Las máquinas Helmholtz también se pueden utilizar en aplicaciones que requieren un algoritmo de aprendizaje supervisado (por ejemplo, reconocimiento de caracteres o reconocimiento de posición invariante de un objeto dentro de un campo).