Una red neuronal óptica es una implementación física de una red neuronal artificial con componentes ópticos . Las primeras redes neuronales ópticas utilizaban un holograma de volumen fotorrefractivo para interconectar matrices de neuronas de entrada con matrices de salida con pesos sinápticos proporcionales a la fuerza del holograma multiplexado. [2] Los hologramas de volumen se multiplexaron aún más utilizando la quema de agujeros espectrales para agregar una dimensión de longitud de onda al espacio para lograr interconexiones de cuatro dimensiones de matrices bidimensionales de entradas y salidas neuronales. [3] Esta investigación condujo a una amplia investigación sobre métodos alternativos que utilizan la fuerza de la interconexión óptica para implementar comunicaciones neuronales. [4]
Algunas redes neuronales artificiales que se han implementado como redes neuronales ópticas incluyen la red neuronal de Hopfield [5] y el mapa autoorganizado de Kohonen con moduladores de luz espacial de cristal líquido [6]. Las redes neuronales ópticas también pueden basarse en los principios de la ingeniería neuromórfica , creando sistemas fotónicos neuromórficos . Por lo general, estos sistemas codifican información en las redes utilizando picos, imitando la funcionalidad de las redes neuronales de picos en hardware óptico y fotónico. Los dispositivos fotónicos que han demostrado funcionalidades neuromórficas incluyen (entre otros) láseres emisores de superficie de cavidad vertical , [7] [8] moduladores fotónicos integrados, [9] sistemas optoelectrónicos basados en uniones Josephson superconductoras [10] o sistemas basados en diodos de tunelaje resonantes . [11]
Las redes neuronales biológicas funcionan sobre una base electroquímica, mientras que las redes neuronales ópticas utilizan ondas electromagnéticas. Las interfaces ópticas para redes neuronales biológicas se pueden crear con optogenética , pero no es lo mismo que una red neuronal óptica. En las redes neuronales biológicas existen muchos mecanismos diferentes para cambiar dinámicamente el estado de las neuronas, estos incluyen plasticidad sináptica a corto y largo plazo . La plasticidad sináptica es uno de los fenómenos electrofisiológicos utilizados para controlar la eficiencia de la transmisión sináptica, a largo plazo para el aprendizaje y la memoria, y a corto plazo para cambios transitorios cortos en la eficiencia de la transmisión sináptica. Implementar esto con componentes ópticos es difícil, e idealmente requiere materiales fotónicos avanzados. Las propiedades que podrían ser deseables en los materiales fotónicos para redes neuronales ópticas incluyen la capacidad de cambiar su eficiencia de transmisión de luz, en función de la intensidad de la luz entrante.
Con la creciente importancia de la visión artificial en varios dominios, el costo computacional de estas tareas ha aumentado, haciendo más importante el desarrollo de nuevos enfoques para la aceleración del procesamiento. La computación óptica ha surgido como una alternativa potencial a la aceleración de GPU para las redes neuronales modernas, particularmente considerando la inminente obsolescencia de la Ley de Moore. En consecuencia, las redes neuronales ópticas han ganado una mayor atención en la comunidad de investigación. Actualmente, se están investigando dos métodos principales de computación neuronal óptica: la fotónica de silicio y la óptica de espacio libre. Cada enfoque tiene sus ventajas y desventajas; si bien la fotónica de silicio puede ofrecer una velocidad superior, carece del paralelismo masivo que puede ofrecer la óptica de espacio libre. Dadas las importantes capacidades de paralelismo de la óptica de espacio libre, los investigadores se han centrado en aprovecharlas. Una implementación, propuesta por Lin et al., [12] implica el entrenamiento y la fabricación de máscaras de fase para un clasificador de dígitos escritos a mano. Al apilar máscaras de fase impresas en 3D, la luz que pasa a través de la red fabricada puede ser leída por una matriz de fotodetectores de diez detectores, cada uno representando una clase de dígito que va del 1 al 10. Aunque esta red puede lograr una clasificación en el rango de terahercios, carece de flexibilidad, ya que las máscaras de fase se fabrican para una tarea específica y no se pueden volver a entrenar. Un método alternativo para la clasificación en óptica de espacio libre, introducido por Cahng et al., [13] emplea un sistema 4F que se basa en el teorema de convolución para realizar operaciones de convolución. Este sistema utiliza dos lentes para ejecutar las transformadas de Fourier de la operación de convolución, lo que permite la conversión pasiva al dominio de Fourier sin consumo de energía ni latencia. Sin embargo, los núcleos de la operación de convolución en esta implementación también son máscaras de fase fabricadas, lo que limita la funcionalidad del dispositivo solo a capas convolucionales específicas de la red. Por el contrario, Li et al. [14] propuso una técnica que implica el teselado de núcleos para utilizar el paralelismo del sistema 4F mientras se utiliza un dispositivo de microespejos digitales (DMD) en lugar de una máscara de fase. Este enfoque permite a los usuarios cargar varios núcleos en el sistema 4F y ejecutar la inferencia de toda la red en un solo dispositivo. Desafortunadamente, las redes neuronales modernas no están diseñadas para los sistemas 4F, ya que se desarrollaron principalmente durante la era de la CPU/GPU. Principalmente porque tienden a utilizar una resolución más baja y una gran cantidad de canales en sus mapas de características.
En 2007 existía un modelo de red neuronal óptica: la computadora analógica/de matriz óptica programable (POAC, por sus siglas en inglés). Se había implementado en el año 2000 y se informó que se basaba en el correlador de transformada conjunta de Fourier (JTC, por sus siglas en inglés) modificado y la bacteriorrodopsina (BR, por sus siglas en inglés) como memoria óptica holográfica. El paralelismo total, el gran tamaño de la matriz y la velocidad de la luz son tres promesas que ofrece la POAC para implementar una CNN óptica. Se han investigado durante los últimos años con sus limitaciones y consideraciones prácticas que dieron como resultado el diseño de la primera versión portátil de la POAC.
Los detalles prácticos (hardware (configuraciones ópticas) y software (plantillas ópticas)) ya se han publicado. Sin embargo, POAC es una computadora de matriz programable y de propósito general que tiene una amplia gama de aplicaciones, entre las que se incluyen:
Taichi, de la Universidad Tsinghua de Pekín, es una red neuronal convolucional híbrida que combina la eficiencia energética y el paralelismo de la difracción óptica con la configurabilidad de la interferencia óptica. Taichi ofrece 13,96 millones de parámetros. Taichi evita las altas tasas de error que afectan a las redes profundas (multicapa) combinando grupos de unidades difractivas de menos capas con conjuntos de interferómetros para un cálculo reconfigurable. Su protocolo de codificación divide los modelos de red grandes en submodelos que se pueden distribuir en varios chiplets en paralelo. [15]
Taichi logró una precisión del 91,89% en las pruebas con la base de datos Omniglot . También se utilizó para generar música de Bach y generar imágenes de los estilos de Van Gogh y Munch . [15]
Los desarrolladores afirmaron una eficiencia energética de hasta 160 billones de operaciones segundo -1 vatio -1 y una eficiencia de área de 880 billones de operaciones de acumulación múltiple mm -2 o 10 3 más eficiente energéticamente que el NVIDIA H100 , y 10 2 veces más eficiente energéticamente y 10 veces más eficiente en área que las ONN anteriores. [15]