La codificación neuronal (o representación neuronal ) es un campo de la neurociencia que se ocupa de caracterizar la relación hipotética entre el estímulo y las respuestas neuronales, y la relación entre las actividades eléctricas de las neuronas en el conjunto . [1] [2] Basándose en la teoría de que la información sensorial y de otro tipo está representada en el cerebro por redes de neuronas , se cree que las neuronas pueden codificar tanto información digital como analógica . [3]
Las neuronas tienen una capacidad poco común entre las células del cuerpo para propagar señales rápidamente a grandes distancias mediante la generación de pulsos eléctricos característicos llamados potenciales de acción : picos de voltaje que pueden viajar por los axones. Las neuronas sensoriales cambian sus actividades disparando secuencias de potenciales de acción en varios patrones temporales, con la presencia de estímulos sensoriales externos, como la luz , el sonido , el gusto , el olfato y el tacto . La información sobre el estímulo se codifica en este patrón de potenciales de acción y se transmite hacia el cerebro y alrededor de él. Más allá de esto, las neuronas especializadas, como las de la retina, pueden comunicar más información a través de potenciales graduados . Estos se diferencian de los potenciales de acción porque la información sobre la fuerza de un estímulo se correlaciona directamente con la fuerza de la salida de las neuronas. La señal decae mucho más rápido para los potenciales graduados, lo que requiere distancias cortas entre neuronas y una alta densidad neuronal. La ventaja de los potenciales graduados es que tienen tasas de información más altas capaces de codificar más estados (es decir, mayor fidelidad) que las neuronas de picos. [4]
Aunque los potenciales de acción pueden variar un poco en duración, amplitud y forma, por lo general se los trata como eventos estereotipados idénticos en los estudios de codificación neuronal. Si se ignora la breve duración de un potencial de acción (alrededor de 1 ms), una secuencia de potenciales de acción, o tren de picos, se puede caracterizar simplemente por una serie de eventos puntuales de todo o nada en el tiempo. [5] Las longitudes de los intervalos entre picos ( ISI ) entre dos picos sucesivos en un tren de picos a menudo varían, aparentemente de manera aleatoria. [6] El estudio de la codificación neuronal implica medir y caracterizar cómo los atributos del estímulo, como la intensidad de la luz o el sonido, o las acciones motoras, como la dirección de un movimiento del brazo, están representados por potenciales de acción o picos neuronales. Para describir y analizar la activación neuronal, se han aplicado ampliamente métodos estadísticos y métodos de teoría de la probabilidad y procesos puntuales estocásticos .
Con el desarrollo de tecnologías de grabación y decodificación neuronal a gran escala, los investigadores han comenzado a descifrar el código neuronal y ya han proporcionado el primer vistazo al código neuronal en tiempo real a medida que se forma y se recuerda la memoria en el hipocampo, una región del cerebro conocida por ser central para la formación de la memoria. [7] [8] [9] Los neurocientíficos han iniciado varios proyectos de decodificación cerebral a gran escala. [10] [11]
El vínculo entre estímulo y respuesta puede estudiarse desde dos puntos de vista opuestos. La codificación neuronal se refiere al mapa que va del estímulo a la respuesta. El objetivo principal es comprender cómo responden las neuronas a una amplia variedad de estímulos y construir modelos que intenten predecir las respuestas a otros estímulos. La descodificación neuronal se refiere al mapa inverso, que va de la respuesta al estímulo, y el desafío consiste en reconstruir un estímulo, o ciertos aspectos de ese estímulo, a partir de las secuencias de picos que evoca.
Una secuencia o "tren" de picos puede contener información basada en diferentes esquemas de codificación. En algunas neuronas, la fuerza con la que responde un compañero postsináptico puede depender únicamente de la "tasa de activación", el número promedio de picos por unidad de tiempo (un "código de frecuencia"). En el otro extremo, un " código temporal " complejo se basa en la sincronización precisa de los picos individuales. Pueden estar vinculados a un estímulo externo, como en el sistema visual [12] y auditivo , o ser generados intrínsecamente por el circuito neuronal. [13]
Si las neuronas utilizan codificación de velocidad o codificación temporal es un tema de intenso debate dentro de la comunidad de la neurociencia, aunque no existe una definición clara de lo que significan estos términos. [14]
El modelo de codificación de la velocidad de la comunicación neuronal establece que a medida que aumenta la intensidad de un estímulo, aumenta la frecuencia o velocidad de los potenciales de acción , o "disparos de picos". La codificación de la velocidad a veces se denomina codificación de frecuencia.
La codificación de frecuencia es un esquema de codificación tradicional que asume que la mayor parte, si no toda, la información sobre el estímulo está contenida en la frecuencia de disparo de la neurona. Debido a que la secuencia de potenciales de acción generados por un estímulo dado varía de un ensayo a otro, las respuestas neuronales suelen tratarse estadística o probabilísticamente. Pueden caracterizarse por frecuencias de disparo, en lugar de como secuencias de picos específicos. En la mayoría de los sistemas sensoriales, la frecuencia de disparo aumenta, generalmente de manera no lineal, con el aumento de la intensidad del estímulo. [15] Bajo un supuesto de codificación de frecuencia, se ignora cualquier información posiblemente codificada en la estructura temporal del tren de picos. En consecuencia, la codificación de frecuencia es ineficiente pero muy robusta con respecto al " ruido " de ISI. [6]
Durante la codificación de frecuencia, calcular con precisión la frecuencia de disparo es muy importante. De hecho, el término "frecuencia de disparo" tiene varias definiciones diferentes, que hacen referencia a distintos procedimientos de promediado, como un promedio a lo largo del tiempo (frecuencia como recuento de picos de una sola neurona) o un promedio a lo largo de varias repeticiones (frecuencia de PSTH) del experimento.
En la codificación de velocidad, el aprendizaje se basa en modificaciones del peso sináptico dependientes de la actividad.
La codificación de frecuencia fue demostrada originalmente por Edgar Adrian e Yngve Zotterman en 1926. [16] En este sencillo experimento se colgaron diferentes pesos de un músculo . A medida que aumentaba el peso del estímulo, también aumentaba el número de picos registrados de los nervios sensoriales que inervaban el músculo. A partir de estos experimentos originales, Adrian y Zotterman concluyeron que los potenciales de acción eran eventos unitarios y que la frecuencia de los eventos, y no la magnitud de cada uno de ellos, era la base de la mayor parte de la comunicación interneuronal.
En las décadas siguientes, la medición de las tasas de activación se convirtió en una herramienta estándar para describir las propiedades de todos los tipos de neuronas sensoriales o corticales , en parte debido a la relativa facilidad de medir las tasas experimentalmente. Sin embargo, este enfoque descuida toda la información que posiblemente contenga el momento exacto en que se producen los picos. Durante los últimos años, cada vez hay más evidencia experimental que sugiere que un concepto sencillo de tasa de activación basado en un promedio temporal puede ser demasiado simplista para describir la actividad cerebral. [6]
La tasa de conteo de picos, también denominada promedio temporal, se obtiene contando el número de picos que aparecen durante una prueba y dividiéndolos por la duración de la prueba. [14] La longitud T de la ventana de tiempo la establece el experimentador y depende del tipo de neurona registrada desde y hacia el estímulo. En la práctica, para obtener promedios razonables, deben ocurrir varios picos dentro de la ventana de tiempo. Los valores típicos son T = 100 ms o T = 500 ms, pero la duración también puede ser mayor o menor (Capítulo 1.5 en el libro de texto 'Spiking Neuron Models' [14] ).
La tasa de recuento de picos se puede determinar a partir de un único ensayo, pero a costa de perder toda resolución temporal sobre las variaciones en la respuesta neuronal durante el transcurso del ensayo. El promedio temporal puede funcionar bien en casos en los que el estímulo es constante o varía lentamente y no requiere una reacción rápida del organismo , y esta es la situación que se encuentra habitualmente en los protocolos experimentales. Sin embargo, la entrada del mundo real no es estacionaria, sino que a menudo cambia en una escala de tiempo rápida. Por ejemplo, incluso cuando se ve una imagen estática, los humanos realizan movimientos sacádicos , cambios rápidos de la dirección de la mirada. La imagen proyectada sobre los fotorreceptores de la retina cambia, por tanto, cada pocos cientos de milisegundos (Capítulo 1.5 en [14] ).
A pesar de sus deficiencias, el concepto de código de tasa de conteo de picos se utiliza ampliamente no solo en experimentos, sino también en modelos de redes neuronales . Ha llevado a la idea de que una neurona transforma la información sobre una única variable de entrada (la intensidad del estímulo) en una única variable de salida continua (la tasa de activación).
Cada vez hay más pruebas de que, al menos en las neuronas de Purkinje , la información no se codifica simplemente en la activación, sino también en el momento y la duración de los períodos de inactividad sin activación. [17] [18] También hay pruebas de las células de la retina de que la información se codifica no solo en la tasa de activación, sino también en el momento de las espigas. [19] De manera más general, siempre que se requiere una respuesta rápida de un organismo, una tasa de activación definida como un recuento de espigas durante unos pocos cientos de milisegundos es simplemente demasiado lenta. [14]
La tasa de disparo dependiente del tiempo se define como el número promedio de picos (promediado en ensayos) que aparecen durante un intervalo corto entre los tiempos t y t+Δt, dividido por la duración del intervalo. [14] Funciona tanto para estímulos estacionarios como para estímulos dependientes del tiempo. Para medir experimentalmente la tasa de disparo dependiente del tiempo, el experimentador registra desde una neurona mientras estimula con alguna secuencia de entrada. La misma secuencia de estimulación se repite varias veces y la respuesta neuronal se informa en un histograma de tiempo periestímulo (PSTH). El tiempo t se mide con respecto al inicio de la secuencia de estimulación. El Δt debe ser lo suficientemente grande (normalmente en el rango de uno o unos pocos milisegundos) para que haya una cantidad suficiente de picos dentro del intervalo para obtener una estimación confiable del promedio. La cantidad de ocurrencias de picos n K (t; t+Δt) sumada a lo largo de todas las repeticiones del experimento dividida por la cantidad K de repeticiones es una medida de la actividad típica de la neurona entre el tiempo t y t+Δt. Una división adicional por la longitud del intervalo Δt produce la tasa de activación dependiente del tiempo r(t) de la neurona, que es equivalente a la densidad de picos de PSTH (Capítulo 1.5 en [14] ).
Para un Δt suficientemente pequeño, r(t)Δt es el número promedio de picos que ocurren entre los tiempos t y t+Δt a lo largo de múltiples ensayos. Si Δt es pequeño, nunca habrá más de un pico dentro del intervalo entre t y t+Δt en cualquier ensayo dado. Esto significa que r(t)Δt es también la fracción de ensayos en los que ocurrió un pico entre esos tiempos. Equivalentemente, r(t)Δt es la probabilidad de que ocurra un pico durante este intervalo de tiempo.
Como procedimiento experimental, la medición de la tasa de activación dependiente del tiempo es un método útil para evaluar la actividad neuronal, en particular en el caso de estímulos dependientes del tiempo. El problema obvio con este enfoque es que no puede ser el esquema de codificación utilizado por las neuronas en el cerebro. Las neuronas no pueden esperar a que los estímulos se presenten repetidamente de exactamente la misma manera antes de generar una respuesta. [14]
Sin embargo, la medición experimental de la tasa de activación dependiente del tiempo puede tener sentido si hay grandes poblaciones de neuronas independientes que reciben el mismo estímulo. En lugar de registrar a partir de una población de N neuronas en una sola ejecución, es experimentalmente más fácil registrar a partir de una sola neurona y hacer un promedio de N ejecuciones repetidas. Por lo tanto, la codificación de la tasa de activación dependiente del tiempo se basa en el supuesto implícito de que siempre hay poblaciones de neuronas.
Cuando se descubre que la sincronización precisa de los picos o las fluctuaciones de alta frecuencia en la tasa de disparo transmiten información, el código neuronal se identifica a menudo como un código temporal. [14] [20] Varios estudios han descubierto que la resolución temporal del código neuronal está en una escala de tiempo de milisegundos, lo que indica que la sincronización precisa de los picos es un elemento significativo en la codificación neuronal. [3] [21] [19] Dichos códigos, que se comunican a través del tiempo entre picos, también se conocen como códigos de intervalo entre pulsos y han sido respaldados por estudios recientes. [22]
Las neuronas presentan fluctuaciones de alta frecuencia en sus tasas de activación, que podrían ser ruido o podrían transmitir información. Los modelos de codificación de frecuencia sugieren que estas irregularidades son ruido, mientras que los modelos de codificación temporal sugieren que codifican información. Si el sistema nervioso solo utilizara códigos de frecuencia para transmitir información, una tasa de activación más consistente y regular habría sido evolutivamente ventajosa, y las neuronas habrían utilizado este código en lugar de otras opciones menos robustas. [23] La codificación temporal proporciona una explicación alternativa para el “ruido”, sugiriendo que en realidad codifica información y afecta el procesamiento neuronal. Para modelar esta idea, se pueden utilizar símbolos binarios para marcar los picos: 1 para un pico, 0 para ningún pico. La codificación temporal permite que la secuencia 000111000111 signifique algo diferente de 001100110011, aunque la tasa de activación media es la misma para ambas secuencias, 6 picos/10 ms. [24]
Hasta hace poco, los científicos habían puesto el mayor énfasis en la codificación de la velocidad como explicación de los patrones de potencial postsináptico . Sin embargo, las funciones del cerebro son más precisas temporalmente de lo que parece permitir el uso exclusivo de la codificación de la velocidad. [19] En otras palabras, podría perderse información esencial debido a la incapacidad del código de velocidad para capturar toda la información disponible del tren de picos. Además, las respuestas son lo suficientemente diferentes entre estímulos similares (pero no idénticos) como para sugerir que los distintos patrones de picos contienen un mayor volumen de información del que es posible incluir en un código de velocidad. [25]
Los códigos temporales (también llamados códigos de pico [14] ), emplean aquellas características de la actividad de pico que no pueden describirse por la tasa de disparo. Por ejemplo, el tiempo hasta el primer pico después del inicio del estímulo, la fase de disparo con respecto a las oscilaciones de fondo, las características basadas en el segundo y mayores momentos estadísticos de la distribución de probabilidad ISI , la aleatoriedad de los picos o los grupos de picos cronometrados con precisión ( patrones temporales ) son candidatos para códigos temporales. [26] Como no hay una referencia temporal absoluta en el sistema nervioso, la información se transporta en términos del tiempo relativo de los picos en una población de neuronas (patrones temporales) o con respecto a una oscilación cerebral en curso (fase de disparo). [3] [6] Una forma en que se decodifican los códigos temporales, en presencia de oscilaciones neuronales , es que los picos que ocurren en fases específicas de un ciclo oscilatorio son más efectivos para despolarizar la neurona postsináptica . [27]
La estructura temporal de un tren de picos o la tasa de disparos evocada por un estímulo está determinada tanto por la dinámica del estímulo como por la naturaleza del proceso de codificación neuronal. Los estímulos que cambian rápidamente tienden a generar picos sincronizados con precisión [28] (y tasas de disparo que cambian rápidamente en los PSTH) sin importar qué estrategia de codificación neuronal se esté utilizando. La codificación temporal en sentido estricto se refiere a la precisión temporal en la respuesta que no surge únicamente de la dinámica del estímulo, sino que, sin embargo, se relaciona con las propiedades del estímulo. La interacción entre el estímulo y la dinámica de codificación dificulta la identificación de un código temporal.
En la codificación temporal, el aprendizaje puede explicarse por modificaciones del retraso sináptico dependientes de la actividad. [29] Las modificaciones pueden depender no solo de las tasas de picos (codificación de tasa) sino también de los patrones de tiempo de los picos (codificación temporal), es decir, pueden ser un caso especial de plasticidad dependiente del tiempo de los picos . [30]
La cuestión de la codificación temporal es distinta e independiente de la cuestión de la codificación de picos independientes. Si cada pico es independiente de todos los demás picos del tren, el carácter temporal del código neuronal está determinado por el comportamiento de la tasa de disparo dependiente del tiempo r(t). Si r(t) varía lentamente con el tiempo, el código se denomina típicamente código de tasa, y si varía rápidamente, el código se denomina código temporal.
En el caso de estímulos muy breves, la frecuencia máxima de disparo de una neurona puede no ser lo suficientemente rápida como para producir más de una única punta. Debido a la densidad de información sobre el estímulo abreviado contenido en esta única punta, parecería que el momento de la punta en sí tendría que transmitir más información que simplemente la frecuencia promedio de los potenciales de acción durante un período de tiempo determinado. Este modelo es especialmente importante para la localización del sonido , que ocurre dentro del cerebro en el orden de milisegundos. El cerebro debe obtener una gran cantidad de información en función de una respuesta neuronal relativamente corta. Además, si las bajas tasas de disparo del orden de diez puntas por segundo deben distinguirse de la codificación de frecuencia arbitrariamente cercana para diferentes estímulos, entonces una neurona que intente discriminar estos dos estímulos puede necesitar esperar un segundo o más para acumular suficiente información. Esto no es consistente con numerosos organismos que son capaces de discriminar entre estímulos en el marco de tiempo de milisegundos, lo que sugiere que un código de frecuencia no es el único modelo en funcionamiento. [24]
Para explicar la rápida codificación de los estímulos visuales, se ha sugerido que las neuronas de la retina codifican la información visual en el tiempo de latencia entre el inicio del estímulo y el primer potencial de acción, también llamado latencia hasta el primer pico o tiempo hasta el primer pico. [31] Este tipo de codificación temporal también se ha demostrado en el sistema auditivo y somatosensorial. El principal inconveniente de este esquema de codificación es su sensibilidad a las fluctuaciones neuronales intrínsecas. [32] En la corteza visual primaria de los macacos, se descubrió que el momento del primer pico en relación con el inicio del estímulo proporcionaba más información que el intervalo entre picos. Sin embargo, el intervalo entre picos podría usarse para codificar información adicional, lo que es especialmente importante cuando la tasa de picos alcanza su límite, como en situaciones de alto contraste. Por esta razón, la codificación temporal puede desempeñar un papel en la codificación de bordes definidos en lugar de transiciones graduales. [33]
El sistema gustativo de los mamíferos es útil para estudiar la codificación temporal debido a sus estímulos bastante distintos y a las respuestas fácilmente discernibles del organismo. [34] La información codificada temporalmente puede ayudar a un organismo a discriminar entre diferentes saborizantes de la misma categoría (dulce, amargo, ácido, salado, umami) que provocan respuestas muy similares en términos de recuento de picos. El componente temporal del patrón provocado por cada saborizante puede utilizarse para determinar su identidad (por ejemplo, la diferencia entre dos saborizantes amargos, como la quinina y el denatonio). De esta manera, tanto la codificación de velocidad como la codificación temporal pueden utilizarse en el sistema gustativo: la velocidad para el tipo básico de saborizante, la temporal para una diferenciación más específica. [35]
Las investigaciones sobre el sistema gustativo de los mamíferos han demostrado que existe una gran cantidad de información presente en patrones temporales en poblaciones de neuronas, y esta información es diferente de la que se determina mediante esquemas de codificación de frecuencia. Los grupos de neuronas pueden sincronizarse en respuesta a un estímulo. En estudios que se ocuparon de la porción cortical frontal del cerebro en primates, se encontraron patrones precisos con escalas de tiempo cortas de solo unos pocos milisegundos de duración en pequeñas poblaciones de neuronas que se correlacionaban con ciertas conductas de procesamiento de información. Sin embargo, se pudo determinar poca información a partir de los patrones; una posible teoría es que representan el procesamiento de orden superior que tiene lugar en el cerebro. [25]
Al igual que en el sistema visual, en las células mitrales/en penacho del bulbo olfatorio de ratones, la latencia de la primera espiga relativa al inicio de una acción de olfateo parecía codificar gran parte de la información sobre un olor. Esta estrategia de utilizar la latencia de la espiga permite una rápida identificación y reacción ante un odorante. Además, algunas células mitrales/en penacho tienen patrones de activación específicos para determinados odorantes. Este tipo de información adicional podría ayudar a reconocer un determinado olor, pero no es completamente necesario, ya que el recuento medio de espigas a lo largo del olfateo del animal también fue un buen identificador. [36] En la misma línea, los experimentos realizados con el sistema olfativo de conejos mostraron patrones distintos que se correlacionaban con diferentes subconjuntos de odorantes, y se obtuvo un resultado similar en experimentos con el sistema olfativo de la langosta. [24]
La especificidad de la codificación temporal requiere una tecnología muy refinada para medir datos experimentales fiables e informativos. Los avances realizados en optogenética permiten a los neurólogos controlar los picos en neuronas individuales, ofreciendo una resolución eléctrica y espacial de una sola célula. Por ejemplo, la luz azul hace que el canal iónico controlado por luz canalrodopsina se abra, despolarizando la célula y produciendo un pico. Cuando la célula no detecta la luz azul, el canal se cierra y la neurona deja de producir picos. El patrón de los picos coincide con el patrón de los estímulos de luz azul. Al insertar secuencias del gen de la canalrodopsina en el ADN del ratón, los investigadores pueden controlar los picos y, por lo tanto, ciertos comportamientos del ratón (por ejemplo, hacer que el ratón gire a la izquierda). [37] Los investigadores, a través de la optogenética, tienen las herramientas para efectuar diferentes códigos temporales en una neurona mientras mantienen la misma tasa de disparo promedio, y por lo tanto pueden probar si la codificación temporal ocurre o no en circuitos neuronales específicos. [38]
La tecnología optogenética también tiene el potencial de permitir la corrección de anomalías en las puntas que son la raíz de varios trastornos neurológicos y psicológicos. [38] Si las neuronas codifican información en patrones de sincronización de puntas individuales, se podrían pasar por alto señales clave al intentar descifrar el código mientras se observan solo las tasas de disparo promedio. [24] Comprender cualquier aspecto codificado temporalmente del código neuronal y replicar estas secuencias en neuronas podría permitir un mayor control y tratamiento de trastornos neurológicos como la depresión , la esquizofrenia y la enfermedad de Parkinson . La regulación de los intervalos de las puntas en células individuales controla la actividad cerebral con mayor precisión que la adición de agentes farmacológicos por vía intravenosa. [37]
El código de fase de disparo es un esquema de codificación neuronal que combina el código de conteo de picos con una referencia de tiempo basada en oscilaciones . Este tipo de código tiene en cuenta una etiqueta de tiempo para cada pico de acuerdo con una referencia de tiempo basada en la fase de oscilaciones locales en curso a frecuencias bajas [39] o altas [40] .
Se ha demostrado que las neuronas en algunas áreas sensoriales corticales codifican estímulos naturalistas ricos en términos de sus tiempos de pico en relación con la fase de fluctuaciones oscilatorias de red en curso, en lugar de solo en términos de su conteo de picos. [39] [41] Las señales de potencial de campo local reflejan oscilaciones de población (red). El código de fase de disparo a menudo se clasifica como un código temporal, aunque la etiqueta de tiempo utilizada para los picos (es decir, la fase de oscilación de la red) es una referencia de baja resolución (de grano grueso) para el tiempo. Como resultado, a menudo solo cuatro valores discretos para la fase son suficientes para representar todo el contenido de información en este tipo de código con respecto a la fase de oscilaciones en frecuencias bajas. El código de fase de disparo se basa vagamente en los fenómenos de precesión de fase observados en las células del lugar del hipocampo . Otra característica de este código es que las neuronas se adhieren a un orden preferido de picos entre un grupo de neuronas sensoriales, lo que resulta en una secuencia de disparo. [42]
Se ha demostrado que el código de fase en la corteza visual también implica oscilaciones de alta frecuencia . [42] Dentro de un ciclo de oscilación gamma, cada neurona tiene su propio tiempo de activación relativo preferido. Como resultado, una población completa de neuronas genera una secuencia de activación que tiene una duración de hasta aproximadamente 15 ms. [42]
La codificación poblacional es un método para representar estímulos mediante la actividad conjunta de varias neuronas. En la codificación poblacional, cada neurona tiene una distribución de respuestas sobre un conjunto de entradas, y las respuestas de muchas neuronas pueden combinarse para determinar algún valor sobre las entradas. Desde el punto de vista teórico, la codificación poblacional es uno de los pocos problemas matemáticamente bien formulados en neurociencia. Capta las características esenciales de la codificación neuronal y, sin embargo, es lo suficientemente simple para el análisis teórico. [43] Los estudios experimentales han revelado que este paradigma de codificación se utiliza ampliamente en las áreas sensoriales y motoras del cerebro.
Por ejemplo, en el área visual temporal medial (MT), las neuronas están sintonizadas con la dirección del movimiento del objeto. [44] En respuesta a un objeto que se mueve en una dirección particular, muchas neuronas en MT se activan con un patrón de actividad en forma de campana y corrompido por el ruido en toda la población. La dirección de movimiento del objeto se recupera de la actividad de la población, para ser inmune a la fluctuación existente en la señal de una sola neurona. Cuando se entrena a los monos para que muevan un joystick hacia un objetivo iluminado, una sola neurona se activará para múltiples direcciones del objetivo. Sin embargo, se activa más rápido para una dirección y más lentamente dependiendo de qué tan cerca estaba el objetivo de la dirección "preferida" de la neurona. [45] [46] Si cada neurona representa el movimiento en su dirección preferida, y se calcula la suma vectorial de todas las neuronas (cada neurona tiene una tasa de activación y una dirección preferida), la suma apunta en la dirección del movimiento. De esta manera, la población de neuronas codifica la señal para el movimiento. [ cita requerida ] Este código de población particular se conoce como codificación vectorial de población .
Los códigos de población de lugar-tiempo, denominados código de respuesta sincronizada localizada promediada (ALSR), se han derivado para la representación neuronal de estímulos acústicos auditivos. Esto explota tanto el lugar o la afinación dentro del nervio auditivo, como el bloqueo de fase dentro de cada fibra nerviosa del nervio auditivo. La primera representación ALSR fue para vocales de estado estable; [47] Las representaciones ALSR de frecuencias de tono y formantes en estímulos complejos de estado no estable se demostraron más tarde para tonos sonoros, [48] y representaciones de formantes en sílabas consonante-vocal. [49] La ventaja de tales representaciones es que las características globales, como los perfiles de transición de tono o formantes, se pueden representar como características globales en todo el nervio simultáneamente a través de la codificación de velocidad y lugar.
La codificación de poblaciones también tiene otras ventajas, como la reducción de la incertidumbre debido a la variabilidad neuronal y la capacidad de representar simultáneamente varios atributos de estímulo diferentes. La codificación de poblaciones también es mucho más rápida que la codificación de velocidad y puede reflejar cambios en las condiciones del estímulo casi instantáneamente. [50] Las neuronas individuales de una población de este tipo suelen tener selectividades diferentes pero superpuestas, de modo que muchas neuronas, pero no necesariamente todas, responden a un estímulo determinado.
Por lo general, una función de codificación tiene un valor pico de modo que la actividad de la neurona es máxima si el valor perceptual está cerca del valor pico, y se reduce en consecuencia para valores menos cercanos al valor pico. [ cita requerida ] De ello se deduce que el valor percibido real se puede reconstruir a partir del patrón general de actividad en el conjunto de neuronas. La codificación vectorial es un ejemplo de promedio simple. Una técnica matemática más sofisticada para realizar dicha reconstrucción es el método de máxima verosimilitud basado en una distribución multivariada de las respuestas neuronales. Estos modelos pueden asumir independencia, correlaciones de segundo orden, [51] o incluso dependencias más detalladas como modelos de entropía máxima de orden superior , [52] o cópulas . [53]
El modelo de codificación de correlación de la activación neuronal sostiene que las correlaciones entre potenciales de acción , o "picos", dentro de un tren de picos pueden llevar información adicional además de la simple sincronización de los picos. Los primeros trabajos sugirieron que la correlación entre trenes de picos solo puede reducir, y nunca aumentar, la información mutua total presente en los dos trenes de picos sobre una característica del estímulo. [54] Sin embargo, más tarde se demostró que esto era incorrecto. La estructura de correlación puede aumentar el contenido de información si las correlaciones de ruido y señal son de signo opuesto. [55] Las correlaciones también pueden llevar información que no está presente en la tasa de activación promedio de dos pares de neuronas. Un buen ejemplo de esto existe en la corteza auditiva del tití anestesiado con pentobarbital, en la que un tono puro provoca un aumento en el número de picos correlacionados, pero no un aumento en la tasa de activación media, de pares de neuronas. [56]
El modelo de codificación de picos independientes de la activación neuronal afirma que cada potencial de acción individual , o "pico", es independiente de cada uno de los otros picos dentro del tren de picos . [20] [57]
Un código poblacional típico incluye neuronas con una curva de ajuste gaussiana cuyas medias varían linealmente con la intensidad del estímulo, lo que significa que la neurona responde con mayor intensidad (en términos de picos por segundo) a un estímulo cercano a la media. La intensidad real podría recuperarse como el nivel de estímulo correspondiente a la media de la neurona con la mayor respuesta. Sin embargo, el ruido inherente a las respuestas neuronales significa que una función de estimación de máxima verosimilitud es más precisa.
Este tipo de código se utiliza para codificar variables continuas como la posición de las articulaciones, la posición de los ojos, el color o la frecuencia del sonido. Cualquier neurona individual es demasiado ruidosa para codificar fielmente la variable mediante codificación de velocidad, pero una población completa garantiza una mayor fidelidad y precisión. Para una población de curvas de ajuste unimodales, es decir, con un solo pico, la precisión normalmente se escala linealmente con el número de neuronas. Por lo tanto, para la mitad de la precisión, se requieren la mitad de neuronas. Por el contrario, cuando las curvas de ajuste tienen múltiples picos, como en las celdas de la cuadrícula que representan el espacio, la precisión de la población puede escalar exponencialmente con el número de neuronas. Esto reduce en gran medida el número de neuronas necesarias para la misma precisión. [58]
El código disperso se produce cuando cada elemento se codifica mediante la activación intensa de un conjunto relativamente pequeño de neuronas. Para cada elemento que se va a codificar, se trata de un subconjunto diferente de todas las neuronas disponibles. A diferencia de la codificación dispersa en sensores, la codificación densa en sensores implica que se conoce toda la información de las posibles ubicaciones de los sensores.
En consecuencia, la escasez puede centrarse en la escasez temporal ("un número relativamente pequeño de períodos de tiempo están activos") o en la escasez en una población activa de neuronas. En este último caso, esto puede definirse en un período de tiempo como el número de neuronas activadas en relación con el número total de neuronas en la población. Esto parece ser un sello distintivo de los cálculos neuronales ya que, en comparación con las computadoras tradicionales, la información se distribuye masivamente entre las neuronas. La codificación dispersa de imágenes naturales produce filtros orientados de tipo wavelet que se asemejan a los campos receptivos de células simples en la corteza visual. [59] La capacidad de los códigos dispersos puede aumentarse mediante el uso simultáneo de la codificación temporal, como se encuentra en el sistema olfativo de la langosta. [60]
Dado un conjunto potencialmente grande de patrones de entrada, los algoritmos de codificación dispersa (por ejemplo, el autocodificador disperso ) intentan encontrar automáticamente una pequeña cantidad de patrones representativos que, cuando se combinan en las proporciones adecuadas, reproducen los patrones de entrada originales. La codificación dispersa para la entrada consta entonces de esos patrones representativos. Por ejemplo, el conjunto muy grande de oraciones en inglés se puede codificar con una pequeña cantidad de símbolos (es decir, letras, números, puntuación y espacios) combinados en un orden particular para una oración en particular, y por lo tanto una codificación dispersa para inglés sería esos símbolos.
La mayoría de los modelos de codificación dispersa se basan en el modelo generativo lineal. [61] En este modelo, los símbolos se combinan de forma lineal para aproximarse a la entrada.
Más formalmente, dado un conjunto k-dimensional de vectores de entrada con números reales , el objetivo de la codificación dispersa es determinar n vectores base k-dimensionales , correspondientes a campos receptivos neuronales, junto con un vector n-dimensional disperso de pesos o coeficientes para cada vector de entrada, de modo que una combinación lineal de los vectores base con proporciones dadas por los coeficientes resulte en una aproximación cercana al vector de entrada: . [62]
Las codificaciones generadas por algoritmos que implementan un modelo generativo lineal se pueden clasificar en codificaciones con escasez suave y aquellas con escasez dura . [61] Estas se refieren a la distribución de los coeficientes del vector base para entradas típicas. Una codificación con escasez suave tiene una distribución suave similar a la gaussiana , pero más puntiaguda que la gaussiana, con muchos valores cero, algunos valores absolutos pequeños, menos valores absolutos grandes y muy pocos valores absolutos muy grandes. Por lo tanto, muchos de los vectores base están activos. La escasez dura, por otro lado, indica que hay muchos valores cero, ningún valor absoluto pequeño o casi ningún valor absoluto pequeño, menos valores absolutos grandes y muy pocos valores absolutos muy grandes, y por lo tanto pocos de los vectores base están activos. Esto es atractivo desde una perspectiva metabólica: se utiliza menos energía cuando se activan menos neuronas. [61]
Otra medida de la codificación es si es críticamente completa o sobrecompleta . Si el número de vectores base n es igual a la dimensionalidad k del conjunto de entrada, se dice que la codificación es críticamente completa. En este caso, los cambios suaves en el vector de entrada dan como resultado cambios abruptos en los coeficientes, y la codificación no puede manejar con elegancia pequeños escalamientos, pequeñas traducciones o ruido en las entradas. Sin embargo, si el número de vectores base es mayor que la dimensionalidad del conjunto de entrada, la codificación es sobrecompleta . Las codificaciones sobrecompletas interpolan suavemente entre los vectores de entrada y son robustas bajo el ruido de entrada. [63] Se estima que la corteza visual primaria humana es sobrecompleta por un factor de 500, de modo que, por ejemplo, un parche de entrada de 14 x 14 (un espacio de 196 dimensiones) está codificado por aproximadamente 100.000 neuronas. [61]
Otros modelos se basan en la búsqueda de correspondencia , un algoritmo de aproximación dispersa que encuentra las proyecciones de "mejor coincidencia" de datos multidimensionales, y el aprendizaje de diccionario , un método de aprendizaje de representación que tiene como objetivo encontrar una representación matricial dispersa de los datos de entrada en forma de una combinación lineal de elementos básicos, así como de esos elementos básicos en sí mismos. [64] [65] [66]
La codificación dispersa puede ser una estrategia general de los sistemas neuronales para aumentar la capacidad de memoria. Para adaptarse a sus entornos, los animales deben aprender qué estímulos están asociados con recompensas o castigos y distinguir estos estímulos reforzados de otros similares pero irrelevantes. Estas tareas requieren la implementación de memorias asociativas específicas de estímulos en las que solo unas pocas neuronas de una población responden a un estímulo dado y cada neurona responde solo a unos pocos estímulos de todos los estímulos posibles.
Los trabajos teóricos sobre la memoria distribuida dispersa han sugerido que la codificación dispersa aumenta la capacidad de la memoria asociativa al reducir la superposición entre representaciones. [67] Experimentalmente, se han observado representaciones dispersas de información sensorial en muchos sistemas, incluidos la visión, [68] la audición, [69] el tacto, [70] y el olfato. [71] Sin embargo, a pesar de la evidencia acumulada de la codificación dispersa generalizada y los argumentos teóricos sobre su importancia, ha sido difícil obtener una demostración de que la codificación dispersa mejora la especificidad del estímulo de la memoria asociativa.
En el sistema olfativo de Drosophila , se cree que la escasa codificación de olores por parte de las células de Kenyon del cuerpo del hongo genera una gran cantidad de ubicaciones que se pueden abordar con precisión para el almacenamiento de recuerdos específicos de olores. [72] La escasez está controlada por un circuito de retroalimentación negativa entre las células de Kenyon y las neuronas laterales pareadas anteriores (APL) GABAérgicas . La activación y el bloqueo sistemáticos de cada rama de este circuito de retroalimentación muestran que las células de Kenyon activan las neuronas APL y estas las inhiben. La interrupción del circuito de retroalimentación entre células de Kenyon y APL disminuye la escasez de respuestas de olor de las células de Kenyon, aumenta las correlaciones entre olores y evita que las moscas aprendan a discriminar olores similares, pero no diferentes. Estos resultados sugieren que la inhibición por retroalimentación suprime la actividad de las células de Kenyon para mantener una codificación de olores escasa y decorrelacionada y, por lo tanto, la especificidad de los recuerdos. [73]
{{cite web}}
: CS1 maint: varios nombres: lista de autores ( enlace )