La teoría de reconocimiento por componentes , o teoría RBC , [1] es un proceso propuesto por Irving Biederman en 1987 para explicar el reconocimiento de objetos . Según la teoría RBC, podemos reconocer objetos separándolos en geones (las partes componentes principales del objeto). Biederman sugirió que los geones se basan en formas tridimensionales básicas (cilindros, conos, etc.) que se pueden ensamblar en diversas disposiciones para formar una cantidad prácticamente ilimitada de objetos. [2]
La teoría del reconocimiento por componentes sugiere que hay menos de 36 geones que se combinan para crear los objetos que vemos en la vida cotidiana. [3] Por ejemplo, cuando miramos una taza la descomponemos en dos componentes: "cilindro" y "asa". Esto también funciona para objetos más complejos, que a su vez están formados por una mayor cantidad de geones. Los geones percibidos se comparan luego con objetos en nuestra memoria almacenada para identificar lo que estamos mirando. La teoría propone que cuando miramos objetos buscamos dos componentes importantes.
En su propuesta de RBC, Biederman hace una analogía con la composición del habla y de los objetos que ayuda a sustentar su teoría. La idea es que se necesitan alrededor de 44 fonemas individuales o "unidades de sonido" para formar cada palabra en el idioma inglés, y solo alrededor de 55 son necesarios para formar cada palabra en todos los idiomas. Aunque pueden existir pequeñas diferencias entre estos fonemas, sigue habiendo un número discreto que compone todos los idiomas.
Un sistema similar puede utilizarse para describir cómo se perciben los objetos. Biederman sugiere que, de la misma manera que el habla está formada por fonemas, los objetos están formados por geones, y como hay una gran variedad de fonemas, también hay una gran variedad de geones. Se entiende más fácilmente cómo 36 geones pueden componer la suma de todos los objetos, cuando la suma de todo el lenguaje y el habla humana está formada por sólo 55 fonemas.
Uno de los factores más determinantes de la teoría de reconocimiento por componentes es que nos permite reconocer objetos independientemente del ángulo de visión; esto se conoce como invariancia del punto de vista. Se propone que la razón de este efecto son las propiedades invariantes de los bordes de los geones. [4]
Las propiedades de borde invariantes son las siguientes:
Nuestro conocimiento de estas propiedades significa que, al observar un objeto o geon, podemos percibirlo desde casi cualquier ángulo. Por ejemplo, al observar un ladrillo podremos ver conjuntos de líneas paralelas horizontales y verticales, y al considerar dónde se encuentran estos puntos (coterminación), podremos percibir el objeto.
El uso de geones como primitivos estructurales ofrece dos ventajas clave. Como los geones se basan en propiedades de objetos que son estables desde cualquier punto de vista ("invariantes desde el punto de vista") y todos los geones se pueden distinguir entre sí, una única descripción de geon es suficiente para describir un objeto desde todos los puntos de vista posibles. La segunda ventaja es que se logra una considerable economía de representación: un conjunto relativamente pequeño de geones forma un "alfabeto" simple que puede combinarse para formar objetos complejos. Por ejemplo, con solo 24 geones, hay 306 mil millones de combinaciones posibles de 3 geones, lo que permite reconocer todos los objetos posibles.
Además, algunas investigaciones sugieren que la capacidad de reconocer geones y estructuras compuestas de geones puede desarrollarse en el cerebro ya a los cuatro meses de edad, lo que la convierte en una de las habilidades fundamentales que utilizan los bebés para percibir el mundo. [5]
La teoría RBC no es capaz de comenzar con una fotografía de un objeto real y producir una descripción del objeto a partir de geones y relaciones; la teoría no intenta proporcionar un mecanismo para reducir las complejidades de las escenas reales a formas de geones simples. La teoría RBC también es incompleta en el sentido de que los geones y las relaciones entre ellos no lograrán distinguir muchos objetos reales. Por ejemplo, una pera y una manzana son fácilmente distinguibles por los humanos, pero carecen de las esquinas y los bordes necesarios para que la teoría RBC reconozca que son diferentes. Sin embargo, Irving Biederman ha argumentado que la teoría RBC es el modo "preferido" de reconocimiento de objetos humanos, con un proceso secundario que maneja objetos que no se pueden distinguir por sus geones. Afirma además que esta distinción explica la investigación que sugiere que los objetos pueden o no ser reconocidos igualmente bien con cambios en el punto de vista.