Espacio secuencial (evolución)

En biología evolutiva, el espacio secuencial es una forma de representar todas las secuencias posibles (para una proteína, gen o genoma).[3]​[4]​ La mayoría de las secuencias en el espacio secuencial no tienen función, dejando regiones relativamente pequeñas que están pobladas por genes naturales.[3]​[4]​ Por lo tanto, hay 400 posibles dipéptidos dispuestos en un espacio de 20x20, pero eso se expande a 10130 para que incluso una pequeña proteína de 100 aminoácidos se organice en un espacio con 100 dimensiones.Aunque tal multidimensionalidad abrumadora no se puede visualizar o representar esquemáticamente, proporciona un modelo abstracto útil para pensar sobre el rango de proteínas y la evolución de una secuencia a otra.Estos espacios altamente multidimensionales se pueden comprimir a 2 o 3 dimensiones mediante el análisis de componentes principales.
El espacio de secuencia de proteínas se puede representar como un espacio con n dimensiones , donde n es el número de aminoácidos en la proteína. Cada eje tiene 20 posiciones que representan los 20 aminoácidos. Hay 400 posibles proteínas de 2 aminoácidos ( dipéptido ) que se pueden organizar en una cuadrícula 2D. Los 8000 tripéptidos se pueden organizar en un cubo 3D. La mayoría de las proteínas tienen más de 100 aminoácidos y, por lo tanto, ocupan grandes espacios multidimensionales que contienen un número astronómico de secuencias de proteínas.