El análisis de repeticiones cortas en tándem ( STR ) es un método común de biología molecular que se utiliza para comparar repeticiones de alelos en loci específicos del ADN entre dos o más muestras. Una repetición corta en tándem es un microsatélite con unidades de repetición que tienen de 2 a 7 pares de bases de longitud, y la cantidad de repeticiones varía entre individuos, lo que hace que los STR sean efectivos para fines de identificación humana. [2] Este método se diferencia del análisis de polimorfismo de longitud de fragmentos de restricción (RFLP) ya que el análisis de STR no corta el ADN con enzimas de restricción. En cambio, se emplea la reacción en cadena de la polimerasa (PCR) para descubrir las longitudes de las repeticiones cortas en tándem en función de la longitud del producto de PCR.
El análisis STR es una herramienta en el análisis forense que evalúa regiones STR específicas que se encuentran en el ADN nuclear . La naturaleza variable (polimórfica) de las regiones STR que se analizan para las pruebas forenses intensifica la discriminación entre un perfil de ADN y otro. [3] Las herramientas científicas como STRmix aprobado por el FBI incorporan esta técnica de investigación. [4] [5] La ciencia forense aprovecha la variabilidad de la población en las longitudes de STR, lo que permite a los científicos distinguir una muestra de ADN de otra. El sistema de perfil de ADN utilizado hoy en día se basa en PCR y utiliza secuencias simples [6] o repeticiones cortas en tándem (STR). Este método utiliza regiones altamente polimórficas que tienen secuencias cortas repetidas de ADN (la más común es de 4 bases repetidas, pero hay otras longitudes en uso, incluidas 3 y 5 bases). Debido a que las personas no relacionadas casi con certeza tienen diferentes cantidades de unidades repetidas, los STR se pueden usar para discriminar entre individuos no relacionados. Estos loci STR (ubicaciones en un cromosoma) se seleccionan con cebadores específicos de secuencia y se amplifican mediante PCR . Los fragmentos de ADN resultantes se separan y se detectan mediante electroforesis . Existen dos métodos comunes de separación y detección: la electroforesis capilar (EC) y la electroforesis en gel .
Cada STR es polimórfico, pero el número de alelos es muy pequeño. Normalmente, cada alelo STR será compartido por alrededor del 5 al 20% de los individuos. El poder del análisis STR proviene de observar múltiples loci STR simultáneamente. [6] El patrón de alelos puede identificar a un individuo con bastante precisión. Por lo tanto, el análisis STR proporciona una excelente herramienta de identificación. Cuantas más regiones STR se prueben en un individuo, más discriminante se vuelve la prueba. [6] Sin embargo, dados 10 loci STR, puede resultar en un margen de error de genotipado del 30%, o casi un tercio (1/3) del tiempo. [7] Incluso cuando se utilizan 15 loci STR microsatélites identificadores, no son marcadores informativos para la inferencia de ascendencia, se necesita un conjunto mucho más grande de marcadores genéticos para detectar la estructura de la población a escala fina [1]. Un estudio afirmó que se encontró que 30 DIP-STR eran adecuados para pruebas de paternidad prenatal y para delinear aproximadamente la ascendencia biogeográfica en la ciencia forense, pero es necesario desarrollar más marcadores y paneles multiplex para promover el uso de este enfoque original. [8]
Al comparar el análisis de SNP y STR, el uso de SNP de alta calidad ha demostrado ser mejor para delinear la estructura de la población, así como las relaciones genéticas a nivel individual y de la población. [9] El uso de los mejores 15 SNP (30 alelos) fue similar al de los mejores 4 loci STR (83 alelos), y el aumento de STR no hizo ninguna diferencia, pero el aumento a 100 SNP aumentó sustancialmente la asignación, dando el resultado más alto. Los investigadores descubrieron que algunos de los loci STR superaron a los loci SNP en una base de locus único, pero las combinaciones de SNP superaron a los STR en base al número total de alelos. Los SNP de un panel más grande dieron una autoasignación genética individual significativamente más precisa en comparación con cualquier combinación de los loci STR. [9]
En cada país se utilizan distintos sistemas de análisis de ADN basados en STR. En América del Norte, los sistemas que amplifican los 20 loci centrales del CODIS son casi universales, mientras que en el Reino Unido se utiliza el sistema de 17 loci DNA-17 (que es compatible con la Base de Datos Nacional de ADN ). Sea cual sea el sistema que se utilice, muchas de las regiones STR utilizadas son las mismas. Estos sistemas de análisis de ADN se basan en reacciones multiplex, mediante las cuales se analizarán muchas regiones STR al mismo tiempo.
El verdadero poder del análisis STR está en su poder estadístico de discriminación. Debido a que los 20 loci que se utilizan actualmente para la discriminación en CODIS están clasificados de forma independiente (tener una cierta cantidad de repeticiones en un locus no cambia la probabilidad de tener cualquier cantidad de repeticiones en cualquier otro locus), se puede aplicar la regla del producto para las probabilidades . Esto significa que, si alguien tiene el tipo de ADN de ABC, donde los tres loci eran independientes, podemos decir que la probabilidad de tener ese tipo de ADN es la probabilidad de tener el tipo A multiplicada por la probabilidad de tener el tipo B multiplicada por la probabilidad de tener el tipo C. Esto ha dado como resultado la capacidad de generar probabilidades de coincidencia de 1 en un quintillón (1x10 18 ) o más. Sin embargo, las búsquedas en bases de datos de ADN mostraron coincidencias de perfiles de ADN falsas mucho más frecuentes de lo esperado. [10] Además, dado que hay alrededor de 12 millones de gemelos monocigóticos en la Tierra, la probabilidad teórica no es precisa.
En la práctica, el riesgo de una coincidencia contaminada es mucho mayor que la de una coincidencia con un pariente lejano, como la contaminación de una muestra a partir de objetos cercanos o de células sobrantes transferidas de una prueba anterior. El riesgo es mayor si se coincide con la persona más común en las muestras: todo lo que se recoge de una víctima o que está en contacto con ella es una fuente importante de contaminación para cualquier otra muestra que se lleve a un laboratorio. Por esa razón, normalmente se analizan múltiples muestras de control para garantizar que se mantengan limpias, cuando se preparan durante el mismo período que las muestras de prueba reales. Las coincidencias (o variaciones) inesperadas en varias muestras de control indican una alta probabilidad de contaminación de las muestras de prueba reales. En una prueba de parentesco, los perfiles de ADN completos deben diferir (excepto en el caso de los gemelos), para demostrar que una persona no fue coincidente como relacionada con su propio ADN en otra muestra. [ cita requerida ]
En la investigación biomédica, los perfiles STR se utilizan para autenticar líneas celulares. [11] Los perfiles STR autogenerados se pueden comparar con bases de datos como CLASTR (https://www.cellosaurus.org/cellosaurus-str-search/) o STRBase (https://strbase.nist.gov/). Además, las líneas celulares murinas primarias autogeneradas cultivadas antes del primer pase se pueden comparar con pases posteriores, lo que garantiza la identidad de la línea celular.
{{cite journal}}
: CS1 maint: varios nombres: lista de autores ( enlace )