El archivo permanente de trabajo es principalmente matemático, aunque a menudo también se realizan cálculos numéricos para problemas particulares.
Las publicaciones[1] veces no hacen una distinción cuidadosa, pero estas últimas se ocupan principalmente de cuestiones algorítmicas.
[2] Por ejemplo, uno puede imaginar un segmento de línea que represente el objetivo y un proceso posterior en el que se "suelten" segmentos más pequeños en ubicaciones aleatorias del objetivo.
Las propiedades abstractas del recubrimiento han sido estudiadas por matemáticos durante más de un siglo.
[3] Sin embargo, la aplicación directa de estos resultados generalmente no ha sido posible.
En particular, se ha centrado en problemas y hace un uso conveniente de aproximaciones, simulaciones, etc.
La probabilidad de "cubrir" cualquier ubicación dada en el objetivo con un fragmento en particular es entonces
, que es válido a menudo, pero no para todos los casos del mundo real.)
La probabilidad de que un solo fragmento no cubra una ubicación determinada en el objetivo es, por tanto,
Por tanto, la probabilidad de cubrir una ubicación determinada del objetivo con al menos un fragmento es Esta ecuación se utilizó por primera vez para caracterizar bibliotecas de plásmidos[5] pero puede aparecer en una forma modificada.
Tenga en cuenta también que al considerar el proceso de cobertura en todas las posiciones en el objetivo, esta probabilidad es idéntica al valor esperado de la variable aleatoria
Aunque se centraron en el problema del mapeo, la abstracción de la secuenciación es muy parecida.
Proporcionaron una serie de resultados útiles que se adoptaron como teoría estándar desde los primeros días de la secuenciación del genoma "a gran escala".enoma Humano y continúa desempeñando un papel importante en la secuenciación del ADN.
[9][10][11] Sin embargo, los avances tecnológicos han hecho que las teorías cartográficas sean en gran medida obsoletas, excepto en organismos distintos de los organismos modelo altamente estudiados (por ejemplo, levaduras, moscas, ratones y humanos).
Sin embargo, al igual que los espacios entre autos estacionados, los espacios no secuenciados menores que la longitud de un clon se acumulan entre los clones secuenciados.
[14] Este método de secuenciación del genoma completo se hizo inmensamente popular.
Los procesos físicos y los protocolos de secuenciación del ADN han seguido evolucionando, impulsados en gran medida por los avances en los métodos bioquímicos, la instrumentación y las técnicas de automatización.
Hay factores importantes en estos escenarios que la teoría clásica no tiene en cuenta.
El nivel de matemáticas se vuelve proporcionalmente más sofisticado.
Los biólogos han desarrollado métodos para filtrar regiones de genomas altamente repetitivas y esencialmente no secuenciables.
Estos procedimientos son importantes para organismos cuyos genomas consisten principalmente en dicho ADN, por ejemplo, maíz.
, la teoría clásica de Lander-Waterman todavía ofrece buenas predicciones, pero la dinámica cambia para obtener redundancias más altas.
La secuenciación está emergiendo como una herramienta importante en medicina, por ejemplo en la investigación del cáncer.
En los esfuerzos pioneros para secuenciar individuos, Levy et al.
En general, la teoría concordará bien con la observación hasta el punto en que se hayan generado suficientes datos para exponer sesgos latentes.
[20] Los tipos de sesgos relacionados con la secuencia objetivo subyacente son particularmente difíciles de modelar, ya que la secuencia en sí puede no ser conocida a priori.