stringtranslate.com

Sensibilidad y especificidad

Sensibilidad y especificidad: la mitad izquierda de la imagen con los puntos sólidos representa a las personas que padecen la afección, mientras que la mitad derecha de la imagen con los puntos huecos representa a las personas que no padecen la afección. El círculo representa a todas las personas que dieron positivo.

En medicina y estadística , la sensibilidad y la especificidad describen matemáticamente la precisión de una prueba que informa la presencia o ausencia de una condición médica. Si los individuos que tienen la afección se consideran "positivos" y los que no se consideran "negativos", entonces la sensibilidad es una medida de qué tan bien una prueba puede identificar verdaderos positivos y la especificidad es una medida de qué tan bien una prueba puede identificar verdaderos negativos. :

Si no se puede conocer el verdadero estado de la afección, se pueden definir la sensibilidad y la especificidad en relación con una " prueba estándar de oro " que se supone correcta. Para todas las pruebas, tanto de diagnóstico como de detección , suele haber un equilibrio entre sensibilidad y especificidad, de modo que sensibilidades más altas significarán especificidades más bajas y viceversa.

Una prueba que detecta de manera confiable la presencia de una condición, lo que resulta en una gran cantidad de verdaderos positivos y una baja cantidad de falsos negativos, tendrá una alta sensibilidad. Esto es especialmente importante cuando la consecuencia de no tratar la afección es grave y/o el tratamiento es muy eficaz y tiene efectos secundarios mínimos.

Una prueba que excluya de manera confiable a las personas que no padecen la afección, lo que resulta en un gran número de verdaderos negativos y un bajo número de falsos positivos, tendrá una alta especificidad. Esto es especialmente importante cuando las personas identificadas con una afección pueden estar sujetas a más pruebas, gastos, estigma, ansiedad, etc.

Sensibilidad y especificidad

Los términos "sensibilidad" y "especificidad" fueron introducidos por el bioestadístico estadounidense Jacob Yerushalmy en 1947. [1]

Existen diferentes definiciones dentro del control de calidad del laboratorio , en las que la "sensibilidad analítica" se define como la cantidad más pequeña de sustancia en una muestra que puede medirse con precisión mediante un ensayo (sinónimo hasta el límite de detección ), y la "especificidad analítica" se define como la capacidad de un ensayo para medir un organismo o sustancia en particular, en lugar de otros. [2] Sin embargo, este artículo trata de la sensibilidad y especificidad del diagnóstico tal como se definen en la parte superior.

Solicitud al estudio de detección.

Imagine un estudio que evalúa una prueba que detecta una enfermedad en las personas. Cada persona que realiza la prueba tiene o no la enfermedad. El resultado de la prueba puede ser positivo (clasificando a la persona como que tiene la enfermedad) o negativo (clasificando a la persona como no teniendo la enfermedad). Los resultados de la prueba para cada sujeto pueden coincidir o no con el estado real del sujeto. En ese escenario:

Después de obtener los números de verdaderos positivos, falsos positivos, verdaderos negativos y falsos negativos, se puede calcular la sensibilidad y especificidad de la prueba. Si resulta que la sensibilidad es alta, es probable que la prueba clasifique a cualquier persona que tenga la enfermedad como positiva. Por otro lado, si la especificidad es alta, es probable que cualquier persona que no tenga la enfermedad sea clasificada como negativa por la prueba. Un sitio web de los NIH tiene una discusión sobre cómo se calculan estos índices. [3]

Definición

Sensibilidad

Considere el ejemplo de una prueba médica para diagnosticar una afección. La sensibilidad (a veces también denominada tasa de detección en un entorno clínico) se refiere a la capacidad de la prueba para detectar correctamente a los pacientes enfermos entre aquellos que padecen la afección. [4] Matemáticamente, esto se puede expresar como:

Un resultado negativo en una prueba con alta sensibilidad puede ser útil para "descartar" una enfermedad, [4] ya que rara vez diagnostica erróneamente a quienes padecen la enfermedad. Una prueba con una sensibilidad del 100% reconocerá a todos los pacientes con la enfermedad si dan positivo. En este caso, un resultado negativo de la prueba descartaría definitivamente la presencia de la enfermedad en un paciente. Sin embargo, un resultado positivo en una prueba con alta sensibilidad no es necesariamente útil para "determinar" la enfermedad. Supongamos que un kit de prueba "falso" está diseñado para dar siempre una lectura positiva. Cuando se utiliza en pacientes enfermos, todos los pacientes dan positivo, lo que le da a la prueba una sensibilidad del 100%. Sin embargo, la sensibilidad no tiene en cuenta los falsos positivos. La prueba falsa también arroja resultados positivos en todos los pacientes sanos, lo que le da una tasa de falsos positivos del 100%, lo que la hace inútil para detectar o "declarar" la enfermedad. [ cita necesaria ]

El cálculo de la sensibilidad no tiene en cuenta resultados de prueba indeterminados. Si una prueba no se puede repetir, las muestras indeterminadas deben excluirse del análisis (el número de exclusiones debe indicarse al citar la sensibilidad) o pueden tratarse como falsos negativos (lo que da el peor valor de sensibilidad y, por lo tanto, puede subestimarlo). ). [ cita necesaria ]

Una prueba con mayor sensibilidad tiene una tasa de error tipo II más baja .

Especificidad

Consideremos el ejemplo de una prueba médica para diagnosticar una enfermedad. La especificidad se refiere a la capacidad de la prueba para rechazar correctamente a pacientes sanos sin una condición. Matemáticamente, esto se puede escribir como:

Un resultado positivo en una prueba con alta especificidad puede ser útil para "determinar" la enfermedad, ya que la prueba rara vez da resultados positivos en pacientes sanos. [5] Una prueba con 100% de especificidad reconocerá a todos los pacientes sin la enfermedad si la prueba es negativa, por lo que un resultado positivo descartaría definitivamente la presencia de la enfermedad. Sin embargo, un resultado negativo de una prueba con alta especificidad no es necesariamente útil para "descartar" una enfermedad. Por ejemplo, una prueba que siempre arroja un resultado negativo tendrá una especificidad del 100% porque la especificidad no considera falsos negativos. Una prueba como esa daría negativo en pacientes con la enfermedad, haciéndola inútil para "descartar" la enfermedad.

Una prueba con mayor especificidad tiene una tasa de error tipo I más baja .

Ilustración gráfica

La ilustración gráfica anterior pretende mostrar la relación entre sensibilidad y especificidad. La línea de puntos negra en el centro del gráfico es donde la sensibilidad y la especificidad son iguales. A medida que uno se mueve hacia la izquierda de la línea de puntos negra, la sensibilidad aumenta, alcanzando su valor máximo del 100% en la línea A, y la especificidad disminuye. La sensibilidad en la línea A es del 100% porque en ese punto no hay falsos negativos, lo que significa que todos los resultados negativos de la prueba son verdaderos negativos. Al moverse hacia la derecha ocurre lo contrario, la especificidad aumenta hasta llegar a la línea B y llega a ser del 100% y la sensibilidad disminuye. La especificidad en la línea B es del 100% porque el número de falsos positivos es cero en esa línea, lo que significa que todos los resultados positivos de la prueba son verdaderos positivos.

La línea continua central en ambas figuras que muestra el nivel de sensibilidad y especificidad es el punto de corte de la prueba. Como se describió anteriormente, mover esta línea da como resultado un equilibrio entre el nivel de sensibilidad y especificidad. El lado izquierdo de esta línea contiene los puntos de datos que se prueban por debajo del punto de corte y se consideran negativos (los puntos azules indican los falsos negativos (FN), los puntos blancos los verdaderos negativos (TN)). El lado derecho de la línea muestra los puntos de datos que se prueban por encima del punto de corte y se consideran positivos (los puntos rojos indican falsos positivos (FP)). Cada lado contiene 40 puntos de datos.

Para la figura que muestra alta sensibilidad y baja especificidad, hay 3 FN y 8 FP. Utilizando el hecho de que resultados positivos = verdaderos positivos (TP) + FP, obtenemos TP = resultados positivos - FP, o TP = 40 - 8 = 32. El número de personas enfermas en el conjunto de datos es igual a TP + FN, o 32 + 3 = 35. La sensibilidad es, por tanto, 32 / 35 = 91,4%. Usando el mismo método, obtenemos TN = 40 - 3 = 37, y el número de personas sanas 37 + 8 = 45, lo que resulta en una especificidad de 37 / 45 = 82,2 %.

Para la figura que muestra baja sensibilidad y alta especificidad, hay 8 FN y 3 FP. Utilizando el mismo método que en la figura anterior, obtenemos TP = 40 - 3 = 37. El número de enfermos es 37 + 8 = 45, lo que da una sensibilidad de 37 / 45 = 82,2 %. Hay 40 - 8 = 32 TN. Por tanto, la especificidad es 32/35 = 91,4%.

El punto rojo indica el paciente con la condición médica. El fondo rojo indica el área donde la prueba predice que el punto de datos será positivo. El verdadero positivo en esta figura es 6 y los falsos negativos 0 (porque todas las condiciones positivas se predicen correctamente como positivas). Por tanto, la sensibilidad es del 100% (de 6/(6+0) ). Esta situación también se ilustra en la figura anterior, donde la línea de puntos está en la posición A (el modelo predice que el lado izquierdo es negativo, el modelo predice que el lado derecho es positivo). Cuando la línea de puntos, línea de corte de la prueba, está en la posición A, la prueba predice correctamente toda la población de la clase positiva verdadera, pero no podrá identificar correctamente el punto de datos de la clase negativa verdadera.

De manera similar a la figura explicada anteriormente, el punto rojo indica el paciente con la condición médica. Sin embargo, en este caso, el fondo verde indica que la prueba predice que todos los pacientes están libres de la afección médica. El número de puntos de datos que son verdaderos negativos es entonces 26 y el número de falsos positivos es 0. Esto da como resultado una especificidad del 100% (de 26 / (26 + 0) ). Por lo tanto, la sensibilidad o la especificidad por sí solas no pueden utilizarse para medir el rendimiento de la prueba.

Uso médico

En el diagnóstico médico , la sensibilidad de la prueba es la capacidad de una prueba para identificar correctamente a quienes padecen la enfermedad (tasa de verdaderos positivos), mientras que la especificidad de la prueba es la capacidad de la prueba para identificar correctamente a quienes no tienen la enfermedad (tasa de verdaderos negativos). Si se hicieron pruebas a 100 pacientes que se sabía que tenían una enfermedad y 43 dieron positivo, entonces la prueba tiene una sensibilidad del 43%. Si se analizan 100 personas sin enfermedad y 96 arrojan un resultado completamente negativo, entonces la prueba tiene una especificidad del 96%. La sensibilidad y la especificidad son características de la prueba independientes de la prevalencia, ya que sus valores son intrínsecos a la prueba y no dependen de la prevalencia de la enfermedad en la población de interés. [6] Los valores predictivos positivos y negativos , pero no la sensibilidad o la especificidad, son valores influenciados por la prevalencia de la enfermedad en la población que se está analizando. Estos conceptos se ilustran gráficamente en este modelo de diagnóstico clínico bayesiano de subprograma que muestra los valores predictivos positivos y negativos en función de la prevalencia, la sensibilidad y la especificidad.

Conceptos erróneos

A menudo se afirma que una prueba muy específica es eficaz para descartar una enfermedad cuando es positiva, mientras que una prueba muy sensible se considera eficaz para descartar una enfermedad cuando es negativa. [7] [8] Esto ha llevado a los mnemotécnicos SPPIN y SNNOUT, ampliamente utilizados , según los cuales una prueba altamente específica, cuando es positiva , gobierna la enfermedad (SP-P-IN), y una prueba altamente sensible , cuando es negativo, descarta enfermedad (SN-N-OUT). Sin embargo, ambas reglas generales son inferencialmente engañosas, ya que el poder diagnóstico de cualquier prueba está determinado por la prevalencia de la afección que se prueba, la sensibilidad de la prueba y su especificidad. [9] [10] [11] La mnemónica SNNOUT tiene cierta validez cuando la prevalencia de la condición en cuestión es extremadamente baja en la muestra analizada.

La compensación entre especificidad y sensibilidad se explora en el análisis ROC como una compensación entre TPR y FPR (es decir, recuperación y consecuencias ). [12] Darles el mismo peso optimiza la información = especificidad + sensibilidad − 1 = TPR − FPR, cuya magnitud da la probabilidad de una decisión informada entre las dos clases (> 0 representa el uso apropiado de la información, 0 representa el desempeño a nivel de probabilidad , < 0 representa un uso perverso de la información). [13]

Índice de sensibilidad

El índice de sensibilidad o d′ (pronunciado "dee-prime") es una estadística utilizada en la teoría de detección de señales . Proporciona la separación entre las medias de la señal y las distribuciones de ruido, en comparación con la desviación estándar de la distribución de ruido. Para señal y ruido normalmente distribuidos con desviaciones media y estándar y , y y , respectivamente, d′ se define como:

[14]

También se puede encontrar una estimación de d′ a partir de mediciones de la tasa de aciertos y la tasa de falsas alarmas . Se calcula como:

d′ = Z (tasa de aciertos) − Z (tasa de falsas alarmas), [15]

donde la función Z ( p ), p ∈ [0, 1], es la inversa de la distribución gaussiana acumulativa .

d′ es una estadística adimensional . Una d′ más alta indica que la señal se puede detectar más fácilmente.

Matriz de confusión

La relación entre sensibilidad, especificidad y términos similares se puede entender utilizando la siguiente tabla. Considere un grupo con P casos positivos y N casos negativos de alguna condición. Los cuatro resultados se pueden formular en una tabla de contingencia o matriz de confusión de 2×2 , así como derivaciones de varias métricas utilizando los cuatro resultados, de la siguiente manera:

  1. ^ el número de casos positivos reales en los datos
  2. ^ Un resultado de prueba que indica correctamente la presencia de una condición o característica.
  3. ^ Error de tipo II: resultado de una prueba que indica erróneamente que una condición o atributo particular está ausente
  4. ^ el número de casos negativos reales en los datos
  5. ^ Un resultado de prueba que indica correctamente la ausencia de una condición o característica.
  6. ^ Error de tipo I: resultado de una prueba que indica erróneamente que está presente una condición o atributo particular


Un ejemplo trabajado
Se aplica una prueba de diagnóstico con una sensibilidad del 67% y una especificidad del 91% a 2030 personas para buscar un trastorno con una prevalencia poblacional del 1,48%.

Cálculos relacionados

Esta hipotética prueba de detección (prueba de sangre oculta en heces) identificó correctamente a dos tercios (66,7%) de los pacientes con cáncer colorrectal. [a] Desafortunadamente, tener en cuenta las tasas de prevalencia revela que esta prueba hipotética tiene una alta tasa de falsos positivos y no identifica de manera confiable el cáncer colorrectal en la población general de personas asintomáticas (VPP = 10%).

Por otro lado, esta prueba hipotética demuestra una detección muy precisa de individuos libres de cáncer (VPN ≈ 99,5%). Por lo tanto, cuando se utiliza para la detección sistemática del cáncer colorrectal en adultos asintomáticos, un resultado negativo proporciona datos importantes para el paciente y el médico, como descartar el cáncer como causa de los síntomas gastrointestinales o tranquilizar a los pacientes preocupados por desarrollar cáncer colorrectal.

Estimación de errores en la sensibilidad o especificidad citada.

Los valores de sensibilidad y especificidad por sí solos pueden ser muy engañosos. Se debe calcular la sensibilidad o especificidad del "peor de los casos" para evitar depender de experimentos con pocos resultados. Por ejemplo, una prueba en particular puede mostrar fácilmente una sensibilidad del 100% si se compara con el estándar de oro cuatro veces, pero una sola prueba adicional con el estándar de oro que arrojara un resultado deficiente implicaría una sensibilidad de sólo el 80%. Una forma común de hacerlo es establecer el intervalo de confianza de la proporción binomial , que a menudo se calcula utilizando un intervalo de puntuación de Wilson.

Se pueden calcular intervalos de confianza para la sensibilidad y la especificidad, dando el rango de valores dentro del cual se encuentra el valor correcto en un nivel de confianza determinado (p. ej., 95%). [26]

Terminología en recuperación de información.

En la recuperación de información , el valor predictivo positivo se llama precisión y la sensibilidad se llama recuperación . A diferencia del equilibrio entre especificidad y sensibilidad, estas medidas son independientes del número de verdaderos negativos, que generalmente se desconoce y es mucho mayor que el número real de documentos relevantes y recuperados. Esta suposición de un gran número de verdaderos negativos frente a positivos es poco común en otras aplicaciones. [13]

La puntuación F se puede utilizar como medida única del rendimiento de la prueba para la clase positiva. La puntuación F es la media armónica de precisión y recuperación:

En el lenguaje tradicional de las pruebas de hipótesis estadísticas , la sensibilidad de una prueba se denomina potencia estadística de la prueba, aunque la palabra potencia en ese contexto tiene un uso más general que no es aplicable en el presente contexto. Una prueba sensible tendrá menos errores de tipo II .

Terminología en el análisis del genoma.

De manera similar al dominio de la recuperación de información , en el área de investigación de la predicción de genes , el número de verdaderos negativos (no genes) en las secuencias genómicas es generalmente desconocido y mucho mayor que el número real de genes (verdaderos positivos). El término especificidad, conveniente e intuitivamente comprendido, en esta área de investigación se ha utilizado frecuentemente con la fórmula matemática de precisión y recuperación tal como se define en bioestadística. El par de especificidad así definida (como valor predictivo positivo) y sensibilidad (tasa de verdaderos positivos) representa los principales parámetros que caracterizan la precisión de los algoritmos de predicción de genes. [27] [28] [29] [30] Por el contrario, el término especificidad en el sentido de tasa negativa verdadera tendría poca o ninguna aplicación en el área de investigación del análisis del genoma.

Ver también

Notas

  1. ^ Existen ventajas y desventajas para todas las pruebas de detección médica. Las guías de práctica clínica , como las de detección del cáncer colorrectal, describen estos riesgos y beneficios. [24] [25]

Referencias

  1. ^ Yerushalmy J (1947). "Problemas estadísticos en la evaluación de métodos de diagnóstico médico con especial referencia a las técnicas de rayos X". Informes de salud pública . 62 (2): 1432–39. doi :10.2307/4586294. JSTOR  4586294. PMID  20340527. S2CID  19967899.
  2. ^ Saah AJ, Hoover DR (1998). "[Sensibilidad y especificidad revisadas: importancia de los términos en el lenguaje analítico y diagnóstico]". Ann Dermatol Venereol . 125 (4): 291–4. PMID  9747274.
  3. ^ Parikh R, Mathai A, Parikh S, Chandra Sekhar G, Thomas R (2008). "Comprensión y uso de sensibilidad, especificidad y valores predictivos". Revista India de Oftalmología . 56 (1): 45–50. doi : 10.4103/0301-4738.37595 . PMC 2636062 . PMID  18158403. 
  4. ^ ab Altman DG, Bland JM (junio de 1994). "Pruebas diagnósticas. 1: Sensibilidad y especificidad". BMJ . 308 (6943): 1552. doi :10.1136/bmj.308.6943.1552. PMC 2540489 . PMID  8019315. 
  5. ^ "SpPin y SnNout". Centro de Medicina Basada en la Evidencia (CEBM) . Consultado el 18 de enero de 2023 .
  6. ^ Mangrulkar R. "Razonamiento diagnóstico I y II". Archivado desde el original el 1 de agosto de 2011 . Consultado el 24 de enero de 2012 .
  7. ^ "Diagnóstico basado en evidencia". Universidad del estado de michigan. Archivado desde el original el 6 de julio de 2013 . Consultado el 23 de agosto de 2013 .
  8. ^ "Sensibilidad y especificidad". Curso de Medicina basada en evidencia de la Facultad de Medicina de la Universidad de Emory.
  9. ^ Baron JA (abril-junio de 1994). "Qué pena que no sea cierto". Toma de decisiones médicas . 14 (2): 107. doi :10.1177/0272989X9401400202. PMID  8028462. S2CID  44505648.
  10. ^ Boyko EJ (abril-junio de 1994). "Descartar o descartar enfermedad con la prueba diagnóstica más sensible o específica: ¿atajo o camino equivocado?". Toma de decisiones médicas . 14 (2): 175–9. doi :10.1177/0272989X9401400210. PMID  8028470. S2CID  31400167.
  11. ^ Pewsner D, Battaglia M, Minder C, Marx A, Bucher HC, Egger M (julio de 2004). "Declarar un diagnóstico dentro o fuera con" SpPIn "y" SnNOut ": una nota de precaución". BMJ . 329 (7459): 209–13. doi :10.1136/bmj.329.7459.209. PMC 487735 . PMID  15271832. 
  12. ^ Fawcett T (2006). "Una introducción al análisis de la República de China". Letras de reconocimiento de patrones . 27 (8): 861–874. Código Bib : 2006PaReL..27..861F. CiteSeerX 10.1.1.646.2144 . doi :10.1016/j.patrec.2005.10.010. S2CID  2027090. 
  13. ^ ab Poderes DM (2011). "Evaluación: de la precisión, la recuperación y la medida F a la República de China, la información, el marcado y la correlación". Revista de tecnologías de aprendizaje automático . 2 (1): 37–63.
  14. ^ Gale SD, Perkel DJ (enero de 2010). "Una vía de los ganglios basales impulsa respuestas auditivas selectivas en las neuronas dopaminérgicas de los pájaros cantores mediante la desinhibición". La Revista de Neurociencia . 30 (3): 1027–37. doi :10.1523/JNEUROSCI.3585-09.2010. PMC 2824341 . PMID  20089911. 
  15. ^ Macmillan NA, Creelman CD (15 de septiembre de 2004). Teoría de la detección: una guía del usuario. Prensa de Psicología. pag. 7.ISBN 978-1-4106-1114-7.
  16. ^ Fawcett T (2006). "Una introducción al análisis de la República de China" (PDF) . Letras de reconocimiento de patrones . 27 (8): 861–874. doi :10.1016/j.patrec.2005.10.010. S2CID  2027090.
  17. ^ Preboste F, Tom Fawcett (1 de agosto de 2013). "Ciencia de datos para empresas: lo que necesita saber sobre la minería de datos y el pensamiento analítico de datos". O'Reilly Media, Inc.
  18. ^ Poderes DM (2011). "Evaluación: de la precisión, la recuperación y la medida F a la República de China, la información, el marcado y la correlación". Revista de tecnologías de aprendizaje automático . 2 (1): 37–63.
  19. ^ Ting KM (2011). Sammut C, Webb GI (eds.). Enciclopedia de aprendizaje automático . Saltador. doi :10.1007/978-0-387-30164-8. ISBN 978-0-387-30164-8.
  20. ^ Brooks H, Brown B, Ebert B, Ferro C, Jolliffe I, Koh TY, Roebber P, Stephenson D (26 de enero de 2015). "Grupo de trabajo conjunto PMIM/WGNE sobre investigación de verificación de pronósticos". Colaboración para la investigación meteorológica y climática de Australia . Organización Meteorológica Mundial . Consultado el 17 de julio de 2019 .
  21. ^ Chicco D, Jurman G (enero de 2020). "Las ventajas del coeficiente de correlación de Matthews (MCC) sobre la puntuación F1 y la precisión en la evaluación de la clasificación binaria". Genómica BMC . 21 (1): 6-1–6-13. doi : 10.1186/s12864-019-6413-7 . PMC 6941312 . PMID  31898477. 
  22. ^ Chicco D, Toetsch N, Jurman G (febrero de 2021). "El coeficiente de correlación de Matthews (MCC) es más confiable que la precisión equilibrada, la información de las casas de apuestas y la marcación en la evaluación de la matriz de confusión de dos clases". Minería de biodatos . 14 (13): 13. doi : 10.1186/s13040-021-00244-z . PMC 7863449 . PMID  33541410. 
  23. ^ Tharwat A. (agosto de 2018). "Métodos de evaluación de clasificación". Computación e Informática Aplicada . 17 : 168-192. doi : 10.1016/j.aci.2018.08.003 .
  24. ^ Lin JS, Piper MA, Perdue LA, Rutter CM, Webber EM, O'Connor E, Smith N, Whitlock EP (21 de junio de 2016). "Detección de cáncer colorrectal". JAMA . 315 (23): 2576–2594. doi :10.1001/jama.2016.3332. ISSN  0098-7484. PMID  27305422.
  25. ^ Bénard F, Barkun AN, Martel M, Renteln Dv (7 January 2018). "Systematic review of colorectal cancer screening guidelines for average-risk adults: Summarizing the current global recommendations". World Journal of Gastroenterology. 24 (1): 124–138. doi:10.3748/wjg.v24.i1.124. PMC 5757117. PMID 29358889.
  26. ^ "Diagnostic test online calculator calculates sensitivity, specificity, likelihood ratios and predictive values from a 2x2 table – calculator of confidence intervals for predictive parameters". medcalc.org.
  27. ^ Burge C, Karlin S (1997). "Prediction of complete gene structures in human genomic DNA" (PDF). Journal of Molecular Biology. 268 (1): 78–94. CiteSeerX 10.1.1.115.3107. doi:10.1006/jmbi.1997.0951. PMID 9149143. Archived from the original (PDF) on 2015-06-20.
  28. ^ "GeneMark-ES". Lomsadze A (2005). "Gene finding in novel genomes by self-training algorithm". Nucleic Acids Research. 33 (20): 6494–6906. doi:10.1093/nar/gki937. PMC 1298918. PMID 16314312.
  29. ^ Korf I (2004). "Gene finding in novel genomes". BMC Bioinformatics. 5: 59. doi:10.1186/1471-2105-5-59. PMC 421630. PMID 15144565.
  30. ^ Yandell M, Ence D (April 2012). "A beginner's guide to eukaryotic genome annotation". Nature Reviews. Genetics. 13 (5): 329–42. doi:10.1038/nrg3174. PMID 22510764. S2CID 3352427.

Further reading

External links