stringtranslate.com

partición recursiva

Un árbol de partición recursivo que muestra la supervivencia de los pasajeros del Titanic ("sibsp" es el número de cónyuges o hermanos a bordo). Las cifras debajo de las hojas muestran la probabilidad de supervivencia y el porcentaje de observaciones en la hoja. Resumiendo: Tus posibilidades de sobrevivir eran buenas si eras (i) una mujer o (ii) un niño sin varios miembros de la familia.

La partición recursiva es un método estadístico para el análisis multivariable . [1] La partición recursiva crea un árbol de decisión que se esfuerza por clasificar correctamente a los miembros de la población dividiéndola en subpoblaciones en función de varias variables independientes dicotómicas . El proceso se denomina recursivo porque cada subpoblación puede, a su vez, dividirse un número indefinido de veces hasta que el proceso de división termina después de alcanzar un criterio de parada particular.

Los métodos de partición recursivos se han desarrollado desde la década de 1980. Los métodos bien conocidos de partición recursiva incluyen el algoritmo ID3 de Ross Quinlan y sus sucesores, C4.5 y C5.0 y los árboles de clasificación y regresión (CART). Los métodos de aprendizaje conjunto , como los bosques aleatorios, ayudan a superar una crítica común a estos métodos (su vulnerabilidad al sobreajuste de los datos) al emplear diferentes algoritmos y combinar su resultado de alguna manera.

Este artículo se centra en la partición recursiva para pruebas de diagnóstico médico , pero la técnica tiene aplicaciones mucho más amplias. Ver árbol de decisión .

En comparación con el análisis de regresión, que crea una fórmula que los proveedores de atención médica pueden usar para calcular la probabilidad de que un paciente tenga una enfermedad, la partición recursiva crea una regla como "Si un paciente tiene resultados x, y, z, probablemente tenga la enfermedad". q'.

Una variación es la 'partición recursiva lineal de Cox'. [2]

Ventajas y desventajas

En comparación con otros métodos multivariables, la partición recursiva tiene ventajas y desventajas.

Ejemplos

Hay ejemplos disponibles del uso de particiones recursivas en la investigación de pruebas de diagnóstico. [6] [7] [8] [9] [10] [11] Goldman utilizó la partición recursiva para priorizar la sensibilidad en el diagnóstico de infarto de miocardio entre pacientes con dolor torácico en la sala de emergencias. [11]

Ver también

Referencias

  1. ^ Breiman, Leo (1984). Árboles de clasificación y regresión . Boca Ratón: Chapman & Hall/CRC. ISBN 978-0-412-04841-8.
  2. ^ ab Cook EF, Goldman L (1984). "Comparación empírica de técnicas analíticas multivariadas: ventajas y desventajas del análisis de partición recursiva". Revista de Enfermedades Crónicas . 37 (9–10): 721–31. doi :10.1016/0021-9681(84)90041-9. PMID  6501544.
  3. ^ James KE, RF blanco, Kraemer HC (2005). "Validación repetida de muestras divididas para evaluar la regresión logística y la partición recursiva: una aplicación a la predicción del deterioro cognitivo". Estadística en Medicina . 24 (19): 3019–35. doi :10.1002/sim.2154. PMID  16149128.
  4. ^ Kattan MW, Hess KR, Beck JR (1998). "Experimentos para determinar si la partición recursiva (CART) o una red neuronal artificial supera las limitaciones teóricas de la regresión de riesgos proporcionales de Cox". Computadora. Biomédica. Res . 31 (5): 363–73. doi :10.1006/cbmr.1998.1488. PMID  9790741.
  5. ^ Lee JW, Um SH, Lee JB, Mun J, Cho H (2006). "Sistemas de puntuación y estadificación que utilizan modelado de regresión lineal de Cox y partición recursiva". Métodos de Información en Medicina . 45 (1): 37–43. doi :10.1055/s-0038-1634034. PMID  16482368.
  6. ^ Fonarow GC, Adams KF, Abraham WT, Yancy CW, Boscardin WJ (2005). "Estratificación del riesgo de mortalidad hospitalaria en insuficiencia cardíaca aguda descompensada: clasificación y análisis de árbol de regresión". JAMA . 293 (5): 572–80. doi : 10.1001/jama.293.5.572 . PMID  15687312.
  7. ^ Stiell IG, Wells GA, Vandemheen KL y otros. (2001). "La regla canadiense de la columna C para radiografía en pacientes traumatizados alerta y estables". JAMA . 286 (15): 1841–8. doi : 10.1001/jama.286.15.1841 . PMID  11597285.
  8. ^ Haydel MJ, Preston CA, Mills TJ, Luber S, Blaudeau E, DeBlieux PM (2000). "Indicaciones de la tomografía computarizada en pacientes con traumatismo craneoencefálico leve". N. inglés. J. Med . 343 (2): 100–5. doi : 10.1056/NEJM200007133430204 . PMID  10891517.
  9. ^ Edworthy SM, Zatarain E, McShane DJ, Bloch DA (1988). "Análisis de los datos de los criterios de lupus ARA de 1982 establecidos mediante metodología de partición recursiva: nuevos conocimientos sobre el mérito relativo de los criterios individuales". J. Reumatol . 15 (10): 1493–8. PMID  3060613.
  10. ^ Stiell IG, Greenberg GH, Wells GA y otros. (1996). "Validación prospectiva de una regla de decisión para el uso de radiografía en lesiones agudas de rodilla". JAMA . 275 (8): 611–5. doi :10.1001/jama.275.8.611. PMID  8594242.
  11. ^ ab Goldman L, Weinberg M, Weisberg M, et al. (mil novecientos ochenta y dos). "Un protocolo derivado de computadora para ayudar en el diagnóstico de pacientes de urgencias con dolor torácico agudo". N. inglés. J. Med . 307 (10): 588–96. doi :10.1056/NEJM198209023071004. PMID  7110205.