stringtranslate.com

Análisis secuencial

En estadística , el análisis secuencial o la prueba de hipótesis secuencial es un análisis estadístico en el que el tamaño de la muestra no está fijado de antemano. En cambio, los datos se evalúan a medida que se recopilan y se detiene el muestreo adicional de acuerdo con una regla de interrupción predefinida tan pronto como se observan resultados significativos. Por lo tanto, a veces se puede llegar a una conclusión en una etapa mucho más temprana de lo que sería posible con pruebas o estimaciones de hipótesis más clásicas , con un costo financiero y/o humano, en consecuencia, menor.

Historia

El método de análisis secuencial se atribuye por primera vez a Abraham Wald [1] con Jacob Wolfowitz , W. Allen Wallis y Milton Friedman [2] [3] mientras estaban en el Grupo de Investigación Estadística de la Universidad de Columbia como una herramienta para un control de calidad industrial más eficiente durante la época mundial. Segunda Guerra . Su valor para el esfuerzo bélico fue inmediatamente reconocido y llevó a que recibiera una clasificación "restringida" . [4] Al mismo tiempo, George Barnard dirigió un grupo que trabajaba en la parada óptima en Gran Bretaña. Otra contribución temprana al método fue realizada por KJ Arrow con D. Blackwell y MA Girshick . [5]

Alan Turing desarrolló independientemente un enfoque similar a partir de los primeros principios aproximadamente al mismo tiempo , como parte de la técnica Banburismus utilizada en Bletchley Park , para probar hipótesis sobre si diferentes mensajes codificados por máquinas alemanas Enigma deberían conectarse y analizarse juntos. Este trabajo permaneció en secreto hasta principios de los años 1980. [6]

Peter Armitage introdujo el uso del análisis secuencial en la investigación médica, especialmente en el ámbito de los ensayos clínicos. Los métodos secuenciales se hicieron cada vez más populares en medicina tras el trabajo de Stuart Pocock que proporcionó recomendaciones claras sobre cómo controlar las tasas de error tipo 1 en diseños secuenciales. [7]

Funciones de gasto alfa

Cuando los investigadores analizan datos repetidamente a medida que se agregan más observaciones, aumenta la probabilidad de cometer un error de tipo 1 . Por lo tanto, es importante ajustar el nivel alfa en cada análisis intermedio, de modo que la tasa de error tipo 1 general se mantenga en el nivel deseado. Esto es conceptualmente similar al uso de la corrección de Bonferroni , pero debido a que las miradas repetidas a los datos son dependientes, se pueden usar correcciones más eficientes para el nivel alfa. Entre las primeras propuestas se encuentra el límite de Pocock . Existen formas alternativas de controlar la tasa de error Tipo 1, como los límites de Haybittle-Peto , y O'Brien & Fleming [8] y Wang & Tsiatis han realizado trabajos adicionales para determinar los límites para los análisis provisionales . [9]

Una limitación de las correcciones como el límite de Pocock es que el número de miradas a los datos debe determinarse antes de recopilarlos, y que las miradas a los datos deben estar espaciadas equidistantemente (por ejemplo, después de 50, 100, 150 y 200). pacientes). El enfoque de la función de gasto alfa desarrollado por Demets & Lan [10] no tiene estas restricciones y, dependiendo de los parámetros elegidos para la función de gasto, puede ser muy similar a los límites de Pocock o las correcciones propuestas por O'Brien y Fleming. Otro enfoque que no tiene tales restricciones se basa en valores electrónicos y procesos electrónicos .

Aplicaciones del análisis secuencial

Ensayos clínicos

En un ensayo aleatorio con dos grupos de tratamiento, las pruebas grupales secuenciales se pueden realizar, por ejemplo, de la siguiente manera: después de que n sujetos en cada grupo estén disponibles, se realiza un análisis intermedio. Se realiza una prueba estadística para comparar los dos grupos y si se rechaza la hipótesis nula se da por terminado el ensayo; en caso contrario, el ensayo continúa, se reclutan otros n sujetos por grupo y se vuelve a realizar la prueba estadística, incluyendo a todos los sujetos. Si se rechaza la nula, se da por terminado el ensayo, y en caso contrario se continúa con evaluaciones periódicas hasta que se haya realizado un número máximo de análisis intermedios, momento en el que se realiza la última prueba estadística y se suspende el ensayo. [11]

Otras aplicaciones

El análisis secuencial también tiene una conexión con el problema de la ruina del jugador que fue estudiado, entre otros, por Huygens en 1657. [12]

La detección de pasos es el proceso de encontrar cambios abruptos en el nivel medio de una serie temporal o señal. Generalmente se considera un tipo especial de método estadístico conocido como detección de puntos de cambio . A menudo, el paso es pequeño y la serie temporal está corrompida por algún tipo de ruido, lo que hace que el problema sea un desafío porque el ruido puede ocultar el paso. Por lo tanto, a menudo se requieren algoritmos estadísticos y/o de procesamiento de señales. Cuando los algoritmos se ejecutan en línea a medida que llegan los datos, especialmente con el objetivo de producir una alerta, se trata de una aplicación de análisis secuencial.

Inclinación

Los ensayos que finalizan anticipadamente porque rechazan la hipótesis nula suelen sobreestimar el verdadero tamaño del efecto. [13] Esto se debe a que en muestras pequeñas, sólo las estimaciones de tamaño de efecto grandes conducirán a un efecto significativo y a la posterior terminación de un ensayo. Se han propuesto métodos para corregir las estimaciones del tamaño del efecto en ensayos únicos. [14] Tenga en cuenta que este sesgo es principalmente problemático al interpretar estudios individuales. En los metanálisis, los tamaños del efecto sobreestimados debido a la interrupción temprana se equilibran con la subestimación en los ensayos que se detienen tarde, lo que lleva a Schou & Marschner a concluir que "la interrupción temprana de los ensayos clínicos no es una fuente importante de sesgo en los metanálisis". [15]

El significado de los valores p en los análisis secuenciales también cambia, porque cuando se utilizan análisis secuenciales, se realiza más de un análisis y es necesario redefinir la definición típica de un valor p como datos "al menos tan extremos" como los observados. . Una solución es ordenar los valores p de una serie de pruebas secuenciales en función del tiempo de parada y de qué tan alto fue el estadístico de prueba en un aspecto determinado, lo que se conoce como ordenamiento por etapas, [13] propuesto por primera vez por Armitage .

Ver también

Notas

  1. ^ Wald, Abraham (junio de 1945). "Pruebas secuenciales de hipótesis estadísticas". Los anales de la estadística matemática . 16 (2): 117–186. doi : 10.1214/aoms/1177731118 . JSTOR  2235829.
  2. ^ Berger, James (2008). "Análisis secuencial". (2ª ed.). págs. 438–439. doi :10.1057/9780230226203.1513. ISBN 978-0-333-78676-5. {{cite book}}: |journal=ignorado ( ayuda ) ; Falta o está vacío |title=( ayuda )
  3. ^ "El Grupo de Investigación Estadística, 1942-1945", Wallis 1980 (doi:10.1080/01621459.1980.10477469)
  4. ^ Weigl, Hans Günter (2013). Abraham Wald: un estadístico como figura clave de la econometría moderna (PDF) (Tesis doctoral). Universidad de Hamburgo.
  5. ^ Kenneth J. Arrow , David Blackwell y MA Girshick (1949). "Soluciones Bayes y minimax de problemas de decisión secuencial". Econométrica . 17 (3/4): 213–244. doi :10.2307/1905525. JSTOR  1905525.
  6. ^ Randell, Brian (1980), "The Colossus", Una historia de la informática en el siglo XX , p. 30
  7. ^ W., Turnbull, Bruce (2000). Agrupar métodos secuenciales con aplicaciones a ensayos clínicos . Chapman y Hall. ISBN 9780849303166. OCLC  900071609.{{cite book}}: Mantenimiento CS1: varios nombres: lista de autores ( enlace )
  8. ^ O'Brien, Peter C.; Fleming, Thomas R. (1 de enero de 1979). "Un procedimiento de pruebas múltiples para ensayos clínicos". Biometría . 35 (3): 549–556. doi :10.2307/2530245. JSTOR  2530245. PMID  497341.
  9. ^ Wang, Samuel K.; Tsiatis, Anastasios A. (1 de enero de 1987). "Límites de un parámetro aproximadamente óptimos para ensayos secuenciales grupales". Biometría . 43 (1): 193-199. doi : 10.2307/2531959. JSTOR  2531959. PMID  3567304.
  10. ^ Demets, David L .; Lan, KK Gordon (15 de julio de 1994). "Análisis intermedio: el enfoque de la función de gasto alfa". Estadística en Medicina . 13 (13-14): 1341-1352. doi :10.1002/sim.4780131308. ISSN  1097-0258. PMID  7973215.
  11. ^ Korosteleva, Olga (2008). Estadísticas clínicas: introducción de ensayos clínicos, análisis de supervivencia y análisis de datos longitudinales (Primera ed.). Editores Jones y Bartlett . ISBN 978-0-7637-5850-9.
  12. ^ Ghosh, BK; Sen, PK (1991). Manual de análisis secuencial . Nueva York: Marcel Dekker . ISBN 9780824784089.[ página necesaria ]
  13. ^ ab Proschan, Michael A.; Lan, KK Gordan; Wittes, Janet Turk (2006). Seguimiento estadístico de ensayos clínicos: un enfoque unificado . Saltador. ISBN 9780387300597. OCLC  553888945.
  14. ^ Liu, A.; Hall, WJ (1 de marzo de 1999). "Estimación imparcial tras una prueba secuencial grupal". Biometrika . 86 (1): 71–78. doi :10.1093/biomet/86.1.71. ISSN  0006-3444.
  15. ^ Schou, I. Manjula; Marschner, Ian C. (10 de diciembre de 2013). "Metanálisis de ensayos clínicos con interrupción temprana: una investigación del posible sesgo". Estadística en Medicina . 32 (28): 4859–4874. doi :10.1002/sim.5893. ISSN  1097-0258. PMID  23824994. S2CID  22428591.

Referencias

enlaces externos

Comercial