stringtranslate.com

Diseño de arriba a abajo

Los diseños de arriba y abajo (UDD) son una familia de diseños de experimentos estadísticos utilizados en experimentos de búsqueda de dosis en ciencia, ingeniería e investigación médica. Los experimentos de búsqueda de dosis tienen respuestas binarias : cada resultado individual puede describirse como uno de dos valores posibles, como éxito vs. fracaso o tóxico vs. no tóxico. Matemáticamente, las respuestas binarias se codifican como 1 y 0. El objetivo de los experimentos de búsqueda de dosis es estimar la fuerza del tratamiento (es decir, la "dosis") que desencadenaría la respuesta "1" una proporción preestablecida del tiempo. Esta dosis puede visualizarse como un percentil de la distribución de los umbrales de respuesta. Un ejemplo en el que se utiliza la búsqueda de dosis es en un experimento para estimar la DL50 de alguna sustancia química tóxica con respecto a los ratones.

Experimentos simulados de tres UDD diferentes. Las respuestas 0 y 1 están marcadas con o y x, respectivamente. De arriba a abajo: el UDD "simple" original que apunta a la mediana, un UDD de moneda sesgada de Durham-Flournoy que apunta aproximadamente al percentil 20,6% y un UDD "transformado" de k en una fila que apunta al mismo percentil.

Los diseños de búsqueda de dosis son secuenciales y adaptativos a la respuesta: la dosis en un punto dado del experimento depende de resultados anteriores, en lugar de ser fija a priori . Los diseños de búsqueda de dosis son generalmente más eficientes para esta tarea que los diseños fijos, pero sus propiedades son más difíciles de analizar y algunos requieren software de diseño especializado. Los UDD utilizan un conjunto discreto de dosis en lugar de variar la dosis de forma continua. Son relativamente simples de implementar y también se encuentran entre los diseños de búsqueda de dosis mejor comprendidos. A pesar de esta simplicidad, los UDD generan recorridos aleatorios con propiedades intrincadas. [1] El UDD original tenía como objetivo encontrar el umbral mediano aumentando la dosis un nivel después de una respuesta "0" y disminuyéndola un nivel después de una respuesta "1". De ahí el nombre "arriba y abajo". Otros UDD rompen esta simetría para estimar percentiles distintos de la mediana, o pueden tratar grupos de sujetos en lugar de uno a la vez.

Los métodos UDD fueron desarrollados en la década de 1940 por varios grupos de investigación de forma independiente. [2] [3] [4] En las décadas de 1950 y 1960 se produjo una rápida diversificación, con métodos UDD que apuntaban a percentiles distintos de la mediana y se expandieron a numerosos campos de aplicación. En la década de 1970 y principios de la de 1990 se realizaron pocas investigaciones sobre métodos UDD, aunque el diseño siguió utilizándose ampliamente. Un resurgimiento de la investigación sobre métodos UDD desde la década de 1990 ha proporcionado una comprensión más profunda de los métodos UDD y sus propiedades, [5] y métodos de estimación nuevos y mejores. [6] [7]

Los UDD todavía se utilizan ampliamente en las dos aplicaciones para las que se desarrollaron originalmente: psicofísica , donde se utilizan para estimar los umbrales sensoriales y a menudo se conocen como procedimientos fijos de escalera de elección forzada [8] , y pruebas de sensibilidad explosiva, donde el UDD de objetivo mediano a menudo se conoce como la prueba de Bruceton . Los UDD también son muy populares en la investigación de toxicidad y anestesiología [9] . También se consideran una opción viable para los ensayos clínicos de fase I [10] .

Descripción matemática

Definición

Sea el tamaño de muestra de un experimento UDD, y suponiendo por ahora que los sujetos son tratados uno a la vez. Entonces las dosis que reciben estos sujetos, denotadas como variables aleatorias , se eligen de un conjunto discreto y finito de niveles de dosis crecientes . Además, si , entonces de acuerdo con reglas constantes simples basadas en respuestas recientes. El siguiente sujeto debe ser tratado un nivel arriba, un nivel abajo o al mismo nivel que el sujeto actual. Las respuestas en sí mismas se denotan de aquí en adelante las respuestas "1" son positivas y "0" negativas. La aplicación repetida de las mismas reglas (conocidas como reglas de transición de dosis ) sobre un conjunto finito de niveles de dosis, se convierte en un paseo aleatorio sobre . Diferentes reglas de transición de dosis producen diferentes "sabores" de UDD, como los tres que se muestran en la figura anterior.

A pesar de que el experimento utiliza solo un conjunto discreto de niveles de dosis, se supone que la variable de magnitud de dosis en sí, , es continua, y se supone que la probabilidad de respuesta positiva aumenta continuamente con el aumento de . El objetivo de los experimentos de búsqueda de dosis es estimar la dosis (en una escala continua) que desencadenaría respuestas positivas a una tasa objetivo preestablecida ; a menudo conocida como la "dosis objetivo". Este problema también se puede expresar como una estimación del cuantil de una función de distribución acumulativa que describe la curva de dosis-toxicidad . La función de densidad asociada con es interpretable como la distribución de los umbrales de respuesta de la población en estudio.

Matriz de probabilidad de transición

Dado que un sujeto recibe una dosis , denotemos la probabilidad de que el siguiente sujeto reciba una dosis , o , como o , respectivamente. Estas probabilidades de transición obedecen a las restricciones y las condiciones de contorno .

Cada conjunto específico de reglas de UDD permite el cálculo simbólico de estas probabilidades, generalmente como una función de . Suponiendo que las probabilidades de transición son fijas en el tiempo, dependiendo solo de la asignación actual y su resultado, es decir, de y a través de ellos (y posiblemente de un conjunto de parámetros fijos). Las probabilidades se representan mejor a través de una matriz de probabilidad de transición tridiagonal (TPM) :

Punto de equilibrio

Por lo general, las reglas de transición de dosis UDD reducen la dosis (o al menos evitan que aumente) después de respuestas positivas, y viceversa. Por lo tanto, los recorridos aleatorios UDD tienen una tendencia central: las asignaciones de dosis tienden a deambular de un lado a otro alrededor de alguna dosis que se puede calcular a partir de las reglas de transición, cuando estas se expresan como una función de . [1] Esta dosis a menudo se ha confundido con el objetivo formal del experimento , y los dos suelen ser idénticos, pero no tienen por qué serlo. El objetivo es la dosis que el experimento tiene la tarea de estimar, mientras que , conocido como el "punto de equilibrio", es aproximadamente donde gira el recorrido aleatorio del UDD. [11]

Distribución estacionaria de las asignaciones de dosis

Dado que los paseos aleatorios UDD son cadenas de Markov regulares , generan una distribución estacionaria de asignaciones de dosis, , una vez que desaparece el efecto de la dosis inicial elegida manualmente. Esto significa que las frecuencias de visitas a largo plazo a las diversas dosis se aproximarán a un estado estable descrito por . Según la teoría de la cadena de Markov, el efecto de la dosis inicial desaparece con bastante rapidez, a una tasa geométrica. [12] Los estudios numéricos sugieren que, por lo general, se necesitarían entre y sujetos para que el efecto desapareciera casi por completo. [11] también es la distribución asintótica de las asignaciones de dosis acumuladas.

Las tendencias centrales de los UDD garantizan que, a largo plazo, la dosis visitada con mayor frecuencia (es decir, la moda de ) será una de las dos dosis más cercanas al punto de equilibrio . [1] Si está fuera del rango de dosis permitidas, entonces la moda estará en la dosis límite más cercana a ella. Bajo el UDD original de búsqueda de mediana, la moda estará en la dosis más cercana a en cualquier caso. Lejos de la moda, las frecuencias de visita asintótica disminuyen bruscamente, a una tasa más rápida que la geométrica. Aunque un experimento UDD sigue siendo un paseo aleatorio, las largas excursiones fuera de la región de interés son muy poco probables.

Ejemplos de distribuciones estacionarias UDD con . Izquierda: UDD original ("clásica"), . Derecha: moneda sesgada que apunta al percentil 30,

UDD comunes

UDD original ("simple" o "clásica")

El método UDD "simple" o "clásico" original aumenta la dosis un nivel en caso de una respuesta negativa, y viceversa. Por lo tanto, las probabilidades de transición son

Usamos el UDD original como ejemplo para calcular el punto de equilibrio . Las funciones 'arriba' y 'abajo' del diseño son Las equiparamos para encontrar : El UDD "clásico" está diseñado para encontrar el umbral mediano. Este es un caso en el que

El UDD "clásico" puede verse como un caso especial de cada uno de los diseños más versátiles que se describen a continuación.

El diseño sesgado de la moneda de Durham y Flournoy

Este diseño de moneda sesgada (BCD) cambia el punto de equilibrio, añadiendo la opción de tratar al siguiente sujeto con la misma dosis en lugar de solo avanzar hacia arriba o hacia abajo. La permanencia o no se determina mediante un lanzamiento aleatorio de una "moneda" metafórica con probabilidad. Este diseño de moneda sesgada (BCD) tiene dos "sabores", uno para y otro para cuyas reglas se muestran a continuación:

La probabilidad de cara puede tomar cualquier valor en . El punto de equilibrio es

El punto de equilibrio BCD puede hacerse idéntico a una tasa objetivo estableciendo la probabilidad de cara en . Por ejemplo, para el conjunto . La configuración hace que este diseño sea idéntico al UDD clásico, e invirtiendo las reglas al imponer el lanzamiento de la moneda sobre resultados positivos en lugar de negativos, produce puntos de equilibrio superiores a la mediana. También se han publicado versiones con dos monedas, una para cada resultado, pero no parecen ofrecer una ventaja sobre el BCD más simple de una sola moneda.

UDD de grupo (cohorte)

Algunos experimentos de búsqueda de dosis, como los ensayos de fase I, requieren un período de espera de semanas antes de determinar cada resultado individual. Puede ser preferible entonces poder tratar a varios sujetos a la vez o en rápida sucesión. Con los UDD grupales, las reglas de transición se aplican a cohortes de tamaño fijo en lugar de a individuos. se convierte en la dosis administrada a la cohorte y es el número de respuestas positivas en la cohorte -ésima, en lugar de un resultado binario. Dado que la cohorte -ésima se trata en el interior de la cohorte -ésima se asigna a

Siguen una distribución binomial condicional a , con parámetros y . Las probabilidades de subida y bajada son las colas de la distribución binomial, y la probabilidad de permanencia es su centro (es cero si ). Una elección específica de parámetros se puede abreviar como GUD

En teoría, los diseños de grupos no binarios generan recorridos aleatorios de orden 1, ya que se necesitan las observaciones más recientes para determinar la siguiente asignación. Sin embargo, si las cohortes se consideran entidades matemáticas individuales, estos diseños generan un recorrido aleatorio de primer orden que tiene un TPM tridiagonal como el anterior. Algunas subfamilias de diseños de grupos no binarios relevantes:

Con estaría asociado con y , respectivamente. La familia de imágenes especulares GUD tiene sus puntos de equilibrio en uno menos estas probabilidades.

Para los UDD del grupo general, el punto de equilibrio se puede calcular solo numéricamente, encontrando la dosis con una tasa de toxicidad tal que

Se puede utilizar cualquier algoritmo numérico de búsqueda de raíces, por ejemplo, Newton-Raphson , para resolver . [13]

k {\displaystyle k} UDD en fila (o "transformada" o "geométrica")

Este es el método de diseño unidimensional no mediano más utilizado. Fue introducido por Wetherill en 1963 [14] y poco después lo proliferó junto con sus colegas en la psicofísica [15] , donde sigue siendo uno de los métodos estándar para encontrar umbrales sensoriales [8] . Wetherill lo llamó método unidimensional "transformado"; Misrak Gezmu , que fue el primero en analizar sus propiedades de recorrido aleatorio, lo llamó método unidimensional "geométrico" en los años 1990 [16] y en los años 2000 se adoptó el nombre más sencillo de método unidimensional "en fila". [11] Las reglas del diseño son engañosamente simples:

Cada escalada de dosis requiere que no se observen toxicidades en puntos de datos consecutivos, todos con la dosis actual, mientras que la desescalada solo requiere una única toxicidad. Se parece mucho a la GUD descrita anteriormente y, de hecho, comparte el mismo punto de equilibrio. La diferencia es que la -in-a-row puede salir de un nivel de dosis tras la primera toxicidad, mientras que su grupo hermano UDD podría tratar a toda la cohorte a la vez y, por lo tanto, podría ver más de una toxicidad antes de descender.

El método utilizado en los estudios sensoriales es en realidad una imagen especular del definido anteriormente, con respuestas sucesivas requeridas para una desescalada y sólo una no respuesta para la escalada, lo que da como resultado . [17]

-in-a-row genera un paseo aleatorio de -ésimo orden porque podría ser necesario conocer las últimas respuestas. Puede representarse como una cadena de primer orden con estados, o como una cadena de Markov con niveles, cada uno con estados internos etiquetados como El estado interno sirve como un contador del número de no toxicidades consecutivas inmediatamente recientes observadas en la dosis actual. Esta descripción es más cercana al proceso físico de asignación de dosis, porque a los sujetos en diferentes estados internos del nivel , se les asigna a todos la misma dosis . De cualquier manera, el TPM es (o más precisamente, , porque el contador interno no tiene sentido en la dosis más alta) - y no es tridiagonal.

Aquí se muestra el TPM en fila expandido con y , usando la abreviatura Los estados internos de cada nivel son adyacentes entre sí.

-En fila se suele considerar para ensayos clínicos que apuntan a una dosis de baja toxicidad. En este caso, el punto de equilibrio y el objetivo no son idénticos; más bien, se elige para apuntar cerca de la tasa objetivo, por ejemplo, para estudios que apuntan al percentil 30 y para estudios que apuntan al percentil 20.

Estimación de la dosis objetivo

Ejemplo de estimación de promedio de reversión de un experimento de psicofísica. Los puntos de reversión están rodeados con un círculo y la primera reversión se excluyó del promedio. El diseño es de dos etapas, con la segunda (y principal) etapa consecutiva que apunta al percentil 70,7%. La primera etapa (hasta la primera reversión) utiliza el UDD "clásico", un esquema comúnmente empleado para acelerar la llegada a la región de interés.

A diferencia de otros enfoques de diseño, los UDD no tienen un método de estimación específico "incluido" con el diseño como opción predeterminada. Históricamente, la opción más común ha sido un promedio ponderado de las dosis administradas, generalmente excluyendo las primeras dosis para mitigar el sesgo del punto de partida. Este enfoque es anterior a una comprensión más profunda de las propiedades de Markov de los UDD, pero su éxito en las evaluaciones numéricas depende del muestreo final de , ya que este último se centra aproximadamente en [5]

El más popular de estos estimadores de promedio fue introducido por Wetherill et al. en 1966, y solo incluye puntos de reversión (puntos donde el resultado cambia de 0 a 1 o viceversa) en el promedio. [18] En los últimos años, han salido a la luz las limitaciones de los estimadores de promedio, en particular las muchas fuentes de sesgo que son muy difíciles de mitigar. Los estimadores de reversión sufren tanto de sesgos múltiples (aunque hay cierta cancelación involuntaria de sesgos) como de una mayor varianza debido al uso de una submuestra de dosis. Sin embargo, el conocimiento sobre las limitaciones de los estimadores de promedio aún no se ha difundido fuera de la literatura metodológica y no ha afectado a la práctica real. [5]

Por el contrario, los estimadores de regresión intentan aproximarse a la curva que describe la relación dosis-respuesta , en particular alrededor del percentil objetivo. Los datos brutos para la regresión son las dosis en el eje horizontal y las frecuencias de toxicidad observadas, en el eje vertical. La estimación objetivo es la abscisa del punto donde la curva ajustada cruza

La regresión probit se ha utilizado durante muchas décadas para estimar los objetivos de UDD, aunque con mucha menos frecuencia que el estimador de promedio inverso. En 2002, Stylianou y Flournoy introdujeron una versión interpolada de la regresión isotónica (IR) para estimar los objetivos de UDD y otros datos de respuesta a la dosis. [6] Más recientemente, Oron y Flournoy desarrollaron una modificación llamada "regresión isotónica centrada" (CIR), que promete un rendimiento de estimación sustancialmente mejor que la regresión isotónica ordinaria en la mayoría de los casos, y también ofrece el primer estimador de intervalo viable para la regresión isotónica en general. [7] Los estimadores de regresión isotónica parecen ser los más compatibles con las UDD, porque ambos enfoques son no paramétricos y relativamente robustos. [5] El paquete R "cir" disponible públicamente implementa tanto la CIR como la IR para la búsqueda de dosis y otras aplicaciones. [19]

Referencias

  1. ^ abc Durham, SD; Flournoy, N. "Diseños ascendentes y descendentes. I. Distribuciones de tratamiento estacionarias". En Flournoy, N; Rosenberger, WF (eds.). Serie de monografías de notas de conferencias de IMS . Vol. 25: Diseños adaptativos. págs. 139–157.
  2. ^ Dixon, WJ; Mood, AM (1948). "Un método para obtener y analizar datos de sensibilidad". Revista de la Asociación Estadounidense de Estadística . 43 (241): 109–126. doi :10.1080/01621459.1948.10483254.
  3. ^ von Békésy, G (1947). "Un nuevo audiómetro". Acta Oto-Laryngologica . 35 (5–6): 411–422. doi :10.3109/00016484709123756.
  4. ^ Anderson, T. W.; McCarthy, P. J.; Tukey, J. W. (1946).Método de «escalera» para la comprobación de la sensibilidad (informe técnico). Naval Ordnance Report. 65-46.
  5. ^ abcd Flournoy, N; Oron, AP. "Diseños ascendentes y descendentes para la determinación de dosis". En Dean, A (ed.). Manual de diseño y análisis de experimentos . CRC Press. págs. 858–894.
  6. ^ ab Stylianou, MP; Flournoy, N (2002). "Detección de dosis mediante el diseño de moneda sesgada arriba y abajo y regresión isotónica". Biometrics . 58 (1): 171–177. doi :10.1111/j.0006-341x.2002.00171.x. PMID  11890313. S2CID  8743090.
  7. ^ ab Oron, AP; Flournoy, N (2017). "Regresión isotónica centrada: estimación puntual e interválica para estudios dosis-respuesta". Estadísticas en investigación biofarmacéutica . 9 (3): 258–267. arXiv : 1701.05964 . doi :10.1080/19466315.2017.1286256. S2CID  88521189.
  8. ^ ab Leek, MR (2001). "Procedimientos adaptativos en la investigación psicofísica". Percepción y psicofísica . 63 (8): 1279–1292. doi : 10.3758/bf03194543 . PMID  11800457.
  9. ^ Pace, NL; Stylianou, MP (2007). "Avances y limitaciones de la metodología de arriba y abajo: un resumen del uso clínico, el diseño de estudios y la estimación de dosis en la investigación en anestesia". Anestesiología . 107 (1): 144–152. doi : 10.1097/01.anes.0000267514.42592.2a . PMID  17585226.
  10. ^ Oron, AP; Hoff, PD (2013). "Comportamiento de muestras pequeñas de nuevos diseños de ensayos de fase I sobre el cáncer". Ensayos clínicos . 10 (1): 63–80. arXiv : 1202.4962 . doi :10.1177/1740774512469311. PMID  23345304. S2CID  5667047.
  11. ^ abc Oron, AP; Hoff, PD (2009). "El diseño ascendente y descendente k-in-a-row, revisado". Estadística en Medicina . 28 (13): 1805–1820. doi :10.1002/sim.3590. PMID  19378270. S2CID  25904900.
  12. ^ Diaconis, P; Stroock, D (1991). "Límites geométricos para valores propios de la cadena de Markov". Anales de probabilidad aplicada . 1 : 36–61. doi : 10.1214/aoap/1177005980 .
  13. ^ Gezmu, M ; Flournoy, N (2006). "Diseños de grupos ascendentes y descendentes para la determinación de dosis". Revista de planificación estadística e inferencia . 136 (6): 1749–1764. doi :10.1016/j.jspi.2005.08.002.
  14. ^ Wetherill, GB; Levitt, H (1963). "Estimación secuencial de curvas de respuesta cuántica". Revista de la Royal Statistical Society, Serie B. 25 : 1–48. doi : 10.1111/j.2517-6161.1963.tb00481.x.
  15. ^ Wetherill, GB (1965). "Estimación secuencial de puntos en una función psicométrica". British Journal of Mathematical and Statistical Psychology . 18 : 1–10. doi :10.1111/j.2044-8317.1965.tb00689.x. PMID  14324842.
  16. ^ Gezmu, Misrak (1996). El diseño geométrico ascendente y descendente para la asignación de niveles de dosis (PhD). Universidad Americana.
  17. ^ Garcia-Perez, MA (1998). "Escaleras de elección forzada con tamaños de escalones fijos: propiedades asintóticas y de muestras pequeñas". Vision Research . 38 (12): 1861–81. doi : 10.1016/s0042-6989(97)00340-4 . PMID  9797963.
  18. ^ Wetherill, GB; Chen, H; Vasudeva, RB (1966). "Estimación secuencial de curvas de respuesta cuántica: un nuevo método de estimación". Biometrika . 53 (3–4): 439–454. doi :10.1093/biomet/53.3-4.439.
  19. ^ Oron, Assaf. «Paquete 'cir'». CRAN . R Foundation for Statistical Computing . Consultado el 26 de diciembre de 2020 .