stringtranslate.com

Aleatorización restringida

En estadística , la aleatorización restringida ocurre en el diseño de experimentos y, en particular, en el contexto de experimentos aleatorios y ensayos controlados aleatorios . La aleatorización restringida permite evitar asignaciones intuitivamente deficientes de tratamientos a unidades experimentales, manteniendo al mismo tiempo los beneficios teóricos de la aleatorización. [1] [2] Por ejemplo, en un ensayo clínico de un nuevo tratamiento propuesto para la obesidad en comparación con un control, un experimentador querría evitar resultados de la aleatorización en los que el nuevo tratamiento se asignara solo a los pacientes con mayor peso.

El concepto fue introducido por Frank Yates (1948) [ cita completa necesaria ] y William J. Youden (1972) [ cita completa necesaria ] "como una forma de evitar malos patrones espaciales de tratamientos en experimentos diseñados". [3]

Ejemplo de datos anidados

Considere un proceso por lotes que utiliza 7 obleas de monitor en cada ejecución. El plan exige además medir una variable de respuesta en cada oblea en cada uno de los nueve sitios. La organización del plan de muestreo tiene una estructura jerárquica o anidada: el lote es el nivel más alto, el segundo nivel es una oblea individual y el tercer nivel es el sitio en la oblea.

La cantidad total de datos generados por lote será 7 · 9 = 63 observaciones. Un enfoque para analizar estos datos sería calcular la media de todos estos puntos así como su desviación estándar y utilizar esos resultados como respuestas para cada ejecución.

Analizar los datos como se sugirió anteriormente no es absolutamente incorrecto, pero al hacerlo se pierde información que de otro modo se podría obtener. Por ejemplo, el sitio 1 de la oblea 1 es físicamente diferente del sitio 1 de la oblea 2 o de cualquier otra oblea. Lo mismo ocurre con cualquiera de los sitios de cualquiera de las obleas. De manera similar, la oblea 1 en el experimento 1 es físicamente diferente de la oblea 1 en el experimento 2, y así sucesivamente. Para describir esta situación se dice que los sitios están anidados dentro de obleas mientras que las obleas están anidadas dentro de ejecuciones.

Como consecuencia de este anidamiento, existen restricciones en la aleatorización que puede ocurrir en el experimento. Este tipo de aleatorización restringida siempre produce fuentes de variación anidadas. Ejemplos de variación anidada o aleatorización restringida que se analizan en esta página son los diseños de parcela dividida y de parcela dividida .

El objetivo de un experimento con este tipo de plan de muestreo es generalmente reducir la variabilidad debida a los sitios en las obleas y las obleas dentro de corridas (o lotes) en el proceso. Los sitios en las obleas y las obleas dentro de un lote se convierten en fuentes de variación no deseada y un investigador busca hacer que el sistema sea resistente a esas fuentes; en otras palabras, se podrían tratar las obleas y los sitios como factores de ruido en tal experimento.

Debido a que las obleas y los sitios representan fuentes de variación no deseadas y debido a que uno de los objetivos es reducir la sensibilidad del proceso a estas fuentes de variación, tratar las obleas y los sitios como efectos aleatorios en el análisis de los datos es un enfoque razonable. En otras palabras, la variación anidada es a menudo otra forma de decir efectos aleatorios anidados o fuentes de ruido anidadas. Si los factores "obleas" y "sitios" se tratan como efectos aleatorios, entonces es posible estimar un componente de varianza debido a cada fuente de variación mediante técnicas de análisis de varianza . Una vez que se han obtenido las estimaciones de los componentes de la varianza, un investigador puede determinar la mayor fuente de variación en el proceso bajo experimentación y también determinar las magnitudes de las otras fuentes de variación en relación con la fuente más grande.

Efectos aleatorios anidados

Si un experimento o proceso tiene variación anidada, el experimento o proceso tiene múltiples fuentes de error aleatorio que afectan su resultado. Tener efectos aleatorios anidados en un modelo es lo mismo que tener variación anidada en un modelo.

Diseños de parcela dividida

Los diseños de parcela dividida resultan cuando se ha producido un tipo particular de aleatorización restringida durante el experimento. Un experimento factorial simple puede resultar en un tipo de diseño de parcela dividida debido a la forma en que se ejecutó realmente el experimento.

En muchos experimentos industriales suelen ocurrir tres situaciones:

  1. algunos de los factores de interés pueden ser "difíciles de variar", mientras que los factores restantes son fáciles de variar. Como resultado, el orden en el que se ejecutan las combinaciones de tratamientos para el experimento está determinado por el orden de estos factores "difíciles de variar".
  2. Las unidades experimentales se procesan juntas como un lote para uno o más de los factores en una combinación de tratamiento particular.
  3. Las unidades experimentales se procesan individualmente, una tras otra, para la misma combinación de tratamientos sin restablecer la configuración de los factores para esa combinación de tratamientos.

Ejemplos experimentales de trama dividida

Un experimento realizado en una de las tres situaciones anteriores suele dar como resultado un diseño del tipo de parcela dividida. Considere un experimento para examinar la galvanoplastia de aluminio (no acuoso) sobre tiras de cobre. Los tres factores de interés son: corriente (A); temperatura de la solución (T); y la concentración de la solución del agente de recubrimiento (S). La tasa de recubrimiento es la respuesta medida. Para el experimento hay en total 16 tiras de cobre disponibles. Las combinaciones de tratamientos que se ejecutarán (escaladas ortogonalmente) se enumeran a continuación en orden estándar (es decir, no han sido aleatorizadas):

Ejemplo: algunos factores son difíciles de variar

Considere realizar el experimento bajo la primera condición enumerada anteriormente, siendo difícil variar la concentración de la solución del factor del agente de recubrimiento (S). Dado que este factor es difícil de variar, al experimentador le gustaría aleatorizar las combinaciones de tratamientos de modo que el factor de concentración de la solución tenga un número mínimo de cambios. En otras palabras, la aleatorización de los tratamientos está algo restringida por el nivel del factor de concentración de la solución.

Como resultado, las combinaciones de tratamientos podrían ser aleatorias de modo que aquellas ejecuciones de tratamiento correspondientes a un nivel de concentración (-1) se ejecuten primero. Cada tira de cobre está revestida individualmente, lo que significa que solo se coloca una tira a la vez en la solución para una combinación de tratamiento determinada. Una vez que se han completado las cuatro ejecuciones al nivel bajo de concentración de la solución, la solución se cambia al nivel alto de concentración (1) y se realizan las cuatro ejecuciones restantes del experimento (donde nuevamente, cada tira se recubre individualmente).

Una vez que se ha completado una réplica completa del experimento, se realiza una segunda réplica con un conjunto de cuatro tiras de cobre procesadas para un nivel determinado de concentración de solución antes de cambiar la concentración y procesar las cuatro tiras restantes. Tenga en cuenta que los niveles de los dos factores restantes aún se pueden aleatorizar. Además, el nivel de concentración que se ejecuta primero en las ejecuciones de replicación también puede ser aleatorio.

Realizar el experimento de esta manera da como resultado un diseño de parcelas divididas . La concentración de la solución se conoce como factor de trama completa y los factores de trama secundaria son la temperatura actual y la temperatura de la solución.

Un diseño de parcelas divididas tiene más de una unidad experimental de tamaño . En este experimento, una unidad experimental de tamaño es una tira de cobre individual. Los tratamientos o factores que se aplicaron a las tiras individuales son la temperatura de la solución y la corriente (estos factores se cambiaron cada vez que se colocó una nueva tira en la solución). La otra unidad experimental, o de mayor tamaño, es un conjunto de cuatro tiras de cobre. El tratamiento o factor que se aplicó a un conjunto de cuatro tiras es la concentración de la solución (este factor se cambió después de procesar cuatro tiras). La unidad experimental de menor tamaño se denomina unidad experimental de subparcela , mientras que la unidad experimental más grande se denomina unidad de parcela completa .

Hay 16 unidades experimentales de subtrama para este experimento. La temperatura y la corriente de la solución son los factores de la trama secundaria en este experimento. En este experimento hay cuatro unidades experimentales de parcela completa. La concentración de la solución es el factor de toda la trama en este experimento. Dado que hay dos tamaños de unidades experimentales, hay dos términos de error en el modelo, uno que corresponde al error de parcela completa o unidad experimental de parcela completa y otro que corresponde al error de parcela completa o unidad experimental de parcela completa.

La tabla ANOVA para este experimento sería, en parte, como sigue:

Las primeras tres fuentes son del nivel de la trama completa, mientras que las 12 siguientes son de la parte de la trama secundaria. Se podría utilizar un gráfico de probabilidad normal de las estimaciones de los términos de las 12 subtramas para buscar términos estadísticamente significativos .

Ejemplo: proceso por lotes

Considere realizar el experimento bajo la segunda condición mencionada anteriormente (es decir, un proceso por lotes) para el cual se colocan cuatro tiras de cobre en la solución a la vez. Se puede aplicar un nivel específico de corriente a una tira individual dentro de la solución. Se ejecutan las mismas 16 combinaciones de tratamientos (un factorial 2 3 replicado) que en el primer escenario. Sin embargo, la forma en que se realiza el experimento sería diferente. Hay cuatro combinaciones de tratamiento de temperatura y concentración de la solución: (−1, −1), (−1, 1), (1, −1), (1, 1). El experimentador elige al azar uno de estos cuatro tratamientos para configurarlo primero. Se colocan cuatro tiras de cobre en la solución. Dos de las cuatro tiras se asignan aleatoriamente al nivel de corriente bajo. Las dos franjas restantes están asignadas al nivel de corriente alto. Se realiza el recubrimiento y se mide la respuesta. Se elige una segunda combinación de tratamiento de temperatura y concentración y se sigue el mismo procedimiento. Esto se hace para las cuatro combinaciones de temperatura/concentración.

Realizar el experimento de esta manera también da como resultado un diseño de parcela dividida en el que los factores de la parcela completa son ahora la concentración y la temperatura de la solución, y el factor de la subparcela es el actual.

En este experimento, una unidad de ensayo de un tamaño vuelve a ser una tira de cobre individual. El tratamiento o factor que se aplicó a las tiras individuales es el actual (este factor se cambió cada vez para una tira diferente dentro de la solución). La otra unidad experimental, o de mayor tamaño, es nuevamente un conjunto de cuatro tiras de cobre. Los tratamientos o factores que se aplicaron a un conjunto de cuatro tiras son la concentración de la solución y la temperatura de la solución (estos factores se cambiaron después de procesar cuatro tiras).

La unidad experimental de menor tamaño se denomina nuevamente unidad experimental de subparcela. Hay 16 unidades experimentales de subtrama para este experimento. La corriente es el factor de la trama secundaria en este experimento.

La unidad experimental de mayor tamaño es la unidad experimental de parcela completa. Hay cuatro unidades experimentales de trama completa en este experimento y la concentración y la temperatura de la solución son los factores de la trama completa en este experimento.

Hay dos tamaños de unidades experimentales y hay dos términos de error en el modelo: uno que corresponde al error de parcela completa o unidad experimental de parcela completa, y otro que corresponde al error de parcela completa o unidad experimental de parcela completa.

El ANOVA para este experimento se ve, en parte, como sigue:

Las primeras tres fuentes provienen del nivel de la trama completa y las cinco siguientes provienen del nivel de la subtrama. Dado que hay 8 grados de libertad para el término de error de la subtrama, este MSE se puede utilizar para probar cada efecto que involucra la corriente.

Ejemplo: unidades experimentales procesadas individualmente

Considere realizar el experimento en el tercer escenario mencionado anteriormente. Sólo hay una tira de cobre en la solución a la vez. Sin embargo, dos tiras, una de baja corriente y otra de alta corriente, se procesan una tras otra bajo el mismo ajuste de temperatura y concentración. Una vez que se han procesado dos tiras, se cambia la concentración y la temperatura se restablece a otra combinación. Bajo este ajuste de temperatura y concentración se procesan de nuevo dos tiras una tras otra. Este proceso continúa hasta que se hayan procesado las 16 tiras de cobre.

Realizar el experimento de esta manera también da como resultado un diseño de parcela dividida en el que los factores de la parcela completa son nuevamente la concentración y la temperatura de la solución y el factor de la subparcela es el actual. En este experimento, una unidad experimental de tamaño es una tira de cobre individual. El tratamiento o factor que se aplicó a las tiras individuales es el actual (este factor se cambió cada vez para una tira diferente dentro de la solución). La otra unidad experimental, o de mayor tamaño, es un conjunto de dos tiras de cobre. Los tratamientos o factores que se aplicaron a un par de dos tiras son la concentración de la solución y la temperatura de la solución (estos factores se cambiaron después de procesar dos tiras). La unidad experimental de menor tamaño se denomina unidad experimental de subparcela.

Hay 16 unidades experimentales de subtrama para este experimento. La corriente es el factor de la subtrama en el experimento. En este experimento hay ocho unidades experimentales de parcela completa. La concentración de la solución y la temperatura de la solución son los factores completos de la trama. Hay dos términos de error en el modelo, uno que corresponde al error de parcela completa o unidad experimental de parcela completa, y otro que corresponde al error de parcela completa o unidad experimental de parcela completa.

El ANOVA para este (tercer) enfoque es, en parte, el siguiente:

Los primeros cuatro términos provienen del análisis de la trama completa y los cinco términos siguientes provienen del análisis de la trama secundaria. Tenga en cuenta que tenemos términos de error separados para los efectos de la trama completa y de la trama secundaria, cada uno basado en 4 grados de libertad.

Como puede verse en estos tres escenarios, una de las principales diferencias entre los diseños de parcelas divididas y los diseños factoriales simples es el número de unidades experimentales de diferentes tamaños en el experimento. Los diseños de parcelas divididas tienen más de un tamaño de unidad experimental, es decir, más de un término de error. Dado que estos diseños involucran diferentes tamaños de unidades experimentales y diferentes varianzas, los errores estándar de las diversas comparaciones de medias involucran una o más de las varianzas. Especificar el modelo apropiado para un diseño de parcelas divididas implica poder identificar cada tamaño de unidad experimental. La forma en que se define una unidad experimental en relación con la estructura de diseño (por ejemplo, un diseño completamente aleatorio versus un diseño aleatorio de bloques completos) y la estructura de tratamiento (por ejemplo, un factorial completo de 2 3 , una media fracción de resolución V, un forma estructura de tratamiento con un grupo de control , etc.). Como resultado de tener una unidad experimental de más de un tamaño, el modelo apropiado utilizado para analizar diseños de parcelas divididas es un modelo mixto .

Si los datos de un experimento se analizan utilizando un solo término de error en el modelo, se pueden extraer conclusiones engañosas e inválidas de los resultados.

Diseños de parcelas en franjas

De manera similar al diseño de parcelas divididas, puede resultar un diseño de parcelas en franjas cuando se ha producido algún tipo de aleatorización restringida durante el experimento. Un diseño factorial simple puede dar como resultado un diseño de parcelas en franjas dependiendo de cómo se realizó el experimento. Los diseños de parcelas de franjas a menudo resultan de experimentos que se llevan a cabo en dos o más pasos del proceso en los que cada paso del proceso es un proceso por lotes, es decir, completar cada combinación de tratamientos del experimento requiere más de un paso de procesamiento con unidades experimentales procesadas juntas en cada proceso. paso. Al igual que en el diseño de parcelas divididas, los diseños de parcelas en franjas resultan cuando la aleatorización en el experimento se ha restringido de alguna manera. Como resultado de la aleatorización restringida que ocurre en los diseños de parcelas en franjas, existen unidades experimentales de múltiples tamaños. Por lo tanto, existen diferentes términos de error o diferentes varianzas de error que se utilizan para probar los factores de interés en el diseño. Un diseño tradicional de parcelas en franjas tiene tres tamaños de unidades experimentales.

Ejemplo de diagrama de franjas: dos pasos y tres variables factoriales

Considere el siguiente ejemplo de la industria de los semiconductores. Un experimento requiere un paso de implantación y un paso de recocido. Tanto en el paso de recocido como en el de implante hay tres factores a probar. El proceso de implantación admite 12 obleas en un lote, e implantar una única oblea bajo un conjunto específico de condiciones no es práctico ni representa un uso económico del implantador. El horno de recocido puede procesar hasta 100 obleas.

Las configuraciones para un diseño factorial de dos niveles para los tres factores en el paso de implante se indican (A, B, C), y un diseño factorial de dos niveles para los tres factores en el paso de recocido se indican (D, E, F ). También están presentes efectos de interacción entre los factores del implante y los factores de recocido. Por lo tanto, este experimento contiene tres tamaños de unidades experimentales, cada una de las cuales tiene un término de error único para estimar la importancia de los efectos.

Para darle un significado físico real a cada una de las unidades experimentales en el ejemplo anterior, considere cada combinación de pasos de implante y recocido como una oblea individual. Un lote de ocho obleas pasa primero por el paso de implantación. La combinación de tratamiento 3 en los factores A, B y C es la primera ejecución del tratamiento con implantes. Este tratamiento con implantes se aplica a las ocho obleas a la vez. Una vez finalizado el primer tratamiento de implante, se implanta otro conjunto de ocho obleas con la combinación de tratamiento 5 de los factores A, B y C. Esto continúa hasta que se implanta el último lote de ocho obleas con la combinación de tratamiento 6 de los factores A, B y C. Una vez que se hayan ejecutado las ocho combinaciones de tratamientos de los factores del implante, comienza el paso de recocido. La primera combinación de tratamiento de recocido que se ejecutará es la combinación de tratamiento 5 de los factores D, E y F. Esta combinación de tratamiento de recocido se aplica a un conjunto de ocho obleas, y cada una de estas ocho obleas proviene de una de las ocho combinaciones de tratamientos con implantes. Después de que se haya recocido este primer lote de obleas, el segundo tratamiento de recocido se aplica a un segundo lote de ocho obleas, proviniendo estas ocho obleas de cada una de las ocho combinaciones de tratamientos con implantes. Esto continúa hasta que se haya implantado el último lote de ocho obleas con una combinación particular de factores D, E y F.

Al ejecutar el experimento de esta manera se obtiene un diseño de parcelas en franjas con tres tamaños de unidades experimentales. Un conjunto de ocho obleas que se implantan juntas es la unidad experimental para los factores de implante A, B y C y para todas sus interacciones. Existen ocho unidades experimentales para los factores implantológicos. Se recoce un conjunto diferente de ocho obleas. Este conjunto diferente de ocho obleas es la unidad experimental de segundo tamaño y es la unidad experimental para los factores de recocido D, E y F y para todas sus interacciones. La unidad experimental del tercer tamaño es una oblea única. Esta es la unidad experimental para todos los efectos de interacción entre los factores del implante y los factores de recocido.

En realidad, la descripción anterior del diseño de parcelas representa un bloque o una réplica de este experimento. Si el experimento no contiene replicación y el modelo para el implante contiene sólo los efectos principales y las interacciones de dos factores, el término de interacción de tres factores A*B*C (1 grado de libertad) proporciona el término de error para la estimación de los efectos dentro de la unidad experimental de implantes. Invocar un modelo similar para la unidad experimental de recocido produce el término de interacción de tres factores D*E*F para el término de error (1 grado de libertad) para los efectos dentro de la unidad experimental de recocido.

Ver también

Referencias

  1. ^ Esquivar, Y. (2006). Diccionario Oxford de términos estadísticos . OUP. ISBN 978-0-19-920613-1.
  2. ^ Grundy, primer ministro; Healy, MJR "Aleatorización restringida y cuadrados cuasi latinos". Revista de la Royal Statistical Society, Serie B. 12 : 286–291.
  3. ^ Bailey, RA (1987). "Aleatorización restringida: un ejemplo práctico". Revista de la Asociación Estadounidense de Estadística . 82 (399): 712–719. doi :10.1080/01621459.1987.10478487. JSTOR  2288775.

Otras lecturas

Para una discusión más detallada de estos diseños y los procedimientos de análisis apropiados, consulte:

enlaces externos

Dominio publico Este artículo incorpora material de dominio público del Instituto Nacional de Estándares y Tecnología.