Bloqueo (estadísticas)

En la teoría estadística del diseño de experimentos , el bloqueo es la disposición de unidades experimentales que son similares entre sí en grupos (bloques) en función de una o más variables. Estas variables se eligen cuidadosamente para minimizar el impacto de su variabilidad en los resultados observados. Existen diferentes formas de implementar el bloqueo, lo que da como resultado diferentes efectos de confusión. Sin embargo, los diferentes métodos comparten el mismo propósito: controlar la variabilidad introducida por factores específicos que podrían influir en el resultado de un experimento. Las raíces del bloqueo se originaron del estadístico Ronald Fisher , luego de su desarrollo de ANOVA . ^[1]

Historia

El uso del bloqueo en el diseño experimental tiene una historia evolutiva que abarca múltiples disciplinas. Los conceptos fundamentales del bloqueo se remontan a principios del siglo XX con estadísticos como Ronald A. Fisher . Su trabajo en el desarrollo del análisis de varianza (ANOVA) sentó las bases para agrupar unidades experimentales para controlar las variables extrañas. El bloqueo evolucionó con el paso de los años, lo que llevó a la formalización de los diseños de bloques aleatorios y los diseños de cuadrados latinos . ^[1] Hoy en día, el bloqueo todavía juega un papel fundamental en el diseño experimental y, en los últimos años, los avances en el software estadístico y las capacidades computacionales han permitido a los investigadores explorar diseños de bloqueo más complejos.

Usar

El bloqueo reduce la variabilidad inexplicable. Su principio radica en el hecho de que la variabilidad que no se puede superar (por ejemplo, la necesidad de dos lotes de materia prima para producir un contenedor de una sustancia química) se confunde o se asocia con una interacción (de orden superior/más alto) para eliminar su influencia en el producto final. ^[2]Las interacciones de orden superior suelen ser las de menor importancia (pensemos en el hecho de que la temperatura de un reactor o del lote de materias primas es más importante que la combinación de los dos; esto es especialmente cierto cuando hay más factores (3, 4, ...) presentes); por lo tanto, es preferible confundir esta variabilidad con la interacción de orden superior. ^[2]

Ejemplos

Masculino y femenino : Se diseña un experimento para probar un nuevo medicamento en pacientes. Hay dos niveles de tratamiento, medicamento y placebo , administrados a pacientes masculinos y femeninos en un ensayo doble ciego . El sexo del paciente es un factor de bloqueo que explica la variabilidad del tratamiento entre hombres y mujeres . Esto reduce las fuentes de variabilidad y, por lo tanto, conduce a una mayor precisión.
Elevación : Se diseña un experimento para probar los efectos de un nuevo pesticida en una zona específica de césped. La zona de césped presenta un importante cambio de elevación y, por lo tanto, consta de dos regiones distintas: "alta elevación" y "baja elevación". Se aplica un grupo de tratamiento (el nuevo pesticida) y un grupo placebo tanto en las zonas de césped de alta elevación como en las de baja elevación. En este caso, el investigador bloquea el factor de elevación que puede explicar la variabilidad en la aplicación del pesticida.
Intervención : Supongamos que se inventa un proceso que pretende hacer que las suelas de los zapatos duren más tiempo y se forma un plan para llevar a cabo una prueba de campo. Dado un grupo de n voluntarios, un posible diseño sería dar a n /2 de ellos zapatos con suelas nuevas y a n /2 de ellos zapatos con suelas comunes, asignando aleatoriamente los dos tipos de suelas. Este tipo de experimento es un diseño completamente aleatorio . A continuación, se pide a ambos grupos que utilicen sus zapatos durante un período de tiempo y luego midan el grado de desgaste de las suelas. Este es un diseño experimental viable, pero puramente desde el punto de vista de la precisión estadística (ignorando cualquier otro factor), un mejor diseño sería dar a cada persona una suela regular y una suela nueva, asignando aleatoriamente los dos tipos al zapato izquierdo y derecho de cada voluntario. Este diseño se llama " diseño de bloque completo aleatorio ". Este diseño será más sensible que el primero, porque cada persona actúa como su propio control y, por lo tanto, el grupo de control se corresponde más estrechamente con el diseño de bloque del grupo de tratamiento.

Variables molestas

En los ejemplos enumerados anteriormente, una variable molesta es una variable que no es el foco principal del estudio pero que puede afectar los resultados del experimento. ^[3] Se consideran fuentes potenciales de variabilidad que, si no se controlan o se tienen en cuenta, pueden confundir la interpretación entre las variables independientes y dependientes .

Para abordar las variables molestas, los investigadores pueden emplear diferentes métodos, como el bloqueo o la aleatorización. El bloqueo implica agrupar las unidades experimentales en función de los niveles de la variable molesta para controlar su influencia. La aleatorización ayuda a distribuir los efectos de las variables molestas de manera uniforme entre los grupos de tratamiento.

Al utilizar uno de estos métodos para tener en cuenta las variables molestas, los investigadores pueden mejorar la validez interna de sus experimentos, garantizando que los efectos observados tengan más probabilidades de atribuirse a las variables manipuladas en lugar de a influencias externas.

En el primer ejemplo que se proporcionó anteriormente, el sexo del paciente sería una variable molesta. Por ejemplo, supongamos que el medicamento fuera una pastilla para adelgazar y los investigadores quisieran probar el efecto de las pastillas para adelgazar en la pérdida de peso. La variable explicativa es la pastilla para adelgazar y la variable de respuesta es la cantidad de peso perdido. Aunque el sexo del paciente no es el foco principal del experimento (el efecto del medicamento lo es), es posible que el sexo del individuo afecte la cantidad de peso perdido.

Bloqueo utilizado para factores molestos que pueden controlarse

En la teoría estadística del diseño de experimentos , el bloqueo es la disposición de unidades experimentales en grupos (bloques) que son similares entre sí. Por lo general, un factor de bloqueo es una fuente de variabilidad que no es de interés primario para el experimentador. ^[3]^[4]

Al estudiar la teoría de la probabilidad, el método de bloques consiste en dividir una muestra en bloques (grupos) separados por subbloques más pequeños de modo que los bloques puedan considerarse casi independientes. ^[5] El método de bloques ayuda a demostrar teoremas límite en el caso de variables aleatorias dependientes.

El método de bloques fue introducido por S. Bernstein : ^[6] El método se aplicó con éxito en la teoría de sumas de variables aleatorias dependientes y en la teoría de valores extremos . ^[7]^[8]^[9]

Ejemplo

En nuestro ejemplo anterior de las pastillas para adelgazar, un factor de bloqueo podría ser el sexo del paciente. Podríamos colocar a los individuos en uno de dos bloques (masculino o femenino). Y dentro de cada uno de los dos bloques, podemos asignar aleatoriamente a los pacientes a la pastilla para adelgazar (tratamiento) o a la pastilla placebo (control). Al bloquear el sexo, se controla esta fuente de variabilidad, lo que conduce a una mayor interpretación de cómo las pastillas para adelgazar afectan la pérdida de peso.

Definición de factores de bloqueo

Un factor molesto se utiliza como factor de bloqueo si cada nivel del factor primario ocurre la misma cantidad de veces con cada nivel del factor molesto. ^[3] El análisis del experimento se centrará en el efecto de variar los niveles del factor primario dentro de cada bloque del experimento.

Bloquea algunos de los factores de molestia más importantes

La regla general es:

“Bloquea lo que puedas; aleatoriza lo que no puedas”. ^[3]

El bloqueo se utiliza para eliminar los efectos de algunas de las variables molestas más importantes. Luego se utiliza la aleatorización para reducir los efectos contaminantes de las variables molestas restantes. Para las variables molestas importantes, el bloqueo producirá una mayor significancia en las variables de interés que la aleatorización. ^[10]

Implementación

La implementación del bloqueo en el diseño experimental implica una serie de pasos para controlar eficazmente las variables extrañas y mejorar la precisión de las estimaciones del efecto del tratamiento.

Identificar variables molestas

Identificar factores potenciales que no son el foco principal del estudio pero que podrían introducir variabilidad.

Seleccione factores de bloqueo apropiados

Elija cuidadosamente los factores de bloqueo en función de su relevancia para el estudio, así como de su potencial para confundir los factores principales de interés. ^[11]

Definir tamaños de bloque

Dividir un experimento de cierto tamaño en una cierta cantidad de bloques tiene consecuencias, ya que la cantidad de bloques determina la cantidad de efectos confusos . ^[12]

Asignar tratamientos a bloques

Puede optar por asignar aleatoriamente unidades experimentales a las condiciones de tratamiento dentro de cada bloque, lo que puede ayudar a garantizar que cualquier variabilidad no explicada se distribuya de manera uniforme entre los grupos de tratamiento. Sin embargo, según cómo asigne los tratamientos a los bloques, puede obtener una cantidad diferente de efectos confusos. ^[4] Por lo tanto, se puede elegir la cantidad de efectos confusos y cuáles son los efectos específicos que se confunden, lo que significa que la asignación de tratamientos a bloques es superior a la asignación aleatoria . ^[4]

Replicación

Al ejecutar un diseño diferente para cada réplica , donde se confunde un efecto diferente cada vez, los efectos de interacción se confunden parcialmente en lugar de sacrificar por completo un solo efecto. ^[4] La replicación mejora la confiabilidad de los resultados y permite una evaluación más sólida de los efectos del tratamiento. ^[12]

Ejemplo

Mesa

Una forma útil de ver un experimento de bloques aleatorios es considerarlo como una colección de experimentos completamente aleatorios , cada uno de los cuales se ejecuta dentro de uno de los bloques del experimento total. ^[3]

con

L ₁ = número de niveles (configuraciones) del factor 1

L ₂ = número de niveles (configuraciones) del factor 2

L ₃ = número de niveles (configuraciones) del factor 3

L ₄ = número de niveles (configuraciones) del factor 4

\vpuntos

L _k = número de niveles (configuraciones) del factor k

Ejemplo

Supongamos que los ingenieros de una planta de fabricación de semiconductores quieren comprobar si las distintas dosis de material para implantes de obleas tienen un efecto significativo en las mediciones de resistividad después de un proceso de difusión que se lleva a cabo en un horno. Tienen cuatro dosis diferentes que quieren probar y suficientes obleas experimentales del mismo lote para hacer funcionar tres obleas en cada una de las dosis.

El factor de molestia que les preocupa es el "funcionamiento del horno", ya que se sabe que cada funcionamiento del horno difiere del anterior e impacta muchos parámetros del proceso.

Una forma ideal de realizar este experimento sería ejecutar todas las obleas 4x3=12 en la misma tanda de cocción. Eso eliminaría por completo el factor de molestias de la cocción. Sin embargo, las obleas de producción regular tienen prioridad en la cocción y solo se permite que unas pocas obleas experimentales entren en cualquier tanda de cocción al mismo tiempo.

Una forma no bloqueada de ejecutar este experimento sería ejecutar cada una de las doce obleas experimentales, en orden aleatorio, una por cada ejecución del horno. Eso aumentaría el error experimental de cada medición de resistividad por la variabilidad del horno de ejecución a ejecución y dificultaría el estudio de los efectos de las diferentes dosis. La forma bloqueada de ejecutar este experimento, suponiendo que puede convencer al departamento de fabricación para que le permita colocar cuatro obleas experimentales en una ejecución del horno, sería colocar cuatro obleas con diferentes dosis en cada una de las tres ejecuciones del horno. La única aleatorización sería elegir cuál de las tres obleas con la dosis 1 iría a la ejecución del horno 1, y lo mismo para las obleas con las dosis 2, 3 y 4.

Descripción del experimento

Sea X ₁ el "nivel" de dosis y X ₂ el factor de bloqueo del funcionamiento del horno. Entonces el experimento puede describirse de la siguiente manera:

k = 2 factores (1 factor primario X ₁ y 1 factor de bloqueo X ₂ )

L ₁ = 4 niveles del factor X ₁

L ₂ = 3 niveles del factor X ₂

n = 1 replicación por célula

N = L ₁ * L ₂ = 4 * 3 = 12 carreras

Antes de la aleatorización, los ensayos de diseño se ven así:

Representación matricial

Una forma alternativa de resumir los ensayos de diseño sería utilizar una matriz de 4x3 cuyas 4 filas son los niveles del tratamiento X ₁ y cuyas columnas son los 3 niveles de la variable de bloqueo X ₂ . Las celdas de la matriz tienen índices que coinciden con las combinaciones X ₁ , X ₂ anteriores.

Por extensión, tenga en cuenta que los ensayos para cualquier diseño de bloques aleatorios de K factores son simplemente los índices de celda de una matriz de k dimensiones.

Modelo

El modelo para un diseño de bloques aleatorios con una variable molesta es

Y_{ij}=\mu +T_{i}+B_{j}+\mathrm {error\ aleatorio}

dónde

Y _ij es cualquier observación para la cual X ₁ = i y X ₂ = j

X ₁ es el factor primario

X ₂ es el factor de bloqueo

μ es el parámetro de ubicación general (es decir, la media)

T _i es el efecto de estar en el tratamiento i (del factor X ₁ )

B _j es el efecto por estar en el bloque j (del factor X ₂ )

Estimaciones

Estimación para μ : = el promedio de todos los datos

{\overline {Y}}

Estimación para T _i : con = promedio de todos los Y para los cuales X ₁ = i .

{\overline {Y}}_{i\cdot }-{\overline {Y}}

{\overline {Y}}_{i\cdot }

Estimación para B _j : con = promedio de todos los Y para los cuales X ₂ = j .

{\overline {Y}}_{\cdot j}-{\overline {Y}}

{\overline {Y}}_{\cdot j}

Generalizaciones

Los diseños de bloques aleatorios generalizados (GRBD) permiten realizar pruebas de interacción bloque-tratamiento y tienen exactamente un factor de bloqueo como el RCBD.
Los cuadrados latinos (y otros diseños de filas y columnas) tienen dos factores de bloqueo que se cree que no tienen interacción.
Muestreo de hipercubos latinos
Cuadrados grecolatinos
Diseños cuadrados hipergrecolatinos

Véase también

Referencias

^ ab Box, Joan Fisher (1980). "RA Fisher y el diseño de experimentos, 1922-1926". El estadístico estadounidense . 34 (1): 1–7. doi :10.2307/2682986. ISSN 0003-1305. JSTOR 2682986.
^ ab "5.3.3.3.3. Bloqueo de diseños factoriales completos". www.itl.nist.gov . Consultado el 11 de diciembre de 2023 .
^ abcde "5.3.3.2. Diseños de bloques aleatorios". www.itl.nist.gov . Consultado el 11 de diciembre de 2023 .
^ abcd Berger, Paul D.; Maurer, Robert E.; Celli, Giovana B. (2018). Diseño experimental. doi :10.1007/978-3-319-64583-4. ISBN 978-3-319-64582-7.
^ "Diseño de bloques aleatorios", The Concise Encyclopedia of Statistics , Nueva York, NY: Springer, 2008, págs. 447-448, doi :10.1007/978-0-387-32833-1_344, ISBN 978-0-387-32833-1, consultado el 11 de diciembre de 2023
^ Bernstein SN (1926) Sur l'extension du théorème limite du calcul des probabilités aux sommes de quantités dépendantes. Matemáticas. Annalen, v. 97, 1–59.
^ Ibragimov IA y Linnik Yu.V. (1971) Secuencias independientes y estacionarias de variables aleatorias. Wolters-Noordhoff, Groningen.
^ Leadbetter MR, Lindgren G. y Rootzén H. (1983) Extremos y propiedades relacionadas de secuencias y procesos aleatorios. Nueva York: Springer Verlag.
^ Novak SY (2011) Métodos de valor extremo con aplicaciones a las finanzas. Chapman & Hall/CRC Press, Londres.
^ Karmakar, Bikram (2022). "Un algoritmo de aproximación para el bloqueo de un diseño experimental". Revista de la Royal Statistical Society, Serie B . 84 (5): 1726–1750. doi : 10.1111/rssb.12545 . MR 4515556.
^ Pashley, Nicole E.; Miratrix, Luke W. (7 de julio de 2021). "Bloquea lo que puedas, excepto cuando no debas". Revista de estadísticas educativas y conductuales . 47 (1): 69–100. arXiv : 2010.14078 . doi :10.3102/10769986211027240. ISSN 1076-9986.
^ ab Ledolter, Johannes; Kardon, Randy H. (9 de julio de 2020). "Enfoque en los datos: diseño estadístico de experimentos y selección del tamaño de la muestra mediante análisis de potencia". Oftalmología de investigación y ciencia visual . 61 (8): 11. doi :10.1167/iovs.61.8.11. ISSN 0146-0404. PMC 7425741. PMID 32645134 .

Este artículo incorpora material de dominio público del Instituto Nacional de Estándares y Tecnología.

Bibliografía

Addelman, S. (1969). "El diseño generalizado de bloques aleatorios". The American Statistician . 23 (4): 35–36. doi :10.2307/2681737. JSTOR 2681737.
Addelman, S. (1970). "Variabilidad de tratamientos y unidades experimentales en el diseño y análisis de experimentos". Revista de la Asociación Estadounidense de Estadística . 65 (331): 1095–1108. doi :10.2307/2284277. JSTOR 2284277.
Anscombe, FJ (1948). "La validez de los experimentos comparativos". Revista de la Royal Statistical Society . A (General). 111 (3): 181–211. doi :10.2307/2984159. JSTOR 2984159. MR 0030181.
Bailey, R. A (2008). Diseño de experimentos comparativos. Cambridge University Press. ISBN 978-0-521-68357-9Archivado desde el original el 6 de marzo de 2011. Consultado el 22 de febrero de 2010 .{{cite book}}: CS1 maint: bot: estado de URL original desconocido ( enlace )Los capítulos previos a su publicación están disponibles en línea.
Bapat, RB (2000). Álgebra lineal y modelos lineales (segunda edición). Springer. ISBN 978-0-387-98871-9.
Caliński T.; Kageyama S. (2000). Diseños de bloques: un enfoque de aleatorización . Vol. I: Análisis. Nueva York: Springer-Verlag. ISBN 0-387-98578-6.
Caliński T.; Kageyama S. (2003). Diseños de bloques: un enfoque de aleatorización . Vol. II: Diseño. Nueva York: Springer-Verlag. ISBN 0-387-95470-8. Sr. 1994124.
Gates, CE (noviembre de 1995). "¿Qué es realmente el error experimental en los diseños de bloques?". The American Statistician . 49 (4): 362–363. doi :10.2307/2684574. JSTOR 2684574.
Kempthorne, Oscar (1979). El diseño y análisis de experimentos (reimpresión corregida de la edición de Wiley de 1952). Robert E. Krieger. ISBN 0-88275-105-0.
Hinkelmann, Klaus; Kempthorne, Oscar (2008). Diseño y análisis de experimentos . Vol. I y II (segunda edición). Wiley. ISBN 978-0-470-38551-7.
- Hinkelmann, Klaus; Kempthorne, Oscar (2008). Diseño y análisis de experimentos . Vol. I: Introducción al diseño experimental (segunda edición). Wiley. ISBN 978-0-471-72756-9.
- Hinkelmann, Klaus; Kempthorne, Oscar (2005). Diseño y análisis de experimentos . Vol. 2: Diseño experimental avanzado (Primera edición). Wiley. ISBN 978-0-471-55177-5.
Lentner, Marvin; Thomas Bishop (1993). "El diseño RCB generalizado (Capítulo 6.13)". Diseño y análisis experimental (Segunda edición). Blacksburg, VA: Valley Book Company. págs. 225–226. ISBN 0-9616255-2-X.
Raghavarao, Damaraju (1988). Construcciones y problemas combinatorios en el diseño de experimentos (reimpresión corregida de la edición de Wiley de 1971). Nueva York: Dover. ISBN 0-486-65685-3.
Raghavarao, Damaraju ; Padgett, LV (2005). Diseños de bloques: análisis, combinatoria y aplicaciones . World Scientific. ISBN 981-256-360-1.
Shah, Kirti R.; Sinha, Bikas K. (1989). Teoría de diseños óptimos . Springer-Verlag. ISBN 0-387-96991-8.
Street, Anne Penfold ; Street, Deborah J. (1987). Combinatoria del diseño experimental . Oxford UP [Clarendon]. ISBN 0-19-853256-3.
Wilk, MB (1955). "El análisis de aleatorización de un diseño de bloques aleatorios generalizado". Biometrika . 42 (1–2): 70–79. doi :10.2307/2333423. JSTOR 2333423.
Zyskind, George (1963). "Algunas consecuencias de la aleatorización en una generalización del diseño de bloques incompletos balanceados". Anales de estadística matemática . 34 (4): 1569–1581. doi : 10.1214/aoms/1177703889 . JSTOR 2238364.