stringtranslate.com

Bloqueo (estadísticas)

En la teoría estadística del diseño de experimentos , el bloqueo es la disposición de unidades experimentales que son similares entre sí en grupos (bloques) en función de una o más variables. Estas variables se eligen cuidadosamente para minimizar el impacto de su variabilidad en los resultados observados. Existen diferentes formas de implementar el bloqueo, lo que da como resultado diferentes efectos de confusión. Sin embargo, los diferentes métodos comparten el mismo propósito: controlar la variabilidad introducida por factores específicos que podrían influir en el resultado de un experimento. Las raíces del bloqueo se originaron del estadístico Ronald Fisher , luego de su desarrollo de ANOVA . [1]

Historia

El uso del bloqueo en el diseño experimental tiene una historia evolutiva que abarca múltiples disciplinas. Los conceptos fundamentales del bloqueo se remontan a principios del siglo XX con estadísticos como Ronald A. Fisher . Su trabajo en el desarrollo del análisis de varianza (ANOVA) sentó las bases para agrupar unidades experimentales para controlar las variables extrañas. El bloqueo evolucionó con el paso de los años, lo que llevó a la formalización de los diseños de bloques aleatorios y los diseños de cuadrados latinos . [1] Hoy en día, el bloqueo todavía juega un papel fundamental en el diseño experimental y, en los últimos años, los avances en el software estadístico y las capacidades computacionales han permitido a los investigadores explorar diseños de bloqueo más complejos.

Usar

El bloqueo reduce la variabilidad inexplicable. Su principio radica en el hecho de que la variabilidad que no se puede superar (por ejemplo, la necesidad de dos lotes de materia prima para producir un contenedor de una sustancia química) se confunde o se asocia con una interacción (de orden superior/más alto) para eliminar su influencia en el producto final. [2] Las interacciones de orden superior suelen ser las de menor importancia (pensemos en el hecho de que la temperatura de un reactor o del lote de materias primas es más importante que la combinación de los dos; esto es especialmente cierto cuando hay más factores (3, 4, ...) presentes); por lo tanto, es preferible confundir esta variabilidad con la interacción de orden superior. [2]

Ejemplos

Variables molestas

Efecto de la variable molesta sobre la variable respuesta
Efecto de la variable molesta (sexo) sobre la variable respuesta (pérdida de peso)

En los ejemplos enumerados anteriormente, una variable molesta es una variable que no es el foco principal del estudio pero que puede afectar los resultados del experimento. [3] Se consideran fuentes potenciales de variabilidad que, si no se controlan o se tienen en cuenta, pueden confundir la interpretación entre las variables independientes y dependientes .

Para abordar las variables molestas, los investigadores pueden emplear diferentes métodos, como el bloqueo o la aleatorización. El bloqueo implica agrupar las unidades experimentales en función de los niveles de la variable molesta para controlar su influencia. La aleatorización ayuda a distribuir los efectos de las variables molestas de manera uniforme entre los grupos de tratamiento.

Al utilizar uno de estos métodos para tener en cuenta las variables molestas, los investigadores pueden mejorar la validez interna de sus experimentos, garantizando que los efectos observados tengan más probabilidades de atribuirse a las variables manipuladas en lugar de a influencias externas.

En el primer ejemplo que se proporcionó anteriormente, el sexo del paciente sería una variable molesta. Por ejemplo, supongamos que el medicamento fuera una pastilla para adelgazar y los investigadores quisieran probar el efecto de las pastillas para adelgazar en la pérdida de peso. La variable explicativa es la pastilla para adelgazar y la variable de respuesta es la cantidad de peso perdido. Aunque el sexo del paciente no es el foco principal del experimento (el efecto del medicamento lo es), es posible que el sexo del individuo afecte la cantidad de peso perdido.

Bloqueo utilizado para factores molestos que pueden controlarse

En la teoría estadística del diseño de experimentos , el bloqueo es la disposición de unidades experimentales en grupos (bloques) que son similares entre sí. Por lo general, un factor de bloqueo es una fuente de variabilidad que no es de interés primario para el experimentador. [3] [4]

Diseño experimental sin bloqueo (izquierda) vs. diseño experimental con bloqueo (derecha)

Al estudiar la teoría de la probabilidad, el método de bloques consiste en dividir una muestra en bloques (grupos) separados por subbloques más pequeños, de modo que los bloques puedan considerarse casi independientes. [5] El método de bloques ayuda a demostrar teoremas límite en el caso de variables aleatorias dependientes.

El método de bloques fue introducido por S. Bernstein : [6] El método se aplicó con éxito en la teoría de sumas de variables aleatorias dependientes y en la teoría de valores extremos . [7] [8] [9]

Ejemplo

Sin bloqueos: pastillas para adelgazar vs placebo para bajar de peso

En nuestro ejemplo anterior de las pastillas para adelgazar, un factor de bloqueo podría ser el sexo del paciente. Podríamos colocar a los individuos en uno de dos bloques (masculino o femenino). Y dentro de cada uno de los dos bloques, podemos asignar aleatoriamente a los pacientes a la pastilla para adelgazar (tratamiento) o a la pastilla placebo (control). Al bloquear el sexo, se controla esta fuente de variabilidad, lo que conduce a una mayor interpretación de cómo las pastillas para adelgazar afectan la pérdida de peso.

Con bloqueo: pastillas para adelgazar vs placebo para bajar de peso

Definición de factores de bloqueo

Un factor molesto se utiliza como factor de bloqueo si cada nivel del factor primario ocurre la misma cantidad de veces con cada nivel del factor molesto. [3] El análisis del experimento se centrará en el efecto de variar los niveles del factor primario dentro de cada bloque del experimento.

Bloquea algunos de los factores de molestia más importantes

La regla general es:

“Bloquea lo que puedas; aleatoriza lo que no puedas”. [3]

El bloqueo se utiliza para eliminar los efectos de algunas de las variables molestas más importantes. Luego se utiliza la aleatorización para reducir los efectos contaminantes de las variables molestas restantes. Para las variables molestas importantes, el bloqueo producirá una mayor significancia en las variables de interés que la aleatorización. [10]

Implementación

La implementación del bloqueo en el diseño experimental implica una serie de pasos para controlar eficazmente las variables extrañas y mejorar la precisión de las estimaciones del efecto del tratamiento.

Identificar variables molestas

Identificar factores potenciales que no son el foco principal del estudio pero que podrían introducir variabilidad.

Seleccione factores de bloqueo apropiados

Elija cuidadosamente los factores de bloqueo en función de su relevancia para el estudio, así como de su potencial para confundir los factores principales de interés. [11]

Definir tamaños de bloque

Dividir un experimento de cierto tamaño en una cierta cantidad de bloques tiene consecuencias, ya que la cantidad de bloques determina la cantidad de efectos confusos . [12]

Asignar tratamientos a bloques

Puede optar por asignar aleatoriamente unidades experimentales a las condiciones de tratamiento dentro de cada bloque, lo que puede ayudar a garantizar que cualquier variabilidad no explicada se distribuya de manera uniforme entre los grupos de tratamiento. Sin embargo, según cómo asigne los tratamientos a los bloques, puede obtener una cantidad diferente de efectos confusos. [4] Por lo tanto, se puede elegir la cantidad de efectos confusos y cuáles son los efectos específicos que se confunden, lo que significa que la asignación de tratamientos a bloques es superior a la asignación aleatoria . [4]

Replicación

Al ejecutar un diseño diferente para cada réplica , donde se confunde un efecto diferente cada vez, los efectos de interacción se confunden parcialmente en lugar de sacrificar por completo un solo efecto. [4] La replicación mejora la confiabilidad de los resultados y permite una evaluación más sólida de los efectos del tratamiento. [12]

Ejemplo

Mesa

Una forma útil de ver un experimento de bloques aleatorios es considerarlo como una colección de experimentos completamente aleatorios , cada uno de los cuales se ejecuta dentro de uno de los bloques del experimento total. [3]

con

L 1 = número de niveles (configuraciones) del factor 1
L 2 = número de niveles (configuraciones) del factor 2
L 3 = número de niveles (configuraciones) del factor 3
L 4 = número de niveles (configuraciones) del factor 4
L k = número de niveles (configuraciones) del factor k

Ejemplo

Supongamos que los ingenieros de una planta de fabricación de semiconductores quieren comprobar si las distintas dosis de material para implantes de obleas tienen un efecto significativo en las mediciones de resistividad después de un proceso de difusión que se lleva a cabo en un horno. Tienen cuatro dosis diferentes que quieren probar y suficientes obleas experimentales del mismo lote para hacer funcionar tres obleas en cada una de las dosis.

El factor de molestia que les preocupa es el "funcionamiento del horno", ya que se sabe que cada funcionamiento del horno difiere del anterior e impacta muchos parámetros del proceso.

Una forma ideal de llevar a cabo este experimento sería ejecutar todas las obleas 4x3=12 en la misma tanda de cocción. Eso eliminaría por completo el factor de molestias de la cocción. Sin embargo, las obleas de producción normal tienen prioridad en la cocción y solo se permite que unas pocas obleas experimentales entren en cualquier tanda de cocción al mismo tiempo.

Una forma no bloqueada de ejecutar este experimento sería ejecutar cada una de las doce obleas experimentales, en orden aleatorio, una por cada ejecución del horno. Eso aumentaría el error experimental de cada medición de resistividad por la variabilidad del horno de ejecución a ejecución y dificultaría el estudio de los efectos de las diferentes dosis. La forma bloqueada de ejecutar este experimento, suponiendo que puede convencer al departamento de fabricación para que le permita colocar cuatro obleas experimentales en una ejecución del horno, sería colocar cuatro obleas con diferentes dosis en cada una de las tres ejecuciones del horno. La única aleatorización sería elegir cuál de las tres obleas con la dosis 1 iría a la ejecución del horno 1, y lo mismo para las obleas con las dosis 2, 3 y 4.

Descripción del experimento

Sea X 1 el "nivel" de dosis y X 2 el factor de bloqueo del funcionamiento del horno. Entonces el experimento puede describirse de la siguiente manera:

k = 2 factores (1 factor primario X 1 y 1 factor de bloqueo X 2 )
L 1 = 4 niveles del factor X 1
L 2 = 3 niveles del factor X 2
n = 1 replicación por célula
N = L 1 * L 2 = 4 * 3 = 12 carreras

Antes de la aleatorización, los ensayos de diseño se ven así:

Representación matricial

Una forma alternativa de resumir los ensayos de diseño sería utilizar una matriz de 4x3 cuyas 4 filas son los niveles del tratamiento X 1 y cuyas columnas son los 3 niveles de la variable de bloqueo X 2 . Las celdas de la matriz tienen índices que coinciden con las combinaciones X 1 , X 2 anteriores.

Por extensión, tenga en cuenta que los ensayos para cualquier diseño de bloques aleatorios de K factores son simplemente los índices de celda de una matriz de k dimensiones.

Modelo

El modelo para un diseño de bloques aleatorios con una variable molesta es

dónde

Y ij es cualquier observación para la cual X 1 = i y X 2 = j
X 1 es el factor primario
X 2 es el factor de bloqueo
μ es el parámetro de ubicación general (es decir, la media)
T i es el efecto de estar en el tratamiento i (del factor X 1 )
B j es el efecto por estar en el bloque j (del factor X 2 )

Estimaciones

Estimación para μ  : = el promedio de todos los datos
Estimación para T i  : con = promedio de todos los Y para los cuales X 1 = i .
Estimación para B j  : con = promedio de todos los Y para los cuales X 2 = j .

Generalizaciones

Véase también

Referencias

  1. ^ ab Box, Joan Fisher (1980). "RA Fisher y el diseño de experimentos, 1922-1926". El estadístico estadounidense . 34 (1): 1–7. doi :10.2307/2682986. ISSN  0003-1305. JSTOR  2682986.
  2. ^ ab "5.3.3.3.3. Bloqueo de diseños factoriales completos". www.itl.nist.gov . Consultado el 11 de diciembre de 2023 .
  3. ^ abcde "5.3.3.2. Diseños de bloques aleatorios". www.itl.nist.gov . Consultado el 11 de diciembre de 2023 .
  4. ^ abcd Berger, Paul D.; Maurer, Robert E.; Celli, Giovana B. (2018). Diseño experimental. doi :10.1007/978-3-319-64583-4. ISBN 978-3-319-64582-7.
  5. ^ "Diseño de bloques aleatorios", The Concise Encyclopedia of Statistics , Nueva York, NY: Springer, 2008, págs. 447-448, doi :10.1007/978-0-387-32833-1_344, ISBN 978-0-387-32833-1, consultado el 11 de diciembre de 2023
  6. ^ Bernstein SN (1926) Sur l'extension du théorème limite du calcul des probabilités aux sommes de quantités dépendantes. Matemáticas. Annalen, v. 97, 1–59.
  7. ^ Ibragimov IA y Linnik Yu.V. (1971) Secuencias independientes y estacionarias de variables aleatorias. Wolters-Noordhoff, Groningen.
  8. ^ Leadbetter MR, Lindgren G. y Rootzén H. (1983) Extremos y propiedades relacionadas de secuencias y procesos aleatorios. Nueva York: Springer Verlag.
  9. ^ Novak SY (2011) Métodos de valor extremo con aplicaciones a las finanzas. Chapman & Hall/CRC Press, Londres.
  10. ^ Karmakar, Bikram (2022). "Un algoritmo de aproximación para el bloqueo de un diseño experimental". Revista de la Royal Statistical Society, Serie B . 84 (5): 1726–1750. doi : 10.1111/rssb.12545 . MR  4515556.
  11. ^ Pashley, Nicole E.; Miratrix, Luke W. (7 de julio de 2021). "Bloquea lo que puedas, excepto cuando no debas". Revista de estadísticas educativas y conductuales . 47 (1): 69–100. arXiv : 2010.14078 . doi :10.3102/10769986211027240. ISSN  1076-9986.
  12. ^ ab Ledolter, Johannes; Kardon, Randy H. (9 de julio de 2020). "Enfoque en los datos: diseño estadístico de experimentos y selección del tamaño de la muestra mediante análisis de potencia". Oftalmología de investigación y ciencia visual . 61 (8): 11. doi :10.1167/iovs.61.8.11. ISSN  0146-0404. PMC 7425741. PMID 32645134  . 

Bibliografía