stringtranslate.com

Bloqueo (estadísticas)

En la teoría estadística del diseño de experimentos , el bloqueo es la disposición de unidades experimentales similares entre sí en grupos (bloques) en función de una o más variables. Estas variables se eligen cuidadosamente para minimizar el impacto de su variabilidad en los resultados observados. Hay diferentes formas de implementar el bloqueo, lo que produce diferentes efectos de confusión. Sin embargo, los diferentes métodos comparten el mismo propósito: controlar la variabilidad introducida por factores específicos que podrían influir en el resultado de un experimento. Las raíces del bloqueo se originaron en el estadístico Ronald Fisher , tras su desarrollo de ANOVA . [1]

Historia

El uso del bloqueo en el diseño experimental tiene una historia en evolución que abarca múltiples disciplinas. Los conceptos fundamentales de bloqueo se remontan a principios del siglo XX con estadísticos como Ronald A. Fisher . Su trabajo en el desarrollo del análisis de varianza (ANOVA) sentó las bases para agrupar unidades experimentales para controlar variables extrañas. El bloqueo evolucionó a lo largo de los años, lo que llevó a la formalización de diseños de bloques aleatorios y diseños de cuadrado latino . [1] Hoy en día, el bloqueo todavía juega un papel fundamental en el diseño experimental y, en los últimos años, los avances en el software estadístico y las capacidades computacionales han permitido a los investigadores explorar diseños de bloqueo más complejos.

Usar

El bloqueo reduce la variabilidad inexplicable. Su principio radica en el hecho de que la variabilidad que no se puede superar (por ejemplo, la necesidad de dos lotes de materia prima para producir 1 contenedor de una sustancia química) se confunde o se asocia con una interacción (de orden superior/superior) para eliminar su influencia en el Producto final. [2] Las interacciones de alto orden suelen ser las de menor importancia (piense en el hecho de que la temperatura de un reactor o del lote de materias primas es más importante que la combinación de las dos; esto es especialmente cierto cuando hay más (3, 4, . ..) factores están presentes); por tanto, es preferible confundir esta variabilidad con la interacción mayor. [2]

Ejemplos

Variables molestas

Efecto de la variable molesta sobre la variable respuesta
Efecto de la variable molesta (sexo) sobre la variable respuesta (pérdida de peso)

En los ejemplos enumerados anteriormente, una variable molesta es una variable que no es el enfoque principal del estudio pero que puede afectar los resultados del experimento. [3] Se consideran fuentes potenciales de variabilidad que, si no se controlan o contabilizan, pueden confundir la interpretación entre las variables independientes y dependientes .

Para abordar las variables molestas, los investigadores pueden emplear diferentes métodos, como el bloqueo o la aleatorización. El bloqueo implica agrupar unidades experimentales según los niveles de la variable molesta para controlar su influencia. La aleatorización ayuda a distribuir los efectos de las variables molestas de manera uniforme entre los grupos de tratamiento.

Al utilizar uno de estos métodos para tener en cuenta las variables molestas, los investigadores pueden mejorar la validez interna de sus experimentos, asegurando que los efectos observados sean más probablemente atribuibles a las variables manipuladas que a influencias extrañas.

En el primer ejemplo proporcionado anteriormente, el sexo del paciente sería una variable molesta. Por ejemplo, considere si el medicamento fuera una pastilla para adelgazar y los investigadores quisieran probar el efecto de las pastillas para adelgazar sobre la pérdida de peso. La variable explicativa es la pastilla para adelgazar y la variable respuesta es la cantidad de peso perdido. Aunque el sexo del paciente no es el foco principal del experimento (el efecto del fármaco sí lo es), es posible que el sexo del individuo afecte la cantidad de peso perdido.

Bloqueo utilizado para factores molestos que pueden controlarse.

En la teoría estadística del diseño de experimentos , el bloqueo es la disposición de unidades experimentales en grupos (bloques) similares entre sí. Normalmente, un factor de bloqueo es una fuente de variabilidad que no es de interés primario para el experimentador. [3] [4]

Diseño experimental sin bloqueo (izquierda) versus bloqueo (derecha)

Cuando se estudia la teoría de la probabilidad, el método de bloques consiste en dividir una muestra en bloques (grupos) separados por subbloques más pequeños de modo que los bloques puedan considerarse casi independientes. [5] El método de bloques ayuda a demostrar teoremas de límites en el caso de variables aleatorias dependientes.

El método de bloques fue introducido por S. Bernstein : [6] El método se aplicó con éxito en la teoría de sumas de variables aleatorias dependientes y en la teoría de valores extremos . [7] [8] [9]

Ejemplo

Sin bloqueo: pastillas para adelgazar versus placebo para bajar de peso

En nuestro ejemplo anterior de pastillas para adelgazar, un factor de bloqueo podría ser el sexo del paciente. Podríamos colocar a los individuos en uno de dos bloques (hombres o mujeres). Y dentro de cada uno de los dos bloques, podemos asignar aleatoriamente a los pacientes a la pastilla de dieta (tratamiento) o a la pastilla de placebo (control). Al bloquear el sexo, se controla esta fuente de variabilidad, lo que lleva a una mayor interpretación de cómo las pastillas para adelgazar afectan la pérdida de peso.

Con bloqueo: pastillas para adelgazar versus placebo para bajar de peso

Definición de factores de bloqueo.

Un factor de molestia se utiliza como factor de bloqueo si cada nivel del factor primario ocurre el mismo número de veces con cada nivel del factor de molestia. [3] El análisis del experimento se centrará en el efecto de los diferentes niveles del factor primario dentro de cada bloque del experimento.

Bloquee algunos de los factores molestos más importantes

La regla general es:

"Bloquea lo que puedas; aleatoriza lo que no puedas". [3]

El bloqueo se utiliza para eliminar los efectos de algunas de las variables molestas más importantes. Luego se utiliza la aleatorización para reducir los efectos contaminantes de las variables molestas restantes. Para variables molestas importantes, el bloqueo producirá una mayor significancia en las variables de interés que la aleatorización. [10]

Implementación

La implementación del bloqueo en el diseño experimental implica una serie de pasos para controlar eficazmente las variables extrañas y mejorar la precisión de las estimaciones del efecto del tratamiento.

Identificar variables molestas

Identifique factores potenciales que no son el enfoque principal del estudio pero que podrían introducir variabilidad.

Seleccione los factores de bloqueo apropiados

Elija cuidadosamente los factores de bloqueo en función de su relevancia para el estudio, así como de su potencial para confundir los principales factores de interés. [11]

Definir tamaños de bloque

Dividir un experimento de cierto tamaño en una cierta cantidad de bloques tiene consecuencias, ya que la cantidad de bloques determina la cantidad de efectos de confusión . [12]

Asignar tratamientos a bloques

Puede optar por asignar aleatoriamente unidades experimentales a las condiciones de tratamiento dentro de cada bloque, lo que puede ayudar a garantizar que cualquier variabilidad no contabilizada se distribuya uniformemente entre los grupos de tratamiento. Sin embargo, dependiendo de cómo asigne los tratamientos a los bloques, puede obtener una cantidad diferente de efectos confusos. [4] Por lo tanto, se puede elegir el número y los efectos específicos que se confunden, lo que significa que asignar tratamientos a bloques es superior a la asignación aleatoria . [4]

Replicación

Al ejecutar un diseño diferente para cada réplica , donde un efecto diferente se confunde cada vez, los efectos de interacción se confunden parcialmente en lugar de sacrificar por completo un solo efecto. [4] La replicación mejora la confiabilidad de los resultados y permite una evaluación más sólida de los efectos del tratamiento. [12]

Ejemplo

Mesa

Una forma útil de considerar un experimento de bloques aleatorios es considerarlo como una colección de experimentos completamente aleatorios , cada uno de los cuales se ejecuta dentro de uno de los bloques del experimento total. [3]

con

L 1 = número de niveles (configuraciones) del factor 1
L 2 = número de niveles (configuraciones) del factor 2
L 3 = número de niveles (configuraciones) del factor 3
L 4 = número de niveles (configuraciones) del factor 4
L k = número de niveles (configuraciones) del factor k

Ejemplo

Supongamos que los ingenieros de una instalación de fabricación de semiconductores quieren probar si diferentes dosis de material para implantes de obleas tienen un efecto significativo en las mediciones de resistividad después de un proceso de difusión que tiene lugar en un horno. Tienen cuatro dosis diferentes que quieren probar y suficientes obleas experimentales del mismo lote para procesar tres obleas en cada una de las dosis.

El factor molesto que les preocupa es el "funcionamiento del horno", ya que se sabe que cada funcionamiento del horno difiere del anterior e impacta muchos parámetros del proceso.

Una forma ideal de ejecutar este experimento sería ejecutar todas las obleas 4x3=12 en el mismo horno. Esto eliminaría por completo el molesto factor del horno. Sin embargo, las obleas de producción regular tienen prioridad en el horno, y solo se permiten unas pocas obleas experimentales en cualquier horno en funcionamiento al mismo tiempo.

Una forma no bloqueada de ejecutar este experimento sería ejecutar cada una de las doce obleas experimentales, en orden aleatorio, una por ejecución del horno. Eso aumentaría el error experimental de cada medición de resistividad por la variabilidad del horno entre ejecuciones y haría más difícil estudiar los efectos de las diferentes dosis. La forma bloqueada de ejecutar este experimento, suponiendo que pueda convencer a la fabricación para que le permita colocar cuatro obleas experimentales en un horno, sería colocar cuatro obleas con diferentes dosis en cada una de las tres ejecuciones del horno. La única aleatorización sería elegir cuál de las tres obleas con la dosis 1 entraría en el horno 1, y lo mismo para las obleas con las dosis 2, 3 y 4.

Descripción del experimento

Sea X 1 el "nivel" de dosis y X 2 el factor de bloqueo del funcionamiento del horno. Entonces el experimento se puede describir de la siguiente manera:

k = 2 factores (1 factor primario X 1 y 1 factor de bloqueo X 2 )
L 1 = 4 niveles de factor X 1
L 2 = 3 niveles de factor X 2
n = 1 replicación por célula
N = L 1 * L 2 = 4 * 3 = 12 carreras

Antes de la aleatorización, los ensayos de diseño lucen así:

Representación matricial

Una forma alternativa de resumir las pruebas de diseño sería utilizar una matriz de 4x3 cuyas 4 filas sean los niveles del tratamiento X 1 y cuyas columnas sean los 3 niveles de la variable de bloqueo X 2 . Las celdas de la matriz tienen índices que coinciden con las combinaciones X 1 , X 2 anteriores.

Por extensión, tenga en cuenta que las pruebas para cualquier diseño de bloques aleatorios de factor K son simplemente los índices de celda de una matriz de k dimensiones.

Modelo

El modelo para un diseño de bloques aleatorios con una variable molesta es

dónde

Y ij es cualquier observación para la cual X 1 = i y X 2 = j
X 1 es el factor principal
X 2 es el factor de bloqueo
μ es el parámetro de ubicación general (es decir, la media)
T i es el efecto por estar en tratamiento i (del factor X 1 )
B j es el efecto por estar en el bloque j (del factor X 2 )

Estimados

Estimación de μ  : = el promedio de todos los datos
Estimación para T i  : con = promedio de todos los Y para los cuales X 1 = i .
Estimación para B j  : con = promedio de todos los Y para los cuales X 2 = j .

Generalizaciones

Ver también

Referencias

  1. ^ ab Caja, Joan Fisher (1980). "RA Fisher y el diseño de experimentos, 1922-1926". El estadístico estadounidense . 34 (1): 1–7. doi :10.2307/2682986. ISSN  0003-1305. JSTOR  2682986.
  2. ^ ab "5.3.3.3.3. Bloqueo de diseños factoriales completos". www.itl.nist.gov . Consultado el 11 de diciembre de 2023 .
  3. ^ abcde "5.3.3.2. Diseños de bloques aleatorios". www.itl.nist.gov . Consultado el 11 de diciembre de 2023 .
  4. ^ abcd Berger, Paul D.; Maurer, Robert E.; Celli, Giovana B. (2018). Diseño experimental. doi :10.1007/978-3-319-64583-4. ISBN 978-3-319-64582-7.
  5. ^ "Diseño de bloques aleatorios", The Concise Encyclopedia of Statistics , Nueva York, NY: Springer, 2008, págs. 447–448, doi :10.1007/978-0-387-32833-1_344, ISBN 978-0-387-32833-1, recuperado el 11 de diciembre de 2023
  6. ^ Bernstein SN (1926) Sur l'extension du théorème limite du calcul des probabilités aux sommes de quantités dépendantes. Matemáticas. Annalen, v. 97, 1–59.
  7. ^ Ibragimov IA y Linnik Yu.V. (1971) Secuencias independientes y estacionarias de variables aleatorias. Wolters-Noordhoff, Groninga.
  8. ^ Leadbetter MR, Lindgren G. y Rootzén H. (1983) Extremos y propiedades relacionadas de procesos y secuencias aleatorias. Nueva York: Springer Verlag.
  9. ^ Novak SY (2011) Métodos de valor extremo con aplicaciones a las finanzas. Chapman & Hall/CRC Press, Londres.
  10. ^ Karmakar, Biikram (noviembre de 2022). "Un algoritmo de aproximación para el bloqueo de un diseño experimental": 1726-1750. {{cite journal}}: Citar diario requiere |journal=( ayuda )
  11. ^ Pashley, Nicole E.; Miratrix, Luke W. (7 de julio de 2021). "Bloquea lo que puedas, excepto cuando no debas". Revista de estadísticas educativas y del comportamiento . 47 (1): 69-100. arXiv : 2010.14078 . doi :10.3102/10769986211027240. ISSN  1076-9986.
  12. ^ ab Ledolter, Johannes; Kardon, Randy H. (9 de julio de 2020). "Centrarse en los datos: diseño estadístico de experimentos y selección del tamaño de la muestra mediante análisis de potencia". Oftalmología de investigación y ciencias visuales . 61 (8): 11. doi :10.1167/iovs.61.8.11. ISSN  0146-0404. PMC 7425741 . PMID  32645134. 

Bibliografía