stringtranslate.com

experimento factorial

Experimentos diseñados con diseño factorial completo (izquierda), superficie de respuesta con polinomio de segundo grado (derecha)

En estadística , un experimento factorial completo es un experimento cuyo diseño consta de dos o más factores, cada uno con valores o "niveles" discretos posibles, y cuyas unidades experimentales asumen todas las combinaciones posibles de estos niveles en todos esos factores. Un diseño factorial completo también puede denominarse diseño completamente cruzado . Un experimento de este tipo permite al investigador estudiar el efecto de cada factor sobre la variable de respuesta , así como los efectos de las interacciones entre factores sobre la variable de respuesta.

Para la gran mayoría de experimentos factoriales, cada factor tiene sólo dos niveles. Por ejemplo, con dos factores, cada uno de los cuales toma dos niveles, un experimento factorial tendría cuatro combinaciones de tratamientos en total y generalmente se denomina diseño factorial 2×2 . En tal diseño, la interacción entre las variables suele ser la más importante. Esto se aplica incluso a escenarios en los que están presentes un efecto principal y una interacción.

Si el número de combinaciones en un diseño factorial completo es demasiado alto para ser logísticamente factible, se puede realizar un diseño factorial fraccionado , en el que se omiten algunas de las combinaciones posibles (generalmente al menos la mitad).

A menudo se utilizan otros términos para "combinaciones de tratamientos", como ejecuciones (de un experimento), puntos (considerando las combinaciones como vértices de un gráfico y celdas (que surgen como intersecciones de filas y columnas).

Historia

Los diseños factoriales fueron utilizados en el siglo XIX por John Bennet Lawes y Joseph Henry Gilbert de la Estación Experimental Rothamsted . [1]

Ronald Fisher argumentó en 1926 que los diseños "complejos" (como los diseños factoriales) eran más eficientes que estudiar un factor a la vez. [2] Fisher escribió,

"Ningún aforismo se repite con más frecuencia en relación con los ensayos de campo que el de que debemos hacerle a la naturaleza pocas preguntas, o, idealmente, una pregunta a la vez. El escritor está convencido de que esta opinión es totalmente errónea".

La naturaleza, sugiere, responderá mejor a "un cuestionario lógico y cuidadosamente pensado". Un diseño factorial permite determinar el efecto de varios factores e incluso las interacciones entre ellos con el mismo número de ensayos necesarios para determinar cualquiera de los efectos por sí solo con el mismo grado de precisión.

Frank Yates hizo contribuciones significativas, particularmente en el análisis de diseños, mediante el análisis de Yates .

Es posible que el término "factorial" no se haya utilizado impresamente antes de 1935, cuando Fisher lo utilizó en su libro El diseño de experimentos . [3]

Ventajas y desventajas de los experimentos factoriales.

Mucha gente examina el efecto de un solo factor o variable. En comparación con estos experimentos de un factor a la vez (OFAT), los experimentos factoriales ofrecen varias ventajas [4] [5]

La principal desventaja del diseño factorial completo es su requisito de tamaño de muestra, que crece exponencialmente con el número de factores o insumos considerados. [6] Las estrategias alternativas con eficiencia computacional mejorada incluyen diseños factoriales fraccionados , muestreo de hipercubo latino y técnicas de muestreo cuasi aleatorio .

Ejemplo de ventajas de los experimentos factoriales.

En su libro Improving Almost Anything: Ideas and Essays , el estadístico George Box da muchos ejemplos de los beneficios de los experimentos factoriales. Acá hay uno. [7] Los ingenieros del fabricante de rodamientos SKF querían saber si cambiar a un diseño de "jaula" menos costoso afectaría la vida útil del rodamiento. Los ingenieros pidieron ayuda al estadístico Christer Hellstrand para diseñar el experimento. [8]

Box informa lo siguiente. "Los resultados se evaluaron mediante una prueba de vida acelerada... Las pruebas fueron costosas porque debían realizarse en una línea de producción real y los experimentadores planeaban hacer cuatro pruebas con la jaula estándar y cuatro con la jaula modificada. Christer preguntó si Había otros factores que les gustaría probar. Dijeron que sí, pero que hacer ejecuciones adicionales excedería su presupuesto. Christer les mostró cómo podían probar dos factores adicionales "gratis", sin aumentar el número de ejecuciones y sin reducir el precisión de su estimación del efecto jaula. En este arreglo, llamado diseño factorial 2×2×2, cada uno de los tres factores se ejecutaría en dos niveles y se incluirían las ocho combinaciones posibles. Las diversas combinaciones se pueden mostrar convenientemente como los vértices de un cubo... " "En cada caso, la condición estándar se indica con un signo menos y la condición modificada con un signo más. Los factores que cambiaron fueron el tratamiento térmico, la osculación del anillo exterior y el diseño de la jaula. Los números muestran la duración relativa de la vida de los rodamientos. Si nos fijamos en [el gráfico del cubo], podemos ver que la elección del diseño de la jaula no hizo mucha diferencia. … Pero, si promedias los pares de números para el diseño de la jaula, obtienes la [tabla siguiente], que muestra lo que hicieron los otros dos factores. … Esto llevó al extraordinario descubrimiento de que, en esta aplicación particular, la vida útil de un rodamiento se puede multiplicar por cinco si los dos factores, la osculación del anillo exterior y los tratamientos térmicos del anillo interior, se aumentan juntos".

"Si recordamos que rodamientos como este se han fabricado durante décadas, al principio resulta sorprendente que se pueda tardar tanto en descubrir una mejora tan importante. Una explicación probable es que, como la mayoría de los ingenieros, hasta hace poco, sólo han empleado un factor en Después de un tiempo de experimentación, se han pasado por alto los efectos de interacción ".

Ejemplo

El experimento factorial más simple contiene dos niveles para cada uno de los dos factores. Suponga que un ingeniero desea estudiar la potencia total utilizada por cada uno de dos motores diferentes, A y B, que funcionan a cada una de dos velocidades diferentes, 2000 o 3000 RPM. El experimento factorial constaría de cuatro unidades experimentales: motor A a 2000 RPM, motor B a 2000 RPM, motor A a 3000 RPM y motor B a 3000 RPM. Cada combinación de un único nivel seleccionado de cada factor está presente una vez.

Este experimento es un ejemplo de experimento factorial 2 2 (o 2×2), llamado así porque considera dos niveles (la base) para cada uno de dos factores (la potencia o superíndice), o #niveles #factores , produciendo 2 2 =4 puntos factoriales.

Diagrama cúbico para diseño factorial.

Los diseños pueden involucrar muchas variables independientes. Como ejemplo adicional, los efectos de tres variables de entrada se pueden evaluar en ocho condiciones experimentales mostradas como las esquinas de un cubo.

Esto se puede realizar con o sin replicación, según el propósito previsto y los recursos disponibles. Proporcionará los efectos de las tres variables independientes sobre la variable dependiente y sus posibles interacciones.

Notación

Los experimentos factoriales se describen mediante dos cosas: la cantidad de factores y la cantidad de niveles de cada factor. Por ejemplo, un experimento factorial 2×3 tiene dos factores, el primero a 2 niveles y el segundo a 3 niveles. Un experimento de este tipo tiene 2 x 3 = 6 combinaciones de tratamientos o células. De manera similar, un experimento de 2×2×3 tiene tres factores, dos en 2 niveles y uno en 3, para un total de 12 combinaciones de tratamientos. Si cada factor tiene s niveles (lo que se denomina diseño simétrico o de nivel fijo ), el experimento normalmente se denota por s k , donde k es el número de factores. Por tanto, un experimento de 2 5 tiene 5 factores, cada uno en 2 niveles. Los experimentos que no son de nivel fijo se llaman de nivel mixto o asimétricos .

Existen varias tradiciones para indicar los niveles de cada factor. Si un factor ya tiene unidades naturales, entonces se utilizan esas. Por ejemplo, un experimento de acuicultura de camarones [9] podría tener factores de temperatura a 25° y 35° centígrados, densidad a 80 o 160 camarones/40 litros y salinidad a 10%, 25% y 40%. Sin embargo, en muchos casos los niveles de los factores son simplemente categorías y la codificación de los niveles es algo arbitraria. Por ejemplo, los niveles de un factor de 6 niveles podrían indicarse simplemente 1, 2,..., 6.

Las combinaciones de tratamientos se indican mediante pares ordenados o, más generalmente, tuplas ordenadas . En el experimento de acuicultura, el triple ordenado (25, 80, 10) representa la combinación de tratamientos que tiene el nivel más bajo de cada factor. En un experimento general de 2×3, el par ordenado (2, 1) indicaría la celda en la que el factor A está en el nivel 2 y el factor B en el nivel 1. Los paréntesis a menudo se eliminan, como se muestra en la tabla adjunta.

Para denotar niveles de factores en experimentos de 2 k , aparecen en la literatura tres sistemas particulares:

Si estos valores representan configuraciones "bajas" y "altas" de un tratamiento, entonces es natural que 1 represente "alto", ya sea usando 0 y 1 o −1 y 1. Esto se ilustra en la tabla adjunta para un 2× 2 experimento. Si los niveles de los factores son simplemente categorías, la correspondencia podría ser diferente; por ejemplo, es natural representar las condiciones de "control" y "experimentales" codificando "control" como 0 si se usan 0 y 1, y como 1 si se usan 1 y −1. [nota 1] A continuación se ofrece un ejemplo de este último. Ese ejemplo ilustra otro uso de la codificación +1 y −1.

Para otros experimentos de nivel fijo ( s k ), los valores 0, 1, ..., s −1 se utilizan a menudo para indicar niveles de factores. Estos son los valores de los números enteros módulo s cuando s es primo. [nota 2]

Contrastes, principales efectos e interacciones.

La respuesta esperada a una determinada combinación de tratamientos se denomina media celular , [12] normalmente denotada con la letra griega μ. (El término celda se toma prestado de su uso en tablas de datos ). Esta notación se ilustra aquí para el experimento de 2 × 3.

Un contraste en las medias de las celdas es una combinación lineal de medias de las celdas en la que los coeficientes suman 0. Los contrastes son de interés en sí mismos y son los componentes básicos mediante los cuales se definen los efectos e interacciones principales.

En el experimento 2 × 3 ilustrado aquí, la expresión

es un contraste que compara las respuestas medias de las combinaciones de tratamiento 11 y 12. (Los coeficientes aquí son 1 y –1). El contraste

Se dice que pertenece al efecto principal del factor A ya que contrasta las respuestas del nivel "1" del factor con las del nivel "2". Se dice que el efecto principal de A está ausente si esta expresión es igual a 0.

La interacción en un experimento factorial es la falta de aditividad entre factores y también se expresa mediante contrastes. En el experimento 2 × 3, los contrastes

  y  

pertenecen a la interacción A × B ; la interacción está ausente (la aditividad está presente ) si estas expresiones son iguales a 0. [13] [14] La aditividad puede verse como una especie de paralelismo entre factores, como se ilustra en la sección Análisis a continuación.

Dado que son los coeficientes de estos contrastes los que contienen la información esencial, a menudo se muestran como vectores de columna . Para el ejemplo anterior, una tabla de este tipo podría verse así: [15]

Las columnas de dicha tabla se denominan vectores de contraste : sus componentes suman 0. Cada efecto está determinado tanto por el patrón de componentes en sus columnas como por el número de columnas .

Los patrones de componentes de estas columnas reflejan las definiciones generales dadas por Bose : [16]

Se aplican definiciones similares para interacciones de más de dos factores. En el ejemplo de 2 × 3, por ejemplo, el patrón de la columna A sigue el patrón de los niveles del factor A , indicado por el primer componente de cada celda.

El número de columnas necesarias para especificar cada efecto son los grados de libertad del efecto [nota 4] y es una cantidad esencial en el análisis de varianza . La fórmula es la siguiente: [18] [19]

La fórmula para más de dos factores sigue este patrón. En el ejemplo anterior de 2 × 3, los grados de libertad para los dos efectos principales y la interacción (el número de columnas para cada uno) son 1, 2 y 2, respectivamente.

Ejemplos

En las tablas de los siguientes ejemplos, las entradas en la columna "celda" son combinaciones de tratamientos: el primer componente de cada combinación es el nivel del factor A , el segundo para el factor B y el tercero (en el modelo 2 × 2 × 2). ejemplo) el nivel del factor C . Las entradas en cada una de las otras columnas suman 0, de modo que cada columna es un vector de contraste.

Un experimento de 3 × 3: Aquí esperamos 3-1 = 2 grados de libertad cada uno para los efectos principales de los factores A y B , y (3-1)(3-1) = 4 grados de libertad para la interacción A × B . Esto representa el número de columnas para cada efecto en la tabla adjunta.

Los dos vectores de contraste para A dependen únicamente del nivel del factor A. Esto se puede ver al observar que el patrón de entradas en cada columna A es el mismo que el patrón del primer componente de "celda". (Si es necesario, ordenar la tabla por A mostrará esto). Por lo tanto, estos dos vectores pertenecen al efecto principal de A. De manera similar, los dos vectores de contraste para B dependen sólo del nivel del factor B , es decir , el segundo componente de "celda", por lo que pertenecen al efecto principal de B.

Los últimos cuatro vectores de columna pertenecen a la interacción A × B , ya que sus entradas dependen de los valores de ambos factores y las cuatro columnas son ortogonales a las columnas de A y B. Esto último se puede verificar tomando productos escalares .


Un experimento 2 × 2 × 2: tendrá 1 grado de libertad para cada efecto e interacción principal. Por ejemplo, una interacción de dos factores tendrá (2-1)(2-1) = 1 grado de libertad. Por lo tanto, sólo se necesita una columna para especificar cada uno de los siete efectos.

Las columnas para A , B y C representan los efectos principales correspondientes, ya que las entradas en cada columna dependen únicamente del nivel del factor correspondiente. Por ejemplo, las entradas de la columna B siguen el mismo patrón que el componente central de "celda", como se puede ver al ordenar por B.

Las columnas para AB , AC y BC representan las correspondientes interacciones de dos factores. Por ejemplo, (i) las entradas en la columna BC dependen del segundo y tercer componente ( B y C ) de la celda , y son independientes del primer componente ( A ), como se puede ver al ordenar por BC ; y (ii) la columna BC es ortogonal a las columnas B y C , como se puede verificar calculando productos escalares.

Finalmente, la columna ABC representa la interacción de tres factores: sus entradas dependen de los niveles de los tres factores y es ortogonal a los otros seis vectores de contraste.

Las primeras tres columnas de esta tabla, leídas fila por fila, dan una representación alternativa de las ocho combinaciones de tratamientos: 000 corresponde a +++, 001 a ++−, etc.

En esta tabla, el número 1 puede reemplazarse por cualquier constante, porque las columnas resultantes seguirán siendo vectores de contraste. Es común utilizar el número 1/4 en experimentos de 2 × 2 × 2 [nota 5] para definir cada efecto o interacción principal y declarar, por ejemplo, que el contraste

es "el" efecto principal del factor A , una cantidad numérica que se puede estimar. [20]

Implementación

Para más de dos factores, un experimento factorial de 2 k generalmente se puede diseñar recursivamente a partir de un experimento factorial de 2 k −1 replicando el experimento de 2 k −1 , asignando la primera réplica al primer (o bajo) nivel del nuevo factor. y el segundo se replica al segundo nivel (o superior). Este marco se puede generalizar, por ejemplo, para diseñar tres réplicas para factores de tres niveles, etc.

Un experimento factorial permite estimar el error experimental de dos maneras. El experimento se puede replicar o, a menudo, se puede explotar el principio de escasez de efectos . La replicación es más común para experimentos pequeños y es una forma muy confiable de evaluar el error experimental. Cuando el número de factores es grande (normalmente más de 5 factores, pero esto varía según la aplicación), la replicación del diseño puede resultar operativamente difícil. En estos casos, es común ejecutar sólo una única réplica del diseño y suponer que las interacciones de factores de más de un cierto orden (digamos, entre tres o más factores) son insignificantes. Bajo este supuesto, las estimaciones de tales interacciones de alto orden son estimaciones de un cero exacto, por lo que en realidad son una estimación del error experimental.

Cuando hay muchos factores, serán necesarias muchas ejecuciones experimentales, incluso sin replicación. Por ejemplo, experimentar con 10 factores en dos niveles produce cada uno 2 10 = 1024 combinaciones. En algún momento esto se vuelve inviable debido al alto costo o a la insuficiencia de recursos. En este caso se pueden utilizar diseños factoriales fraccionarios .

Como ocurre con cualquier experimento estadístico, las ejecuciones experimentales en un experimento factorial deben ser aleatorias para reducir el impacto que el sesgo podría tener en los resultados experimentales. En la práctica, esto puede ser un gran desafío operativo.

Los experimentos factoriales se pueden utilizar cuando hay más de dos niveles de cada factor. Sin embargo, el número de corridas experimentales requeridas para los diseños factoriales de tres (o más) niveles será considerablemente mayor que para sus contrapartes de dos niveles. Por tanto, los diseños factoriales son menos atractivos si un investigador desea considerar más de dos niveles.


Análisis

Un experimento factorial se puede analizar mediante ANOVA o análisis de regresión . [21] Para calcular el efecto principal de un factor "A" en un experimento de 2 niveles, reste la respuesta promedio de todas las ejecuciones experimentales para las cuales A estaba en su nivel bajo (o primero) de la respuesta promedio de todas las ejecuciones experimentales para cual A estaba en su nivel alto (o segundo).

Otras herramientas de análisis exploratorio útiles para experimentos factoriales incluyen gráficos de efectos principales , gráficos de interacción , gráficos de Pareto y un gráfico de probabilidad normal de los efectos estimados.

Cuando los factores son continuos, los diseños factoriales de dos niveles suponen que los efectos son lineales . Si se espera un efecto cuadrático para un factor, se debe utilizar un experimento más complicado, como un diseño compuesto central . La optimización de factores que podrían tener efectos cuadráticos es el objetivo principal de la metodología de superficie de respuesta .

Ejemplo de análisis

Montgomery [4] da el siguiente ejemplo de análisis de un experimento factorial:.

A un ingeniero le gustaría aumentar la tasa de filtración (producción) de un proceso para producir una sustancia química y reducir la cantidad de formaldehído utilizado en el proceso. Intentos anteriores de reducir el formaldehído han reducido la tasa de filtración. La tasa de filtración actual es de 75 galones por hora. Se consideran cuatro factores: temperatura (A), presión (B), concentración de formaldehído (C) y velocidad de agitación (D). Cada uno de los cuatro factores se probará en dos niveles.

En adelante, los signos menos (-) y más (+) indicarán si el factor se ejecuta en un nivel bajo o alto, respectivamente.

Las líneas no paralelas en el gráfico de interacción A:C indican que el efecto del factor A depende del nivel del factor C. Se obtienen resultados similares para la interacción A:D. Los gráficos indican que el factor B tiene poco efecto sobre la tasa de filtración. El análisis de varianza (ANOVA), que incluye los 4 factores y todos los términos de interacción posibles entre ellos, produce las estimaciones de coeficientes que se muestran en la siguiente tabla.

Gráfico de Pareto que muestra la magnitud relativa de los coeficientes factoriales.

Debido a que hay 16 observaciones y 16 coeficientes (intercepción, efectos principales e interacciones), los valores p no se pueden calcular para este modelo. Los valores de los coeficientes y las gráficas sugieren que los factores importantes son A, C y D, y los términos de interacción A:C y A:D.

Los coeficientes de A, C y D son todos positivos en el ANOVA, lo que sugeriría ejecutar el proceso con las tres variables establecidas en el valor alto. Sin embargo, el efecto principal de cada variable es el promedio sobre los niveles de las otras variables. El gráfico de interacción A:C anterior muestra que el efecto del factor A depende del nivel del factor C, y viceversa. El factor A (temperatura) tiene muy poco efecto sobre la tasa de filtración cuando el factor C está en el nivel +. Pero el factor A tiene un gran efecto sobre la tasa de filtración cuando el factor C (formaldehído) está en el nivel −. La combinación de A en el nivel + y C en el nivel - da la tasa de filtración más alta. Esta observación indica cómo los análisis de un factor a la vez pueden pasar por alto interacciones importantes. Sólo variando ambos factores A y C al mismo tiempo podría el ingeniero descubrir que el efecto del factor A depende del nivel del factor C.

Gráfico cúbico para el ANOVA utilizando los factores A, C y D, y los términos de interacción A:C y A:D. El gráfico ayuda a visualizar el resultado y muestra que la mejor combinación es A+, D+ y C−.

La mejor tasa de filtración se observa cuando A y D están en el nivel alto y C está en el nivel bajo. Este resultado también satisface el objetivo de reducir el formaldehído (factor C). Como B no parece ser importante, se puede eliminar del modelo. Al realizar el ANOVA utilizando los factores A, C y D, y los términos de interacción A:C y A:D, se obtiene el resultado que se muestra en la siguiente tabla, en la que todos los términos son significativos (valor p < 0,05).

Ver también

Notas explicativas

  1. ^ Esta elección da la correspondencia 01 ←→ +−, lo opuesto a lo que figura en la tabla. También hay razones algebraicas para hacer esto. [10] La elección de la codificación mediante + y − no es importante "siempre que el etiquetado sea coherente". [11]
  2. ^ Esta elección de niveles de factores facilita el uso del álgebra para manejar ciertas cuestiones del diseño experimental. Si s es una potencia de un primo, los niveles pueden denotarse por los elementos del campo finito GF(s) por la misma razón.
  3. ^ La ortogonalidad se determina calculando el producto escalar de vectores.
  4. ^ Los grados de libertad de un efecto son en realidad la dimensión de un espacio vectorial , es decir, el espacio de todos los vectores de contraste que pertenecen a ese efecto. [17]
  5. ^ Y 1/2 k-1 en experimentos de 2 k .

Notas

  1. ^ Yates, Frank ; Mather, Kenneth (1963). "Ronald Aylmer Fisher". Memorias biográficas de miembros de la Royal Society . Londres, Inglaterra: Royal Society . 9 : 91-120. doi : 10.1098/rsbm.1963.0006 .
  2. ^ Pescador, Ronald (1926). "La disposición de los experimentos de campo" (PDF) . Revista del Ministerio de Agricultura de Gran Bretaña . Londres, Inglaterra: Ministerio de Agricultura y Pesca. 33 : 503–513.
  3. ^ "Primeros usos conocidos de algunas de las palabras de matemáticas (F)". jeff560.tripod.com .
  4. ^ ab Montgomery, Douglas C. (2013). Diseño y análisis de experimentos (8ª ed.). Hoboken, Nueva Jersey: Wiley . ISBN 978-1-119-32093-7.
  5. ^ Oehlert, Gary (2000). Un primer curso en diseño y análisis de experimentos (edición revisada). Ciudad de Nueva York: WH Freeman and Company . ISBN 978-0-7167-3510-6.
  6. ^ Pinzas, C. (2006). "Estrategias de refinamiento para métodos de muestreo estratificados". Ingeniería de confiabilidad y seguridad de sistemas . 91 (10-11): 1257-1265. doi :10.1016/j.ress.2005.11.027.
  7. ^ George EP, Caja (2006). Mejorar casi cualquier cosa: ideas y ensayos (edición revisada). Hoboken, Nueva Jersey: Wiley . ASIN  B01FKSM9VY.
  8. ^ Hellstrand, C.; Oosterhoorn, AD; Sherwin, DJ; Gerson, M. (24 de febrero de 1989). "La necesidad de una mejora moderna de la calidad y cierta experiencia con su implementación en la fabricación de rodamientos [y discusión]". Transacciones filosóficas de la Royal Society . 327 (1596): 529–537. doi :10.1098/rsta.1989.0008. S2CID  122252479.
  9. ^ Kuehl (2000, págs. 200-205)
  10. ^ Cheng (2019, observación 8.1)
  11. ^ Caja, cazador y cazador (1978, p.307)
  12. ^ Hocking (1985, pág. 73). Hocking y otros utilizan el término "media poblacional" para referirse al valor esperado.
  13. ^ Graybill (1976, págs. 559-560)
  14. ^ Beder (2022, págs. 29-30)
  15. ^ Beder (2022, ejemplo 5.21)
  16. ^ Bosé (1947, págs. 110-111)
  17. ^ Cheng (2019, pág.77)
  18. ^ Kuehl (2000, pág.202)
  19. ^ Cheng (2019, pág.78)
  20. ^ Caja, Hunter & Hunter (2005, p.180)
  21. ^ Cohen, J (1968). "La regresión múltiple como sistema general de análisis de datos". Boletín Psicológico . 70 (6): 426–443. CiteSeerX 10.1.1.476.6180 . doi :10.1037/h0026714. 

Referencias

enlaces externos