En estadística , los diseños factoriales fraccionados son diseños experimentales que consisten en un subconjunto cuidadosamente elegido (fracción) de las ejecuciones experimentales de un diseño factorial completo . [1] El subconjunto se elige de modo de explotar el principio de escasez de efectos para exponer información sobre las características más importantes del problema estudiado, mientras se utiliza una fracción del esfuerzo de un diseño factorial completo en términos de ejecuciones experimentales y recursos. En otras palabras, hace uso del hecho de que muchos experimentos en el diseño factorial completo a menudo son redundantes, dando poca o ninguna información nueva sobre el sistema.
El diseño de experimentos factoriales fraccionados debe ser deliberado, ya que ciertos efectos se confunden y no pueden separarse de otros.
El diseño factorial fraccional fue introducido por el estadístico británico David John Finney en 1945, ampliando el trabajo previo de Ronald Fisher sobre el experimento factorial completo en la Estación Experimental de Rothamsted. [2] Desarrollado originalmente para aplicaciones agrícolas, desde entonces se ha aplicado a otras áreas de la ingeniería, la ciencia y los negocios. [3]
Similar a un experimento factorial completo , un experimento factorial fraccional investiga los efectos de las variables independientes, conocidas como factores, sobre una variable de respuesta. Cada factor se investiga en diferentes valores, conocidos como niveles. La variable de respuesta se mide utilizando una combinación de factores en diferentes niveles, y cada combinación única se conoce como una serie. Para reducir el número de series en comparación con un factorial completo, los experimentos están diseñados para confundir diferentes efectos e interacciones, de modo que no se puedan distinguir sus impactos. Las interacciones de orden superior entre los efectos principales suelen ser insignificantes, lo que hace que este sea un método razonable para estudiar los efectos principales. Este es el principio de escasez de efectos . La confusión se controla mediante una selección sistemática de series de una tabla factorial completa. [4]
Los diseños fraccionales se expresan utilizando la notación l k − p , donde l es el número de niveles de cada factor, k es el número de factores y p describe el tamaño de la fracción del factorial completo utilizado. Formalmente, p es el número de generadores; relaciones que determinan los efectos intencionalmente confundidos que reducen el número de ejecuciones necesarias. Cada generador reduce a la mitad el número de ejecuciones necesarias. Un diseño con p de estos generadores es una fracción 1/( l p )= l −p del diseño factorial completo. [3]
Por ejemplo, un diseño 2 5 − 2 es 1/4 de un diseño factorial de dos niveles y cinco factores. En lugar de las 32 ejecuciones que se requerirían para el experimento factorial 2 5 completo , este experimento requiere solo ocho ejecuciones. Con dos generadores, la cantidad de experimentos se ha reducido a la mitad.
En la práctica, rara vez se encuentran niveles l > 2 en diseños factoriales fraccionales, ya que la metodología para generar dichos diseños para más de dos niveles es mucho más engorrosa. En los casos que requieren 3 niveles para cada factor, los diseños fraccionales potenciales a seguir son los cuadrados latinos , los cuadrados latinos mutuamente ortogonales y los métodos de Taguchi . La metodología de superficie de respuesta también puede ser una forma mucho más eficiente experimentalmente para determinar la relación entre la respuesta experimental y los factores en múltiples niveles, pero requiere que los niveles sean continuos. Al determinar si se necesitan más de dos niveles, los experimentadores deben considerar si esperan que el resultado sea no lineal con la adición de un tercer nivel. Otra consideración es el número de factores, que puede cambiar significativamente la demanda de trabajo experimental. [5]
Los niveles de un factor se codifican comúnmente como +1 para el nivel superior y -1 para el nivel inferior. Para un factor de tres niveles, el valor intermedio se codifica como 0. [4]
Para ahorrar espacio, los puntos de un experimento factorial suelen abreviarse con cadenas de signos más y menos. Las cadenas tienen tantos símbolos como factores y sus valores dictan el nivel de cada factor: convencionalmente, para el primer nivel (o bajo) y para el segundo nivel (o alto). Los puntos de un experimento de dos niveles con dos factores pueden representarse así como , , y . [4]
Los puntos factoriales también se pueden abreviar con (1), a, b y ab, donde la presencia de una letra indica que el factor especificado está en su nivel alto (o segundo) y la ausencia de una letra indica que el factor especificado está en su nivel bajo (o primero) (por ejemplo, "a" indica que el factor A está en su nivel alto, mientras que todos los demás factores están en su nivel bajo (o primero)). (1) se utiliza para indicar que todos los factores están en sus valores más bajos (o primeros). Los puntos factoriales se organizan típicamente en una tabla utilizando el orden estándar de Yates: 1, a, b, ab, c, ac, bc, abc, que se crea cuando el nivel del primer factor se alterna con cada ejecución. [5]
En la práctica, los experimentadores suelen recurrir a libros de referencia estadística para obtener los diseños factoriales fraccionarios "estándar", que consisten en la fracción principal . La fracción principal es el conjunto de combinaciones de tratamientos para las que los generadores evalúan como + según el álgebra de combinaciones de tratamientos. Sin embargo, en algunas situaciones, los experimentadores pueden encargarse de generar su propio diseño fraccionario.
Un experimento factorial fraccional se genera a partir de un experimento factorial completo eligiendo una estructura de alias . La estructura de alias determina qué efectos se confunden entre sí. Por ejemplo, el factor cinco 2 5 − 2 se puede generar utilizando un experimento factorial completo de tres factores que involucra tres factores (por ejemplo, A , B y C ) y luego eligiendo confundir los dos factores restantes D y E con interacciones generadas por D = A * B y E = A * C . Estas dos expresiones se denominan generadores del diseño. Entonces, por ejemplo, cuando se ejecuta el experimento y el experimentador estima los efectos para el factor D , lo que realmente se está estimando es una combinación del efecto principal de D y la interacción de dos factores que involucra a A y B .
Una característica importante de un diseño fraccional es la relación definitoria , que da el conjunto de columnas de interacción igual en la matriz de diseño a una columna de signos más, denotada por I . Para el ejemplo anterior, dado que D = AB y E = AC , entonces ABD y ACE son ambas columnas de signos más y, en consecuencia, también lo es BDCE :
D*D = AB*D = yo
E*E = AC*E = yo
Yo = ABD*ACE = A*ABCDE = BCDE
En este caso, la relación definitoria del diseño fraccional es I = ABD = ACE = BCDE . La relación definitoria permite determinar el patrón de alias del diseño e incluye 2 p palabras. Nótese que en este caso, los efectos de interacción ABD , ACE y BCDE no se pueden estudiar en absoluto. A medida que aumenta el número de generadores y el grado de fraccionamiento, se confunden cada vez más efectos. [5]
El patrón de alias se puede determinar multiplicando por cada columna de factores. Para determinar cómo se confunde el efecto principal A, multiplique todos los términos en la relación de definición por A:
A*I = A*ABD = A*ACE = A*BCDE A = BC = CE = ABCDE
De esta manera, el efecto principal A se confunde con los efectos de interacción BC, CE y ABCDE. Se pueden calcular otros efectos principales siguiendo un método similar. [4]
Una propiedad importante de un diseño fraccional es su resolución o capacidad para separar los efectos principales y las interacciones de orden bajo entre sí. Formalmente, si los factores son binarios, entonces la resolución del diseño es la longitud mínima de palabra en la relación definitoria excluyendo ( I ). La resolución se denota utilizando números romanos y aumenta con el número. [4] Los diseños fraccionales más importantes son los de resolución III, IV y V: Las resoluciones por debajo de III no son útiles y las resoluciones por encima de V son un desperdicio (con factores binarios) en el sentido de que la experimentación expandida no tiene ningún beneficio práctico en la mayoría de los casos; la mayor parte del esfuerzo adicional se destina a la estimación de interacciones de orden muy alto que rara vez ocurren en la práctica. El diseño 2 5 − 2 anterior es la resolución III ya que su relación definitoria es I = ABD = ACE = BCDE.
El sistema de clasificación de resolución descrito se utiliza únicamente para diseños regulares. Los diseños regulares tienen un tamaño de ejecución que equivale a una potencia de dos y solo está presente un alias completo. Los diseños no regulares, a veces conocidos como diseños de Plackett-Burman , son diseños en los que el tamaño de ejecución es un múltiplo de 4; estos diseños introducen un alias parcial y se utiliza una resolución generalizada como criterio de diseño en lugar de la resolución descrita anteriormente.
Los diseños de Resolución III se pueden utilizar para construir diseños saturados, donde se pueden investigar N-1 factores en solo N ejecuciones. Estos diseños saturados se pueden utilizar para una selección rápida cuando intervienen muchos factores. [3]
Montgomery [3] da el siguiente ejemplo de un experimento factorial fraccional. Un ingeniero realizó un experimento para aumentar la tasa de filtración (salida) de un proceso para producir una sustancia química y para reducir la cantidad de formaldehído utilizado en el proceso. El experimento factorial completo se describe en la página de Wikipedia Experimento factorial . Se consideraron cuatro factores: temperatura (A), presión (B), concentración de formaldehído (C) y velocidad de agitación (D). Los resultados en ese ejemplo fueron que los efectos principales A, C y D y las interacciones AC y AD fueron significativos. Los resultados de ese ejemplo se pueden utilizar para simular un experimento factorial fraccional utilizando una media fracción del diseño original de 2 4 = 16 ejecuciones. La tabla muestra el diseño del experimento de media fracción de 2 4 - 1 = 8 ejecuciones y la tasa de filtración resultante, extraída de la tabla para el experimento factorial completo de 16 ejecuciones .
En este diseño fraccional, cada efecto principal se asocia a una interacción de 3 factores (por ejemplo, A = BCD) y cada interacción de 2 factores se asocia a otra interacción de 2 factores (por ejemplo, AB = CD). Las relaciones de asociación se muestran en la tabla. Este es un diseño de resolución IV, lo que significa que los efectos principales se asocian a interacciones de 3 factores y las interacciones de 2 factores se asocian a interacciones de 2 factores.
En la siguiente tabla se muestran las estimaciones de los efectos mediante el análisis de varianza. Al examinar la tabla, parece que hay grandes efectos debido a A, C y D. El coeficiente de la interacción AB es bastante pequeño. A menos que las interacciones AB y CD tengan efectos aproximadamente iguales pero opuestos, estas dos interacciones parecen ser insignificantes. Si A, C y D tienen grandes efectos, pero B tiene poco efecto, entonces las interacciones AC y AD son muy probablemente significativas. Estas conclusiones son consistentes con los resultados del experimento factorial completo de 16 ejecuciones.
Como B y sus interacciones parecen insignificantes, se puede eliminar B del modelo. La eliminación de B da como resultado un diseño factorial completo 2 3 para los factores A, C y D. Al realizar el análisis de varianza utilizando los factores A, C y D, y los términos de interacción A:C y A:D, se obtienen los resultados que se muestran en la tabla, que son muy similares a los resultados del experimento factorial completo , pero tienen la ventaja de requerir solo media fracción de 8 ejecuciones en lugar de 16.