La ley de Fitts (a menudo citada como ley de Fitts ) es un modelo predictivo del movimiento humano utilizado principalmente en la interacción persona-computadora y en la ergonomía . La ley predice que el tiempo necesario para moverse rápidamente a un área objetivo es función de la relación entre la distancia al objetivo y el ancho del objetivo. [1] La ley de Fitts se utiliza para modelar el acto de señalar , ya sea tocando físicamente un objeto con una mano o un dedo, o virtualmente, señalando un objeto en un monitor de computadora usando un dispositivo señalador . Fue desarrollado inicialmente por Paul Fitts .
Se ha demostrado que la ley de Fitts se aplica en diversas condiciones; con muchas extremidades diferentes (manos, pies, [2] el labio inferior, [3] miras montadas en la cabeza [4] ), manipulanda (dispositivos de entrada), [5] entornos físicos (incluido el agua [6] ) y poblaciones de usuarios. (jóvenes, mayores, [7] necesidades educativas especiales, [8] y participantes drogados [9] ).
El artículo original de 1954 de Paul Morris Fitts propuso una métrica para cuantificar la dificultad de una tarea de selección de objetivos. La métrica se basó en una analogía de la información, donde la distancia al centro del objetivo ( D ) es como una señal y la tolerancia o ancho del objetivo ( W ) es como el ruido. La métrica es el índice de dificultad de Fitts ( ID , en bits):
Fitts también propuso un índice de desempeño ( IP , en bits por segundo) como medida del desempeño humano. La métrica combina el índice de dificultad ( ID ) de una tarea con el tiempo de movimiento ( MT , en segundos) para seleccionar el objetivo. En palabras de Fitts, "La tasa promedio de información generada por una serie de movimientos es la información promedio por movimiento dividida por el tiempo por movimiento". [1] Así,
Hoy en día, IP se denomina más comúnmente rendimiento ( TP ). También es común incluir un ajuste por precisión en el cálculo.
Los investigadores posteriores a Fitts comenzaron la práctica de construir ecuaciones de regresión lineal y examinar la correlación ( r ) para determinar la bondad del ajuste. La ecuación expresa la relación entre MT y los parámetros de la tarea D y W :
dónde:
Dado que son deseables tiempos de movimiento más cortos para una tarea determinada, el valor del parámetro b se puede utilizar como métrica al comparar dispositivos señaladores de computadora entre sí. La primera aplicación de la ley de Fitts en la interfaz hombre-computadora fue realizada por Card, English y Burr, [11] quienes utilizaron el índice de rendimiento ( IP ), interpretado como 1 ⁄ b , para comparar el rendimiento de diferentes dispositivos de entrada , con el ratón viniendo. en la parte superior en comparación con el joystick o las teclas de movimiento direccional. [11] Este primer trabajo, según la biografía de Stuart Card , "fue un factor importante que condujo a la introducción comercial del ratón por parte de Xerox ". [12]
Muchos experimentos que prueban la ley de Fitts aplican el modelo a un conjunto de datos en el que varían la distancia o el ancho, pero no ambos. El poder predictivo del modelo se deteriora cuando ambos varían en un rango significativo. [13] Observe que debido a que el término ID depende solo de la relación entre la distancia y el ancho, el modelo implica que una combinación de distancia y ancho objetivo se puede volver a escalar arbitrariamente sin afectar el tiempo de movimiento, lo cual es imposible. A pesar de sus defectos, esta forma de modelo posee un poder predictivo notable en una variedad de modalidades de interfaz de computadora y tareas motoras, y ha proporcionado muchos conocimientos sobre los principios de diseño de la interfaz de usuario.
Un movimiento durante una única tarea de la ley de Fitts se puede dividir en dos fases: [10]
La primera fase está definida por la distancia al objetivo. En esta fase la distancia se puede acortar rápidamente sin dejar de ser imprecisa. El segundo movimiento intenta realizar un movimiento preciso, lento y controlado para alcanzar el objetivo. La duración de la tarea aumenta linealmente con respecto a la dificultad. [10] Pero como diferentes tareas pueden tener la misma dificultad, se deduce que la distancia tiene un mayor impacto en el tiempo total de finalización de la tarea que el tamaño objetivo.
A menudo se cita que la ley de Fitts se puede aplicar al seguimiento ocular . Este parece ser al menos un tema controvertido, como demostró Drewes. [14] Durante los movimientos oculares sacádicos rápidos, el usuario queda ciego. Durante una tarea de la ley de Fitts, el usuario adquiere conscientemente su objetivo y puede verlo, lo que hace que estos dos tipos de interacción no sean comparables.
La formulación del índice de dificultad de Fitts que se utiliza con mayor frecuencia en la comunidad de interacción persona-computadora se llama formulación de Shannon:
Esta forma fue propuesta por Scott MacKenzie, [15] profesor de la Universidad de York , y recibió su nombre por su parecido con el teorema de Shannon-Hartley . [16] Describe la transmisión de información utilizando ancho de banda, intensidad de señal y ruido. En la ley de Fitts, la distancia representa la intensidad de la señal, mientras que el ancho del objetivo es el ruido.
Utilizando esta forma del modelo, la dificultad de una tarea de señalar se equiparó con la cantidad de información transmitida (en unidades de bits) al realizar la tarea. Esto se justificó con la afirmación de que señalar se reduce a una tarea de procesamiento de información. Aunque no se estableció una conexión matemática formal entre la ley de Fitts y el teorema de Shannon-Hartley en el que se inspiró, la forma de Shannon de la ley se ha utilizado ampliamente, probablemente debido al atractivo de cuantificar las acciones motoras utilizando la teoría de la información. [17] En 2002 se publicó la norma ISO 9241 , que proporciona estándares para pruebas de interfaz hombre-computadora, incluido el uso de la forma de Shannon de la ley de Fitts. Se ha demostrado que la información transmitida mediante pulsaciones en serie de teclas en un teclado y la información implícita en el ID para tal tarea no son consistentes. [18] La entropía de Shannon da como resultado un valor de información diferente al de la ley de Fitts. Los autores señalan, sin embargo, que el error es insignificante y sólo debe tenerse en cuenta en comparaciones de dispositivos con entropía conocida o mediciones de las capacidades de procesamiento de información humana.
Crossman propuso una mejora importante a la ley de Fitts en 1956 (ver Welford, 1968, págs. 147-148) [19] y Fitts la utilizó en su artículo de 1964 con Peterson. [20] Con el ajuste, el ancho objetivo ( W ) se reemplaza por un ancho objetivo efectivo ( We ). W e se calcula a partir de la desviación estándar en las coordenadas de selección recopiladas durante una secuencia de pruebas para una condición DW particular . Si las selecciones se registran como coordenadas x a lo largo del eje de aproximación al objetivo, entonces
Esto produce
y por lo tanto
Si las coordenadas de selección se distribuyen normalmente, W e abarca el 96% de la distribución. Si la tasa de error observada fue del 4% en la secuencia de ensayos, entonces We = W. Si la tasa de error fue mayor al 4%, We > W , y si la tasa de error fue menor al 4%, We < W . Al utilizar W e , el modelo de la ley de Fitts refleja más fielmente lo que los usuarios realmente hicieron, en lugar de lo que se les pidió que hicieran.
La principal ventaja de calcular IP como se indicó anteriormente es que la variabilidad espacial o precisión se incluye en la medición. Con el ajuste por precisión, la ley de Fitts abarca más verdaderamente el equilibrio entre velocidad y precisión. Las ecuaciones anteriores aparecen en ISO 9241-9 como el método recomendado para calcular el rendimiento .
No mucho después de que se propuso el modelo original, se propuso una variación de 2 factores bajo la intuición de que la distancia y el ancho del objetivo tienen efectos separados en el tiempo de movimiento. El modelo de Welford, propuesto en 1968, separó la influencia de la distancia y el ancho del objetivo en términos separados y proporcionó un poder predictivo mejorado: [19]
Este modelo tiene un parámetro adicional, por lo que su precisión predictiva no se puede comparar directamente con las formas de un factor de la ley de Fitts. Sin embargo, una variación del modelo de Welford inspirada en la formulación de Shannon,
El parámetro adicional k permite la introducción de ángulos en el modelo. Ahora se puede tener en cuenta la posición de los usuarios. La influencia del ángulo se puede ponderar utilizando el exponente. Esta adición fue introducida por Kopper et al. en 2010. [21]
La fórmula se reduce a la forma de Shannon cuando k = 1 . Por lo tanto, este modelo se puede comparar directamente con la forma de Shannon de la ley de Fitts utilizando la prueba F de modelos anidados. [22] Esta comparación revela que la forma de Shannon del modelo de Welford no sólo predice mejor los tiempos de movimiento, sino que también es más robusta cuando se varía la ganancia de control-visualización (la relación entre, por ejemplo, el movimiento de la mano y el movimiento del cursor). En consecuencia, aunque el modelo de Shannon es ligeramente más complejo y menos intuitivo, empíricamente es el mejor modelo para utilizar en tareas de señalización virtual.
En su forma original, la ley de Fitts pretende aplicarse sólo a tareas unidimensionales. Sin embargo, los experimentos originales requerían que los sujetos movieran un lápiz (en tres dimensiones) entre dos placas de metal sobre una mesa, lo que se denomina tarea de golpeteo recíproco. [1] El ancho del objetivo perpendicular a la dirección del movimiento era muy amplio para evitar que tuviera una influencia significativa en el rendimiento. Una aplicación importante de la ley de Fitts son las tareas de señalización virtual 2D en pantallas de computadora, en las que los objetivos tienen tamaños acotados en ambas dimensiones.
La ley de Fitts se ha extendido a tareas bidimensionales de dos maneras diferentes. Para navegar, por ejemplo, menús desplegables jerárquicos, el usuario debe generar una trayectoria con el dispositivo señalador que esté limitada por la geometría del menú; para esta aplicación se derivó la ley de dirección de Accot-Zhai .
Para simplemente señalar objetivos en un espacio bidimensional, el modelo generalmente se mantiene tal como está, pero requiere ajustes para capturar la geometría del objetivo y cuantificar los errores de orientación de una manera lógicamente consistente. [23] [24] Se han utilizado varios métodos para determinar el tamaño del objetivo: [25]
Si bien el modelo W a veces se considera la medición más avanzada, la representación verdaderamente correcta para objetivos no circulares es sustancialmente más compleja, ya que requiere calcular la convolución específica del ángulo entre la trayectoria del dispositivo señalador y el objetivo [26]
Dado que los parámetros a y b deberían capturar los tiempos de movimiento en una gama potencialmente amplia de geometrías de tareas, pueden servir como una métrica de rendimiento para una interfaz determinada. Al hacerlo, es necesario separar la variación entre usuarios de la variación entre interfaces. El parámetro a suele ser positivo y cercano a cero y, a veces, se ignora al caracterizar el rendimiento promedio, como en el experimento original de Fitts. [18] Existen múltiples métodos para identificar parámetros a partir de datos experimentales, y la elección del método es objeto de acalorados debates, ya que la variación del método puede dar lugar a diferencias de parámetros que abruman las diferencias de rendimiento subyacentes. [27] [28]
Una cuestión adicional a la hora de caracterizar el rendimiento es incorporar la tasa de éxito: un usuario agresivo puede lograr tiempos de movimiento más cortos a costa de pruebas experimentales en las que no se alcanza el objetivo. Si estos últimos no se incorporan al modelo, los tiempos medios de movimiento pueden reducirse artificialmente.
La ley de Fitts se ocupa únicamente de objetivos definidos en el espacio. Sin embargo, un objetivo se puede definir únicamente en el eje del tiempo, lo que se denomina objetivo temporal. Un objetivo parpadeante o un objetivo que se mueve hacia un área de selección son ejemplos de objetivos temporales. De manera similar al espacio, la distancia al objetivo (es decir, la distancia temporal Dt ) y el ancho del objetivo (es decir, el ancho temporal Wt ) también se pueden definir para objetivos temporales. La distancia temporal es la cantidad de tiempo que una persona debe esperar hasta que aparezca un objetivo. El ancho temporal es una duración corta desde el momento en que aparece el objetivo hasta que desaparece. Por ejemplo, para un objetivo que parpadea, se puede considerar D t como el período de parpadeo y W t como la duración del parpadeo. Al igual que con los objetivos en el espacio, cuanto mayor sea el Dt o menor el Wt , más difícil resulta seleccionar el objetivo .
La tarea de seleccionar el objetivo temporal se llama señalización temporal . El modelo para el señalador temporal se presentó por primera vez en el campo de la interacción persona-computadora en 2016. [29] El modelo predice la tasa de error, el desempeño humano en el señalador temporal, en función del índice temporal de dificultad ( ID t ):
Se pueden derivar múltiples pautas de diseño para GUI a partir de las implicaciones de la ley de Fitts. En su forma básica, la ley de Fitts dice que los objetivos que un usuario debe alcanzar deben ser lo más grandes posible. Esto se deriva del parámetro W. Más concretamente, el tamaño efectivo del botón debería ser lo más grande posible, es decir, su forma debe optimizarse para la dirección del movimiento del usuario hacia el objetivo.
Los diseños también deben agrupar funciones que se usan comúnmente entre sí. La optimización del parámetro D de esta manera permite tiempos de viaje más cortos.
Colocar elementos de diseño en los cuatro bordes de la pantalla permite objetivos infinitamente grandes en una dimensión y, por lo tanto, presenta escenarios ideales. Dado que el puntero siempre se detendrá en el borde, el usuario puede mover el mouse con la mayor velocidad posible y aun así alcanzar el objetivo. El área objetivo es efectivamente infinitamente larga a lo largo del eje de movimiento. Por eso, esta pauta se llama “Regla de las aristas infinitas”. El uso de esta regla se puede ver, por ejemplo, en MacOS , que siempre coloca la barra de menú en el borde superior izquierdo de la pantalla en lugar del marco de la ventana del programa actual. [30]
Este efecto puede exagerarse en las cuatro esquinas de una pantalla. En estos puntos chocan dos aristas y forman un botón teóricamente infinitamente grande. Microsoft Windows (antes de Windows 11 ) coloca su botón "Inicio" en la esquina inferior izquierda y Microsoft Office 2007 usa la esquina superior izquierda para su menú "Office". Estos cuatro lugares a veces se denominan "rincones mágicos". [31] MacOS coloca el botón de cerrar en el lado superior izquierdo de la ventana del programa y la barra de menú llena la esquina mágica con otro botón.
Una interfaz de usuario que permite menús emergentes en lugar de menús desplegables fijos reduce los tiempos de viaje para el parámetro D. El usuario puede continuar la interacción directamente desde la posición actual del mouse y no tiene que moverse a un área preestablecida diferente. Muchos sistemas operativos utilizan esto al mostrar menús contextuales al hacer clic con el botón derecho. Como el menú comienza justo en el píxel en el que el usuario hizo clic, este píxel se denomina "píxel mágico" o "píxel principal". [25]
James Boritz et al. (1991) [32] compararon diseños de menús radiales . En un menú radial, todos los elementos tienen la misma distancia del píxel principal. La investigación sugiere que en implementaciones prácticas también se debe tener en cuenta la dirección en la que el usuario debe mover el mouse. Para los usuarios diestros, seleccionar el elemento del menú más a la izquierda fue significativamente más difícil que el de más a la derecha. No se encontraron diferencias para las transiciones de funciones superiores a inferiores y viceversa.
{{cite book}}
: Mantenimiento CS1: falta el editor de la ubicación ( enlace ){{cite journal}}
: Mantenimiento CS1: fecha y año ( enlace )