La ley de Fitts (a menudo citada como ley de Fitts ) es un modelo predictivo del movimiento humano utilizado principalmente en la interacción hombre-ordenador y en la ergonomía . La ley predice que el tiempo necesario para moverse rápidamente hacia un área objetivo es una función de la relación entre la distancia al objetivo y el ancho del objetivo. [1] La ley de Fitts se utiliza para modelar el acto de señalar , ya sea tocando físicamente un objeto con una mano o un dedo, o virtualmente, apuntando a un objeto en un monitor de ordenador utilizando un dispositivo señalador . Fue desarrollada inicialmente por Paul Fitts .
Se ha demostrado que la ley de Fitts se aplica en una variedad de condiciones; con diferentes extremidades (manos, pies, [2] el labio inferior, [3] miras montadas en la cabeza [4] ), manipulanda (dispositivos de entrada), [5] entornos físicos (incluidos los submarinos [6] ) y poblaciones de usuarios (jóvenes, viejos, [7] necesidades educativas especiales, [8] y participantes drogados [9] ).
El artículo original de 1954 de Paul Morris Fitts propuso una métrica para cuantificar la dificultad de una tarea de selección de objetivos. La métrica se basaba en una analogía de información, donde la distancia al centro del objetivo ( D ) es como una señal y la tolerancia o ancho del objetivo ( W ) es como el ruido. La métrica es el índice de dificultad de Fitts ( ID , en bits):
Fitts también propuso un índice de rendimiento ( IP , en bits por segundo) como medida del rendimiento humano. La métrica combina el índice de dificultad de una tarea ( ID ) con el tiempo de movimiento ( MT , en segundos) en la selección del objetivo. En palabras de Fitts, "la tasa promedio de información generada por una serie de movimientos es la información promedio por movimiento dividida por el tiempo por movimiento". [1] Por lo tanto,
En la actualidad, el IP se denomina más comúnmente rendimiento ( TP ). También es habitual incluir un ajuste de precisión en el cálculo.
Los investigadores posteriores a Fitts comenzaron a desarrollar ecuaciones de regresión lineal y a examinar la correlación ( r ) para determinar la bondad del ajuste. La ecuación expresa la relación entre MT y los parámetros de la tarea D y W :
dónde:
Dado que para una tarea determinada es deseable contar con tiempos de movimiento más cortos, el valor del parámetro b se puede utilizar como métrica al comparar dispositivos señaladores de ordenador entre sí. La primera aplicación de la ley de Fitts en la interfaz hombre-ordenador fue obra de Card, English y Burr, [11] que utilizaron el índice de rendimiento ( IP ), interpretado como 1 ⁄ b , para comparar el rendimiento de diferentes dispositivos de entrada , siendo el ratón el mejor comparado con el joystick o las teclas de movimiento direccional. [11] Este trabajo temprano, según la biografía de Stuart Card , "fue un factor importante que condujo a la introducción comercial del ratón por parte de Xerox ". [12]
Muchos experimentos que prueban la ley de Fitts aplican el modelo a un conjunto de datos en el que se varía la distancia o el ancho, pero no ambos. El poder predictivo del modelo se deteriora cuando ambos varían en un rango significativo. [13] Nótese que debido a que el término ID depende solo de la relación entre la distancia y el ancho, el modelo implica que una combinación de distancia y ancho objetivo se puede reescalar arbitrariamente sin afectar el tiempo de movimiento, lo cual es imposible. A pesar de sus defectos, esta forma del modelo posee un poder predictivo notable en una variedad de modalidades de interfaz de computadora y tareas motoras, y ha proporcionado muchos conocimientos sobre los principios de diseño de interfaz de usuario.
Un movimiento durante una sola tarea de la ley de Fitts se puede dividir en dos fases: [10]
La primera fase se define por la distancia al objetivo. En esta fase, la distancia se puede acortar rápidamente sin perder precisión. El segundo movimiento intenta realizar un movimiento preciso, lento y controlado para alcanzar el objetivo. La duración de la tarea aumenta linealmente en relación con la dificultad. [10] Pero como diferentes tareas pueden tener la misma dificultad, se deduce que la distancia tiene un mayor impacto en el tiempo total de finalización de la tarea que el tamaño del objetivo.
A menudo se cita que la ley de Fitts se puede aplicar al seguimiento ocular . Este parece ser un tema al menos controvertido, como demostró Drewes. [14] Durante los movimientos sacádicos rápidos de los ojos , el usuario está ciego. Durante una tarea de la ley de Fitts, el usuario adquiere conscientemente su objetivo y puede verlo realmente, lo que hace que estos dos tipos de interacción no sean comparables.
La formulación del índice de dificultad de Fitts que se utiliza con más frecuencia en la comunidad de interacción hombre-computadora se denomina formulación de Shannon:
Esta forma fue propuesta por Scott MacKenzie, [15] profesor de la Universidad de York , y recibió su nombre por su parecido con el teorema de Shannon-Hartley . [16] Describe la transmisión de información utilizando ancho de banda, intensidad de la señal y ruido. En la ley de Fitts, la distancia representa la intensidad de la señal, mientras que el ancho del objetivo es el ruido.
Utilizando esta forma del modelo, la dificultad de una tarea de señalar se equiparó a una cantidad de información transmitida (en unidades de bits) al realizar la tarea. Esto se justificó con la afirmación de que señalar se reduce a una tarea de procesamiento de información. Aunque no se estableció una conexión matemática formal entre la ley de Fitts y el teorema de Shannon-Hartley en el que se inspiró, la forma de Shannon de la ley se ha utilizado ampliamente, probablemente debido al atractivo de cuantificar las acciones motoras utilizando la teoría de la información. [17] En 2002 se publicó la ISO 9241 , que proporciona estándares para las pruebas de interfaz hombre-computadora, incluido el uso de la forma de Shannon de la ley de Fitts. Se ha demostrado que la información transmitida a través de pulsaciones de teclas en serie en un teclado y la información implícita en el ID para tal tarea no son consistentes. [18] La entropía de Shannon da como resultado un valor de información diferente al de la ley de Fitts. Los autores señalan, sin embargo, que el error es insignificante y sólo debe tenerse en cuenta en comparaciones de dispositivos con entropía conocida o en mediciones de las capacidades de procesamiento de información humana.
Crossman propuso una mejora importante de la ley de Fitts en 1956 (ver Welford, 1968, pp. 147-148) [19] y Fitts la utilizó en su artículo de 1964 con Peterson. [20] Con el ajuste, el ancho del objetivo ( W ) se reemplaza por un ancho de objetivo efectivo ( W e ). W e se calcula a partir de la desviación estándar en las coordenadas de selección recopiladas durante una secuencia de ensayos para una condición particular de DW . Si las selecciones se registran como coordenadas x a lo largo del eje de aproximación al objetivo, entonces
Esto produce
y por lo tanto
Si las coordenadas de selección se distribuyen normalmente, W e abarca el 96% de la distribución. Si la tasa de error observada fue del 4% en la secuencia de ensayos, entonces W e = W . Si la tasa de error fue mayor que el 4%, W e > W , y si la tasa de error fue menor que el 4%, W e < W . Al utilizar W e , un modelo de la ley de Fitts refleja más fielmente lo que los usuarios hicieron realmente, en lugar de lo que se les pidió que hicieran.
La principal ventaja de calcular la IP como se ha indicado anteriormente es que la variabilidad espacial, o precisión, se incluye en la medición. Con el ajuste para la precisión, la ley de Fitts abarca más verdaderamente el equilibrio entre velocidad y precisión. Las ecuaciones anteriores aparecen en la norma ISO 9241-9 como el método recomendado para calcular el rendimiento .
Poco después de que se propusiera el modelo original, se propuso una variación de dos factores bajo la intuición de que la distancia y el ancho del objetivo tienen efectos separados en el tiempo de movimiento. El modelo de Welford, propuesto en 1968, separó la influencia de la distancia y el ancho del objetivo en términos separados y proporcionó un poder predictivo mejorado: [19]
Este modelo tiene un parámetro adicional, por lo que su precisión predictiva no se puede comparar directamente con las formas de un factor de la ley de Fitts. Sin embargo, una variación del modelo de Welford inspirada en la formulación de Shannon,
El parámetro adicional k permite la introducción de ángulos en el modelo. Ahora se puede tener en cuenta la posición del usuario. La influencia del ángulo se puede ponderar utilizando el exponente. Esta adición fue introducida por Kopper et al. en 2010. [21]
La fórmula se reduce a la forma de Shannon cuando k = 1. Por lo tanto, este modelo se puede comparar directamente con la forma de Shannon de la ley de Fitts utilizando la prueba F de modelos anidados. [22] Esta comparación revela que no solo la forma de Shannon del modelo de Welford predice mejor los tiempos de movimiento, sino que también es más robusta cuando se varía la ganancia de control-visualización (la relación entre, por ejemplo, el movimiento de la mano y el movimiento del cursor). En consecuencia, aunque el modelo de Shannon es ligeramente más complejo y menos intuitivo, es empíricamente el mejor modelo para usar en tareas de apuntado virtual.
En su forma original, la ley de Fitts está pensada para aplicarse únicamente a tareas unidimensionales. Sin embargo, los experimentos originales requerían que los sujetos movieran un lápiz (en tres dimensiones) entre dos placas de metal sobre una mesa, lo que se denominaba tarea de golpeteo recíproco. [1] El ancho del objetivo perpendicular a la dirección del movimiento era muy amplio para evitar que tuviera una influencia significativa en el rendimiento. Una aplicación importante de la ley de Fitts son las tareas de apuntado virtual en 2D en pantallas de ordenador, en las que los objetivos tienen tamaños limitados en ambas dimensiones.
La ley de Fitts se ha extendido a tareas bidimensionales de dos maneras diferentes. Para navegar, por ejemplo, en menús desplegables jerárquicos, el usuario debe generar una trayectoria con el dispositivo señalador que esté limitada por la geometría del menú; para esta aplicación se derivó la ley de dirección de Accot-Zhai .
Para simplemente señalar objetivos en un espacio bidimensional, el modelo generalmente se mantiene tal como está pero requiere ajustes para capturar la geometría del objetivo y cuantificar los errores de orientación de una manera lógicamente consistente. [23] [24] Se han utilizado múltiples métodos para determinar el tamaño del objetivo: [25]
Si bien el modelo W a veces se considera la medición de última generación, la representación verdaderamente correcta para objetivos no circulares es sustancialmente más compleja, ya que requiere calcular la convolución específica del ángulo entre la trayectoria del dispositivo apuntador y el objetivo [26].
Dado que los parámetros a y b deben capturar los tiempos de movimiento en un rango potencialmente amplio de geometrías de tareas, pueden servir como una métrica de desempeño para una interfaz dada. Para ello, es necesario separar la variación entre usuarios de la variación entre interfaces. El parámetro a es típicamente positivo y cercano a cero, y a veces se ignora al caracterizar el desempeño promedio, como en el experimento original de Fitts. [18] Existen múltiples métodos para identificar parámetros a partir de datos experimentales, y la elección del método es objeto de un acalorado debate, ya que la variación del método puede resultar en diferencias de parámetros que abruman las diferencias de desempeño subyacentes. [27] [28]
Una cuestión adicional a la hora de caracterizar el rendimiento es la incorporación de la tasa de éxito: un usuario agresivo puede lograr tiempos de movimiento más cortos a costa de realizar pruebas experimentales en las que no alcance el objetivo. Si estas últimas no se incorporan al modelo, los tiempos de movimiento promedio pueden reducirse artificialmente.
La ley de Fitts se ocupa únicamente de objetivos definidos en el espacio. Sin embargo, un objetivo puede definirse puramente en el eje del tiempo, lo que se denomina objetivo temporal. Un objetivo parpadeante o un objetivo que se mueve hacia un área de selección son ejemplos de objetivos temporales. De manera similar al espacio, la distancia al objetivo (es decir, la distancia temporal D t ) y el ancho del objetivo (es decir, el ancho temporal W t ) también se pueden definir para los objetivos temporales. La distancia temporal es la cantidad de tiempo que una persona debe esperar para que aparezca un objetivo. El ancho temporal es una duración corta desde el momento en que aparece el objetivo hasta que desaparece. Por ejemplo, para un objetivo parpadeante, D t puede considerarse como el período de parpadeo y W t como la duración del parpadeo. Al igual que con los objetivos en el espacio, cuanto mayor sea D t o menor sea W t , más difícil será seleccionar el objetivo.
La tarea de seleccionar el objetivo temporal se denomina apuntamiento temporal . El modelo para el apuntamiento temporal se presentó por primera vez en el campo de la interacción hombre-computadora en 2016. [29] El modelo predice la tasa de error, el desempeño humano en el apuntamiento temporal, como una función del índice temporal de dificultad ( ID t ):
De las implicaciones de la ley de Fitts se pueden derivar múltiples pautas de diseño para GUI . En su forma básica, la ley de Fitts dice que los objetivos que un usuario debe alcanzar deben ser lo más grandes posible. Esto se deriva del parámetro W. Más específicamente, el tamaño efectivo del botón debe ser lo más grande posible, lo que significa que su forma debe optimizarse para la dirección del movimiento del usuario hacia el objetivo.
Los diseños también deben agrupar las funciones que se usan comúnmente entre sí. La optimización del parámetro D de esta manera permite tiempos de viaje más cortos.
La colocación de elementos de diseño en los cuatro bordes de la pantalla permite objetivos infinitamente grandes en una dimensión y, por lo tanto, presenta escenarios ideales. Dado que el puntero siempre se detendrá en el borde, el usuario puede mover el mouse con la mayor velocidad posible y aún así alcanzar el objetivo. El área del objetivo es efectivamente infinitamente larga a lo largo del eje de movimiento. Por lo tanto, esta directriz se llama "Regla de los bordes infinitos". El uso de esta regla se puede ver, por ejemplo, en MacOS , que siempre coloca la barra de menú en el borde superior izquierdo de la pantalla en lugar del marco de la ventana del programa actual. [30]
Este efecto se puede acentuar en las cuatro esquinas de la pantalla. En estos puntos, dos bordes chocan y forman un botón teóricamente infinitamente grande. Microsoft Windows (antes de Windows 11 ) coloca su botón de "Inicio" en la esquina inferior izquierda y Microsoft Office 2007 utiliza la esquina superior izquierda para su menú "Office". Estos cuatro puntos a veces se denominan "esquinas mágicas". [31] MacOS coloca el botón de cierre en el lado superior izquierdo de la ventana del programa y la barra de menú rellena la esquina mágica con otro botón.
Una interfaz de usuario que permite menús emergentes en lugar de menús desplegables fijos reduce los tiempos de desplazamiento del parámetro D. El usuario puede continuar la interacción desde la posición actual del ratón y no tiene que moverse a un área preestablecida diferente. Muchos sistemas operativos utilizan esto al mostrar menús contextuales con botón derecho. Como el menú comienza justo en el píxel en el que el usuario hizo clic, este píxel se conoce como el píxel "mágico" o "píxel principal". [25]
James Boritz et al. (1991) [32] compararon los diseños de menús radiales . En un menú radial, todos los elementos tienen la misma distancia del píxel principal. La investigación sugiere que en las implementaciones prácticas también se debe tener en cuenta la dirección en la que el usuario debe mover el mouse. Para los usuarios diestros, seleccionar el elemento del menú ubicado más a la izquierda fue significativamente más difícil que el del menú ubicado más a la derecha. No se encontraron diferencias en las transiciones de funciones superiores a inferiores y viceversa.
{{cite book}}
: Mantenimiento de CS1: falta la ubicación del editor ( enlace ){{cite journal}}
: Mantenimiento CS1: fecha y año ( enlace )