Las pruebas de usabilidad son una técnica utilizada en el diseño de interacción centrada en el usuario para evaluar un producto probándolo en los usuarios. Esto puede verse como una práctica de usabilidad irremplazable , ya que brinda información directa sobre cómo los usuarios reales usan el sistema. [1] Está más preocupado por la intuición del diseño del producto y se prueba con usuarios que no han estado expuestos previamente a él. Estas pruebas son fundamentales para el éxito de un producto final, ya que una aplicación en pleno funcionamiento que crea confusión entre sus usuarios no durará mucho. [2] Esto contrasta con los métodos de inspección de usabilidad donde los expertos utilizan diferentes métodos para evaluar una interfaz de usuario sin involucrar a los usuarios.
Las pruebas de usabilidad se centran en medir la capacidad de un producto fabricado por humanos para cumplir los fines previstos. Ejemplos de productos que comúnmente se benefician de las pruebas de usabilidad son alimentos , productos de consumo, sitios web o aplicaciones web, interfaces informáticas , documentos y dispositivos. Las pruebas de usabilidad miden la usabilidad o facilidad de uso de un objeto o conjunto de objetos específicos, mientras que los estudios generales de interacción persona-computadora intentan formular principios universales.
La mera recopilación de opiniones sobre un objeto o un documento es una investigación de mercado o una investigación cualitativa más que una prueba de usabilidad. Las pruebas de usabilidad generalmente implican una observación sistemática en condiciones controladas para determinar qué tan bien las personas pueden usar el producto. [3] Sin embargo, a menudo tanto la investigación cualitativa como las pruebas de usabilidad se utilizan en combinación, para comprender mejor las motivaciones/percepciones de los usuarios, además de sus acciones.
En lugar de mostrar a los usuarios un borrador y preguntar: "¿Entiendes esto?", las pruebas de usabilidad implican observar a las personas que intentan usar algo para el propósito previsto. Por ejemplo, cuando se prueban instrucciones para ensamblar un juguete, a los sujetos de prueba se les deben dar las instrucciones y una caja de piezas y, en lugar de pedirles que comenten sobre las piezas y los materiales, se les debe pedir que armen el juguete. La redacción de las instrucciones, la calidad de las ilustraciones y el diseño del juguete afectan el proceso de ensamblaje.
Configurar una prueba de usabilidad implica crear cuidadosamente un escenario , o una situación realista, en la que la persona realiza una lista de tareas utilizando el producto que se está probando mientras los observadores observan y toman notas ( verificación dinámica ). También se utilizan varios otros instrumentos de prueba , como instrucciones escritas, prototipos en papel y cuestionarios previos y posteriores a la prueba, para recopilar comentarios sobre el producto que se está probando ( verificación estática ). Por ejemplo, para probar la función de archivo adjunto de un programa de correo electrónico , un escenario describiría una situación en la que una persona necesita enviar un archivo adjunto de correo electrónico y pedirle que realice esta tarea. El objetivo es observar cómo funcionan las personas de manera realista, para que los desarrolladores puedan identificar las áreas problemáticas y solucionarlas. Las técnicas utilizadas popularmente para recopilar datos durante una prueba de usabilidad incluyen el protocolo de pensamiento en voz alta , el aprendizaje conjunto y el seguimiento ocular .
Las pruebas de pasillo , también conocidas como usabilidad de guerrilla , son un método rápido y económico de prueba de usabilidad en el que se pide a las personas, como las que pasan por el pasillo, que intenten utilizar el producto o servicio. Esto puede ayudar a los diseñadores a identificar "paredes de ladrillos", problemas tan graves que los usuarios simplemente no pueden avanzar, en las primeras etapas de un nuevo diseño. Se puede utilizar a cualquier persona excepto a los diseñadores e ingenieros del proyecto (tienden a actuar como "revisores expertos" porque están demasiado cerca del proyecto).
Este tipo de prueba es un ejemplo de muestreo por conveniencia y, por lo tanto, los resultados pueden estar sesgados.
En un escenario en el que los evaluadores de usabilidad, desarrolladores y usuarios potenciales se encuentran en diferentes países y zonas horarias, realizar una evaluación de usabilidad de laboratorio tradicional crea desafíos tanto desde la perspectiva de costos como de logística. Estas preocupaciones llevaron a investigar sobre la evaluación remota de la usabilidad, con el usuario y los evaluadores separados en el espacio y el tiempo. Las pruebas remotas, que facilitan que las evaluaciones se realicen en el contexto de otras tareas y tecnología del usuario, pueden ser sincrónicas o asincrónicas. El primero implica una comunicación individual en tiempo real entre el evaluador y el usuario, mientras que el segundo implica que el evaluador y el usuario trabajen por separado. [4] Hay numerosas herramientas disponibles para abordar las necesidades de ambos enfoques.
Las metodologías de prueba de usabilidad sincrónica implican videoconferencias o emplean herramientas remotas para compartir aplicaciones como WebEx. WebEx y GoToMeeting son las tecnologías más utilizadas para realizar una prueba de usabilidad remota sincrónica. [5] Sin embargo, las pruebas remotas sincrónicas pueden carecer de la inmediatez y la sensación de "presencia" deseada para respaldar un proceso de prueba colaborativo. Además, gestionar la dinámica interpersonal a través de barreras culturales y lingüísticas puede requerir enfoques sensibles a las culturas involucradas. Otras desventajas incluyen tener un control reducido sobre el entorno de prueba y las distracciones e interrupciones experimentadas por los participantes en su entorno nativo. [6] Uno de los métodos más nuevos desarrollados para realizar una prueba de usabilidad remota síncrona es mediante el uso de mundos virtuales. [7]
Las metodologías asincrónicas incluyen la recopilación automática de secuencias de clics de los usuarios, registros de usuarios de incidentes críticos que ocurren al interactuar con la aplicación y comentarios subjetivos de los usuarios sobre la interfaz. [6] De manera similar a un estudio en el laboratorio, una prueba de usabilidad remota asincrónica se basa en tareas y la plataforma permite a los investigadores capturar clics y tiempos de tareas. Por lo tanto, para muchas grandes empresas, esto permite a los investigadores comprender mejor las intenciones de los visitantes cuando visitan un sitio web o un sitio móvil. Además, este estilo de prueba de usuarios también brinda la oportunidad de segmentar los comentarios por tipo demográfico, de actitud y de comportamiento. Las pruebas se llevan a cabo en el propio entorno del usuario (en lugar de en laboratorios), lo que ayuda a simular aún más las pruebas en escenarios de la vida real. Este enfoque también proporciona un vehículo para solicitar fácilmente comentarios de los usuarios en áreas remotas, rápidamente y con menores gastos organizativos. En los últimos años, la realización de pruebas de usabilidad de forma asincrónica también se ha vuelto frecuente y permite a los evaluadores brindar comentarios en su tiempo libre y desde la comodidad de su hogar.
La revisión de expertos es otro método general de pruebas de usabilidad. Como sugiere el nombre, este método se basa en contratar expertos con experiencia en el campo (posiblemente de empresas que se especializan en pruebas de usabilidad) para evaluar la usabilidad de un producto.
Una evaluación heurística o auditoría de usabilidad es una evaluación de una interfaz realizada por uno o más expertos en factores humanos. Los evaluadores miden la usabilidad, eficiencia y eficacia de la interfaz basándose en principios de usabilidad, como las 10 heurísticas de usabilidad definidas originalmente por Jakob Nielsen en 1994. [8]
Las heurísticas de usabilidad de Nielsen, que han seguido evolucionando en respuesta a la investigación de los usuarios y los nuevos dispositivos, incluyen:
Al igual que las revisiones de expertos, las revisiones de expertos automatizadas proporcionan pruebas de usabilidad, pero mediante el uso de programas con reglas para un buen diseño y heurística. Aunque es posible que una revisión automatizada no proporcione tantos detalles y conocimientos como las revisiones de las personas, se pueden finalizar de manera más rápida y consistente. La idea de crear usuarios sustitutos para las pruebas de usabilidad es una dirección ambiciosa para la comunidad de inteligencia artificial.
En el desarrollo y marketing web, las pruebas A/B o pruebas divididas son un enfoque experimental para el diseño web (especialmente el diseño de la experiencia del usuario), cuyo objetivo es identificar cambios en las páginas web que aumentan o maximizan un resultado de interés (por ejemplo, tasa de clics). para un anuncio publicitario). Como su nombre lo indica, se comparan dos versiones (A y B), que son idénticas excepto por una variación que podría afectar el comportamiento del usuario. La versión A podría ser la que se utiliza actualmente, mientras que la versión B se modifica en algún aspecto. Por ejemplo, en un sitio web de comercio electrónico, el embudo de compras suele ser un buen candidato para las pruebas A/B, ya que incluso las mejoras marginales en las tasas de abandono pueden representar una ganancia significativa en las ventas. Se pueden ver mejoras significativas probando elementos como copiar texto, diseños, imágenes y colores.
Las pruebas multivariadas o pruebas de depósitos son similares a las pruebas A/B, pero prueban más de dos versiones al mismo tiempo.
A principios de la década de 1990, Jakob Nielsen , en ese momento investigador de Sun Microsystems , popularizó el concepto de utilizar numerosas pruebas de usabilidad pequeñas (generalmente con solo cinco participantes cada una) en varias etapas del proceso de desarrollo. Su argumento es que, una vez que se descubre que dos o tres personas están totalmente confundidas con la página de inicio, poco se gana viendo a más personas sufrir por el mismo diseño defectuoso. "Las pruebas de usabilidad elaboradas son un desperdicio de recursos. Los mejores resultados se obtienen al probar no más de cinco usuarios y ejecutar tantas pruebas pequeñas como sea posible". [9]
La afirmación de "Cinco usuarios es suficiente" fue descrita más tarde mediante un modelo matemático [10] que indica la proporción de problemas descubiertos U
donde p es la probabilidad de que un sujeto identifique un problema específico yn el número de sujetos (o sesiones de prueba). Este modelo se muestra como un gráfico asintótico del número de problemas reales existentes (ver figura a continuación).
En investigaciones posteriores, la afirmación de Nielsen ha sido cuestionada utilizando evidencia empírica [11] y modelos matemáticos más avanzados . [12] Dos desafíos clave a esta afirmación son:
Vale la pena señalar que Nielsen no recomienda detenerse después de una sola prueba con cinco usuarios; Su punto es que probar con cinco usuarios, solucionar los problemas que descubren y luego probar el sitio revisado con cinco usuarios diferentes es un mejor uso de recursos limitados que ejecutar una única prueba de usabilidad con 10 usuarios. En la práctica, las pruebas se realizan una o dos veces por semana durante todo el ciclo de desarrollo, utilizando de tres a cinco sujetos de prueba por ronda, y los resultados se entregan a los diseñadores en un plazo de 24 horas. El número de usuarios realmente evaluados durante el proyecto puede alcanzar fácilmente entre 50 y 100 personas. Las investigaciones muestran que las pruebas de usuario realizadas por organizaciones suelen implicar el reclutamiento de entre 5 y 10 participantes. [14]
En la etapa inicial, cuando es más probable que los usuarios encuentren inmediatamente problemas que los detengan en seco, casi cualquier persona con inteligencia normal puede usarse como sujeto de prueba. En la segunda etapa, los evaluadores reclutarán sujetos de prueba de un amplio espectro de habilidades. Por ejemplo, en un estudio, los usuarios experimentados no mostraron problemas al utilizar ningún diseño, desde el primero hasta el último, mientras que los usuarios ingenuos y los usuarios avanzados autoidentificados fallaron repetidamente. [15] Más adelante, a medida que el diseño se suaviza, los usuarios deben ser reclutados entre la población objetivo.
Cuando el método se aplica a un número suficiente de personas a lo largo de un proyecto, se solucionan las objeciones planteadas anteriormente: el tamaño de la muestra deja de ser pequeño y se encuentran problemas de usabilidad que surgen sólo con usuarios ocasionales. El valor del método radica en el hecho de que los problemas de diseño específicos, una vez encontrados, nunca se vuelven a ver porque se eliminan inmediatamente, mientras que las piezas que parecen exitosas se prueban una y otra vez. Si bien es cierto que los problemas iniciales del diseño pueden ser probados por sólo cinco usuarios, cuando el método se aplica correctamente, las partes del diseño que funcionaron en esa prueba inicial pasarán a ser probadas por entre 50 y 100 personas.
Un manual de Apple Computer de 1982 para desarrolladores aconsejaba sobre pruebas de usabilidad: [16]
Apple aconsejó a los desarrolladores: "Deberían comenzar a realizar pruebas lo antes posible, utilizando amigos, familiares y nuevos empleados reclutados": [16]
Nuestro método de prueba es el siguiente. Instalamos una sala con cinco o seis sistemas informáticos. Programamos dos o tres grupos de cinco a seis usuarios a la vez para probar los sistemas (a menudo sin que sepan que lo que estamos probando es el software y no el sistema). Tenemos a dos de los diseñadores en la sala. Si son menos, se perderán mucho de lo que está pasando. Un poco más y los usuarios sienten como si siempre hubiera alguien respirándoles en la nuca.
Los diseñadores deben observar a la gente usar el programa en persona, porque [16]
El noventa y cinco por ciento de los obstáculos se encuentran observando el lenguaje corporal de los usuarios. Esté atento a los ojos entrecerrados, los hombros encorvados, los movimientos de cabeza y los suspiros profundos y sinceros. Cuando un usuario tiene un problema, asumirá que es "porque no es demasiado inteligente": no lo informará; lo ocultará... No hagas suposiciones sobre por qué un usuario se confundió. Preguntarle. A menudo se sorprenderá al saber qué pensó el usuario que estaba haciendo el programa en el momento en que se perdió.
Las pruebas de usabilidad han sido un tema formal de instrucción académica en diferentes disciplinas. [17] Las pruebas de usabilidad son importantes para los estudios de composición y la instrucción de escritura en línea (OWI). [18] El académico Collin Bjork sostiene que las pruebas de usabilidad son "necesarias pero insuficientes para desarrollar OWI eficaz, a menos que también se combinen con las teorías de la retórica digital ". [19]
Los productos de la encuesta incluyen encuestas , formularios e instrumentos digitales y en papel que el encuestado puede completar o utilizar solo o con un recolector de datos. Las pruebas de usabilidad se realizan con mayor frecuencia en encuestas web y se centran en cómo las personas interactúan con la encuesta, como navegar por la encuesta, ingresar respuestas a la encuesta y encontrar información de ayuda. Las pruebas de usabilidad complementan los métodos tradicionales de prueba previa de encuestas , como las pruebas previas cognitivas (cómo entienden las personas los productos), las pruebas piloto (cómo funcionarán los procedimientos de la encuesta) y la revisión experta por parte de un experto en la materia en metodología de encuestas . [20]
En los productos de encuestas traducidos, las pruebas de usabilidad han demostrado que se debe considerar la "aptitud cultural" en los niveles de oración y palabra y en los diseños para la entrada y navegación de datos, [21] y que la presentación de traducción y señales visuales de funcionalidades comunes (pestañas, hipervínculos , menús desplegables y URL ) ayudan a mejorar la experiencia del usuario. [22]
{{cite journal}}
: Citar diario requiere |journal=
( ayuda )