En medicina y psicología, la importancia clínica es la importancia práctica del efecto de un tratamiento: si tiene un efecto real, genuino, palpable y notable en la vida diaria. [1]
La significación estadística se utiliza en las pruebas de hipótesis , mediante las cuales se prueba la hipótesis nula (que no hay relación entre las variables ). [2] Se selecciona un nivel de significación (más comúnmente α = 0,05 o 0,01), que significa la probabilidad de rechazar incorrectamente una hipótesis nula verdadera. [2] Si hay una diferencia significativa entre dos grupos en α = 0,05, significa que solo hay un 5% de probabilidad de obtener los resultados observados bajo el supuesto de que la diferencia se debe completamente al azar (es decir, la hipótesis nula es verdadera); no da ninguna indicación de la magnitud o importancia clínica de la diferencia. [3] Cuando se obtienen resultados estadísticamente significativos, favorecen el rechazo de la hipótesis nula, pero no prueban que la hipótesis nula sea falsa. Del mismo modo, los resultados no significativos no prueban que la hipótesis nula sea verdadera; tampoco dan evidencia de la verdad o falsedad de la hipótesis que el investigador ha generado. [2] La significancia estadística se relaciona únicamente con la compatibilidad entre los datos observados y lo que se esperaría bajo el supuesto de que la hipótesis nula es verdadera.
En un sentido amplio, la "significancia clínica práctica" responde a la pregunta de qué tan efectiva es la intervención o el tratamiento, o cuánto cambio provoca el tratamiento. En términos de probar tratamientos clínicos, la significancia práctica produce óptimamente información cuantificada sobre la importancia de un hallazgo, utilizando métricas como el tamaño del efecto , el número necesario a tratar (NNT) y la fracción preventiva . [4] La significancia práctica también puede transmitir evaluaciones semicuantitativas, comparativas o de viabilidad de la utilidad.
El tamaño del efecto es un tipo de significación práctica. [4] [5] Cuantifica el grado en que una muestra se desvía de las expectativas. [6] El tamaño del efecto puede proporcionar información importante sobre los resultados de un estudio y se recomienda su inclusión además de la significación estadística. Los tamaños del efecto tienen sus propias fuentes de sesgo, están sujetos a cambios en función de la variabilidad poblacional de la variable dependiente y tienden a centrarse en los efectos grupales, no en los cambios individuales. [5] [7] [8]
Aunque la significación clínica y la significación práctica se utilizan a menudo como sinónimos, un uso más técnico y restrictivo denota esto como erróneo. [5] Este uso técnico dentro de la psicología y la psicoterapia no sólo es resultado de una precisión y particularidad del lenguaje cuidadosamente trazadas, sino que permite un cambio de perspectiva desde los efectos grupales a los detalles de los cambios dentro de un individuo. [ cita requerida ]
Por el contrario, cuando se utiliza como término técnico en psicología y psicoterapia, la significación clínica proporciona información sobre si un tratamiento fue lo suficientemente eficaz como para cambiar la etiqueta diagnóstica de un paciente. En términos de estudios de tratamiento clínico, la significación clínica responde a la pregunta "¿Es un tratamiento lo suficientemente eficaz como para hacer que el paciente sea normal [con respecto a los criterios de diagnóstico en cuestión]?" [ cita requerida ]
Por ejemplo, un tratamiento puede cambiar significativamente los síntomas depresivos (significación estadística), el cambio puede ser una gran disminución de los síntomas depresivos (significación práctica: tamaño del efecto) y el 40% de los pacientes ya no cumplen los criterios de diagnóstico para la depresión (significación clínica). Es muy posible tener un tratamiento que produzca una diferencia significativa y tamaños de efecto medianos o grandes, pero que no haga que un paciente pase de disfuncional a funcional. [ cita requerida ]
En el ámbito de la psicología y la psicoterapia, Jacobson, Follette y Revenstorf [9] propusieron por primera vez la significación clínica como una forma de responder a la pregunta: ¿es una terapia o un tratamiento lo suficientemente eficaz como para que un paciente no cumpla los criterios para un diagnóstico? Jacobson y Truax definieron posteriormente la significación clínica como "el grado en que la terapia lleva a alguien fuera del rango de la población disfuncional o dentro del rango de la población funcional". [10] Propusieron dos componentes de este índice de cambio: el estado de un paciente o cliente después de que se ha completado la terapia y "cuánto cambio se ha producido durante el curso de la terapia". [10]
La significación clínica también es un factor a tener en cuenta al interpretar los resultados de la evaluación psicológica de un individuo. Con frecuencia, habrá una diferencia de puntuaciones o subpuntuaciones que sea estadísticamente significativa , y es poco probable que haya ocurrido puramente por casualidad. Sin embargo, no todas esas diferencias estadísticamente significativas son clínicamente significativas, en el sentido de que no explican la información existente sobre el cliente ni proporcionan una dirección útil para la intervención. Las diferencias que son pequeñas en magnitud generalmente carecen de relevancia práctica y es poco probable que sean clínicamente significativas. Las diferencias que son comunes en la población también es poco probable que sean clínicamente significativas, porque pueden simplemente reflejar un nivel de variación humana normal. Además, los médicos buscan información en los datos de la evaluación y en la historia del cliente que corrobore la relevancia de la diferencia estadística, para establecer la conexión entre el desempeño en la prueba específica y el funcionamiento más general del individuo. [11] [12]
Así como existen muchas formas de calcular la significación estadística y la significación práctica, existen diversas formas de calcular la significación clínica. Cinco métodos comunes son el método de Jacobson-Truax, el método de Gulliksen-Lord-Novick, el método de Edwards-Nunnally, el método de Hageman-Arrindell y el modelado lineal jerárquico. [5]
El método Jacobson-Truax es un método común para calcular la significación clínica. Implica el cálculo de un índice de cambio de confiabilidad (RCI). [10] El RCI es igual a la diferencia entre las puntuaciones de un participante antes y después de la prueba, dividida por el error estándar de la diferencia. Se establecen puntuaciones de corte para colocar a los participantes en una de cuatro categorías: recuperado, mejorado, sin cambios o deteriorado, según la direccionalidad del RCI y si se alcanzó la puntuación de corte. [ cita requerida ]
El método de Gulliksen-Lord-Novick [13] es similar al de Jacobson-Truax, excepto que tiene en cuenta la regresión a la media . Esto se hace restando las puntuaciones de la prueba previa y posterior a la media de la población y dividiendo por la desviación estándar de la población. [5]
El método Edwards-Nunnally [14] para calcular la significación clínica es una alternativa más estricta al método Jacobson-Truax. [5] Los puntajes de confiabilidad se utilizan para acercar los puntajes previos a la prueba a la media, y luego se desarrolla un intervalo de confianza para este puntaje previo ajustado. Los intervalos de confianza se utilizan al calcular el cambio entre la prueba previa y la posterior, por lo que se necesita un cambio real mayor en los puntajes para demostrar la significación clínica, en comparación con el método Jacobson-Truax. [ cita requerida ]
El cálculo de la significación clínica de Hageman-Arrindell [15] implica índices de cambio grupal y de cambio individual. La fiabilidad del cambio indica si un paciente ha mejorado, se ha mantenido igual o se ha deteriorado. Un segundo índice, la significación clínica del cambio, indica cuatro categorías similares a las utilizadas por Jacobson-Truax: empeorado, no ha cambiado de forma fiable, ha mejorado pero no se ha recuperado y se ha recuperado. [ cita requerida ]
El modelo HLM implica el análisis de la curva de crecimiento en lugar de comparaciones previas y posteriores a la prueba, por lo que se necesitan tres puntos de datos de cada paciente, en lugar de solo dos puntos de datos (previas y posteriores a la prueba). [5] Se utiliza un programa informático, como el modelo lineal y no lineal jerárquico [16], para calcular las estimaciones de cambio para cada participante. El modelo HLM también permite el análisis de modelos de curva de crecimiento de díadas y grupos. [ cita requerida ]