Este aumento de calificación es el tamaño efecto declarado del programa.
Un estudio podría tener un resultado con alta significación estadística, pero, al mismo tiempo, ser trivial si posee un escaso tamaño de efecto.
[4] El tamaño del efecto es particularmente prominente en la investigación social y médica.
Hay convenciones para anotar los tamaños de efecto real y observado que siguen normas estadísticas estandarizadas –una forma habitual es utilizar letras griegas como ρ para denotar un parámetro poblacional y letras latinas como r para denotar el estadístico correspondiente.
Como alternativa, se puede colocar un acento circunflejo (ˆ) sobre el parámetro poblacional para así diferenciar el estadístico, por ejemplo,
Como en cualquier contexto estadístico, los tamaños de efecto se estiman con un error muestral, y pueden estar sesgados a menos que el estimador del tamaño de efecto que se use sea apropiado para la forma en que fueron muestreados los datos y se hicieron las mediciones.
Las pruebas estadísticas, en cambio, asignan un nivel de significación a los tamaños así calculados, lo que nos dice si acaso esos tamaños pudieran deberse a la pura casualidad (azar).
En un caso así, informar solo el p-valor significativo puede ser engañoso si la correlación 0.01 es demasiado pequeña para tener algún interés en una aplicación particular.
En los dos ejemplos, Sawilowsky concluyó “Basándose en los hallazgos actuales de la investigación en la literatura aplicada, parece apropiado revisar las reglas básicas para el tamaño de efecto”, conservando las advertencias que dio Cohen, y ampliando las descripciones para incluir “muy pequeño”, “muy grande” y “enorme”.
Así, si un estudio en un determinado campo donde la mayoría de las investigaciones son pequeñas y conducen a un efecto pequeño (por los criterios de Cohen), con los nuevos criterios se les podría considerar “grandes”.