Transformación de datos

En estadística, la transformación de datos se efectúa para asegurarse que estos tienen una distribución normal (lo que puede ser un remedio para analizar datos que tienen otros tipos de distribución, falta de normalidad, linealidad, y homocedasticidad).

Para los novatos en estadística el análisis de muestras que no tienen una distribución normal pueden ser un problema, porque las pruebas paramétricas estadísticas comunes asumen normalidad en los datos, es decir, que la distribución de los mismos se ajusta a una campana de Gauss.

Si el tamaño de la muestra es demasiado pequeño o los datos están sesgados hacia una distribución no normal se puede intentar hacer una de las siguientes transformaciones: logarítmica, raíz cuadrada o inversa.

Se debe tener en cuenta que el tipo de trasformación que se use debe ser acorde con el tipo de datos que se desea transformar, para ello debe considerarse si la variable tiene distribución continua y que tipo datos son (por ejemplo, resultados de conteos, porcentajes, etc.).

Para personas con mayor experiencia en estadística que tengan datos cuya distribución no se ajusta a la normalidad se sugiere definir la distribución real de los datos, que puede ser exponencial, poisson, etc., y analizarlos usando procedimientos específicos (algunos de ellos encontrados en el programa R que asumen de facto ese tipo de distribución.