En estadística , la puntuación estándar es el número de desviaciones estándar por las cuales el valor de una puntuación bruta (es decir, un valor observado o un punto de datos) está por encima o por debajo del valor medio de lo que se está observando o midiendo. Las puntuaciones brutas por encima de la media tienen puntuaciones estándar positivas, mientras que las que están por debajo de la media tienen puntuaciones estándar negativas.
Se calcula restando la media poblacional de una puntuación bruta individual y luego dividiendo la diferencia por la desviación estándar de la población . Este proceso de convertir una puntuación bruta en una puntuación estándar se denomina estandarización o normalización (sin embargo, "normalización" puede referirse a muchos tipos de proporciones; consulte Normalización para obtener más información).
Las puntuaciones estándar se denominan más comúnmente puntuaciones z ; Los dos términos pueden usarse indistintamente, como lo son en este artículo. Otros términos equivalentes en uso incluyen valor z , estadística z , puntuación normal , variable estandarizada y atracción en física de alta energía . [1] [2]
Calcular una puntuación z requiere conocer la media y la desviación estándar de la población completa a la que pertenece un punto de datos; Si solo se tiene una muestra de observaciones de la población, entonces el cálculo análogo utilizando la media muestral y la desviación estándar muestral produce el estadístico t .
Si se conocen la media poblacional y la desviación estándar de la población, una puntuación bruta x se convierte en una puntuación estándar mediante [3]
dónde:
El valor absoluto de z representa la distancia entre esa puntuación bruta x y la media poblacional en unidades de desviación estándar. z es negativo cuando la puntuación bruta está por debajo de la media y positivo cuando está por encima.
Calcular z usando esta fórmula requiere el uso de la media poblacional y la desviación estándar de la población, no la media muestral o la desviación muestral. Sin embargo, conocer la verdadera media y desviación estándar de una población suele ser una expectativa poco realista, excepto en casos como las pruebas estandarizadas , donde se mide a toda la población.
Cuando se desconocen la media poblacional y la desviación estándar de la población, la puntuación estándar se puede estimar utilizando la media muestral y la desviación estándar muestral como estimaciones de los valores poblacionales. [4] [5] [6] [7]
En estos casos, la puntuación z viene dada por
dónde:
Aunque siempre se debe indicar, a menudo no se hace la distinción entre el uso de estadísticas de población y de muestra. En cualquier caso, el numerador y el denominador de las ecuaciones tienen las mismas unidades de medida, de modo que las unidades se cancelan mediante la división y z queda como una cantidad adimensional .
La puntuación z se utiliza a menudo en la prueba z en pruebas estandarizadas, el análogo de la prueba t de Student para una población cuyos parámetros se conocen, en lugar de estimarse. Como es muy poco común conocer a toda la población, la prueba t se utiliza mucho más ampliamente.
La puntuación estándar se puede utilizar en el cálculo de intervalos de predicción . Un intervalo de predicción [ L , U ], que consta de un punto final inferior designado L y un punto final superior designado U , es un intervalo tal que una observación futura X se ubicará en el intervalo con alta probabilidad , es decir
Para la puntuación estándar Z de X se obtiene: [8]
Determinando el cuantil z tal que
sigue:
En aplicaciones de control de procesos, el valor Z proporciona una evaluación del grado en que un proceso está funcionando fuera del objetivo.
Cuando las puntuaciones se miden en diferentes escalas, se pueden convertir en puntuaciones z para facilitar la comparación. Dietz et al. [9] dan el siguiente ejemplo, comparando las puntuaciones de los estudiantes en los (antiguos) exámenes SAT y ACT de la escuela secundaria. La tabla muestra la media y la desviación estándar de las puntuaciones totales en el SAT y ACT. Supongamos que el estudiante A obtuvo 1800 en el SAT y el estudiante B obtuvo 24 en el ACT. ¿Qué estudiante obtuvo mejores resultados en comparación con otros examinados?
La puntuación z para el estudiante A es
La puntuación z para el estudiante B es
Debido a que el estudiante A tiene una puntuación z más alta que el estudiante B, el estudiante A tuvo un mejor desempeño en comparación con otros examinados que el estudiante B.
Siguiendo con el ejemplo de las puntuaciones de ACT y SAT, si se puede suponer además que tanto las puntuaciones de ACT como las de SAT se distribuyen normalmente (lo cual es aproximadamente correcto), entonces las puntuaciones z se pueden utilizar para calcular el porcentaje de examinados que obtuvieron puntuaciones más bajas. puntuaciones que los estudiantes A y B.
"Para algunas técnicas multivariadas, como el escalamiento multidimensional y el análisis de conglomerados, el concepto de distancia entre las unidades de los datos suele ser de considerable interés e importancia... Cuando las variables en un conjunto de datos multivariados están en diferentes escalas, tiene más sentido calcular las distancias después de alguna forma de estandarización." [10]
En el análisis de componentes principales, "las variables medidas en diferentes escalas o en una escala común con rangos muy diferentes a menudo están estandarizadas". [11]
A veces se utiliza la estandarización de variables antes del análisis de regresión múltiple como ayuda para la interpretación. [12] (página 95) afirman lo siguiente.
"La pendiente de regresión estandarizada es la pendiente en la ecuación de regresión si X e Y están estandarizados... La estandarización de X e Y se realiza restando las medias respectivas de cada conjunto de observaciones y dividiendo por las respectivas desviaciones estándar... En la regresión múltiple, donde varios Se utilizan variables X, los coeficientes de regresión estandarizados cuantifican la contribución relativa de cada variable X."
Sin embargo, Kutner et al. [13] (p. 278) hacen la siguiente advertencia: "... uno debe tener cuidado al interpretar cualquier coeficiente de regresión, ya sea estandarizado o no. La razón es que cuando las variables predictivas están correlacionadas entre sí,... los coeficientes de regresión se ven afectados por la otras variables predictoras en el modelo... Las magnitudes de los coeficientes de regresión estandarizados se ven afectadas no solo por la presencia de correlaciones entre las variables predictivas sino también por los espaciamientos de las observaciones en cada una de estas variables. Por lo tanto, a veces estos espaciamientos pueden ser bastante arbitrarios. , normalmente no es prudente interpretar las magnitudes de los coeficientes de regresión estandarizados como si reflejaran la importancia comparativa de las variables predictoras".
En estadística matemática , una variable aleatoria X se estandariza restándole su valor esperado y dividiendo la diferencia por su desviación estándar.
Si la variable aleatoria considerada es la media muestral de una muestra aleatoria de X :
entonces la versión estandarizada es
En la evaluación educativa, la puntuación T es una puntuación estándar desplazada en Z y escalada para tener una media de 50 y una desviación estándar de 10. [14] [15] [16] También se conoce como hensachi en japonés, donde el concepto es mucho más conocido y utilizado en el contexto de las admisiones a la escuela secundaria y a la universidad.
En las mediciones de densidad ósea, el puntaje T es el puntaje estándar de la medición en comparación con la población de adultos sanos de 30 años, y tiene la media habitual de 0 y la desviación estándar de 1. [17]