Puntuación estándar

En estadística , la puntuación estándar es el número de desviaciones estándar por las cuales el valor de una puntuación bruta (es decir, un valor observado o un punto de datos) está por encima o por debajo del valor medio de lo que se está observando o midiendo. Las puntuaciones brutas por encima de la media tienen puntuaciones estándar positivas, mientras que las que están por debajo de la media tienen puntuaciones estándar negativas.

Se calcula restando la media poblacional de una puntuación bruta individual y luego dividiendo la diferencia por la desviación estándar de la población . Este proceso de convertir una puntuación bruta en una puntuación estándar se denomina estandarización o normalización (sin embargo, "normalización" puede referirse a muchos tipos de proporciones; consulte Normalización para obtener más información).

Las puntuaciones estándar se denominan más comúnmente puntuaciones z ; Los dos términos pueden usarse indistintamente, como lo son en este artículo. Otros términos equivalentes en uso incluyen valor z , estadística z , puntuación normal , variable estandarizada y atracción en física de alta energía . ^[1]^[2]

Calcular una puntuación z requiere conocer la media y la desviación estándar de la población completa a la que pertenece un punto de datos; Si solo se tiene una muestra de observaciones de la población, entonces el cálculo análogo utilizando la media muestral y la desviación estándar muestral produce el estadístico t .

Cálculo

Si se conocen la media poblacional y la desviación estándar de la población, una puntuación bruta x se convierte en una puntuación estándar mediante ^[3]

z={x-\mu \over \sigma }

dónde:

μ es la media de la población,

σ es la desviación estándar de la población.

El valor absoluto de z representa la distancia entre esa puntuación bruta x y la media poblacional en unidades de desviación estándar. z es negativo cuando la puntuación bruta está por debajo de la media y positivo cuando está por encima.

Calcular z usando esta fórmula requiere el uso de la media poblacional y la desviación estándar de la población, no la media muestral o la desviación muestral. Sin embargo, conocer la verdadera media y desviación estándar de una población suele ser una expectativa poco realista, excepto en casos como las pruebas estandarizadas , donde se mide a toda la población.

Cuando se desconocen la media poblacional y la desviación estándar de la población, la puntuación estándar se puede estimar utilizando la media muestral y la desviación estándar muestral como estimaciones de los valores poblacionales. ^[4]^[5]^[6]^[7]

En estos casos, la puntuación z viene dada por

z={x-{\bar {x}} \sobre S}

dónde:

{\bar {x}}

es la media de la muestra,

S es la desviación estándar de la muestra.

Aunque siempre se debe indicar, a menudo no se hace la distinción entre el uso de estadísticas de población y de muestra. En cualquier caso, el numerador y el denominador de las ecuaciones tienen las mismas unidades de medida, de modo que las unidades se cancelan mediante la división y z queda como una cantidad adimensional .

Aplicaciones

prueba Z

La puntuación z se utiliza a menudo en la prueba z en pruebas estandarizadas, el análogo de la prueba t de Student para una población cuyos parámetros se conocen, en lugar de estimarse. Como es muy poco común conocer a toda la población, la prueba t se utiliza mucho más ampliamente.

Intervalos de predicción

La puntuación estándar se puede utilizar en el cálculo de intervalos de predicción . Un intervalo de predicción [ L , U ], que consta de un punto final inferior designado L y un punto final superior designado U , es un intervalo tal que una observación futura X se ubicará en el intervalo con alta probabilidad , es decir $\gamma$

P(L<X<U)=\gamma,

Para la puntuación estándar Z de X se obtiene: ^[8]

P\left({\frac {L-\mu }{\sigma }}<Z<{\frac {U-\mu }{\sigma }}\right)=\gamma .

Determinando el cuantil z tal que

P\left(-z<Z<z\right)=\gamma

sigue:

L=\mu -z\sigma ,\ U=\mu +z\sigma

Control de procesos

En aplicaciones de control de procesos, el valor Z proporciona una evaluación del grado en que un proceso está funcionando fuera del objetivo.

Comparación de puntuaciones medidas en diferentes escalas: ACT y SAT

Cuando las puntuaciones se miden en diferentes escalas, se pueden convertir en puntuaciones z para facilitar la comparación. Dietz et al. ^[9] dan el siguiente ejemplo, comparando las puntuaciones de los estudiantes en los (antiguos) exámenes SAT y ACT de la escuela secundaria. La tabla muestra la media y la desviación estándar de las puntuaciones totales en el SAT y ACT. Supongamos que el estudiante A obtuvo 1800 en el SAT y el estudiante B obtuvo 24 en el ACT. ¿Qué estudiante obtuvo mejores resultados en comparación con otros examinados?

La puntuación z para el estudiante A es $z={x-\mu \over \sigma }={1800-1500 \sobre 300}=1$

La puntuación z para el estudiante B es $z={x-\mu \over \sigma }={24-21 \over 5}=0.6$

Debido a que el estudiante A tiene una puntuación z más alta que el estudiante B, el estudiante A tuvo un mejor desempeño en comparación con otros examinados que el estudiante B.

Porcentaje de observaciones por debajo de una puntuación z

Siguiendo con el ejemplo de las puntuaciones de ACT y SAT, si se puede suponer además que tanto las puntuaciones de ACT como las de SAT se distribuyen normalmente (lo cual es aproximadamente correcto), entonces las puntuaciones z se pueden utilizar para calcular el porcentaje de examinados que obtuvieron puntuaciones más bajas. puntuaciones que los estudiantes A y B.

Análisis de conglomerados y escalamiento multidimensional.

"Para algunas técnicas multivariadas, como el escalamiento multidimensional y el análisis de conglomerados, el concepto de distancia entre las unidades de los datos suele ser de considerable interés e importancia... Cuando las variables en un conjunto de datos multivariados están en diferentes escalas, tiene más sentido calcular las distancias después de alguna forma de estandarización." ^[10]

Análisis de componentes principales

En el análisis de componentes principales, "las variables medidas en diferentes escalas o en una escala común con rangos muy diferentes a menudo están estandarizadas". ^[11]

Importancia relativa de las variables en regresión múltiple: coeficientes de regresión estandarizados

A veces se utiliza la estandarización de variables antes del análisis de regresión múltiple como ayuda para la interpretación. ^[12] (página 95) afirman lo siguiente.

"La pendiente de regresión estandarizada es la pendiente en la ecuación de regresión si X e Y están estandarizados... La estandarización de X e Y se realiza restando las medias respectivas de cada conjunto de observaciones y dividiendo por las respectivas desviaciones estándar... En la regresión múltiple, donde varios Se utilizan variables X, los coeficientes de regresión estandarizados cuantifican la contribución relativa de cada variable X."

Sin embargo, Kutner et al. ^[13] (p. 278) hacen la siguiente advertencia: "... uno debe tener cuidado al interpretar cualquier coeficiente de regresión, ya sea estandarizado o no. La razón es que cuando las variables predictivas están correlacionadas entre sí,... los coeficientes de regresión se ven afectados por la otras variables predictoras en el modelo... Las magnitudes de los coeficientes de regresión estandarizados se ven afectadas no solo por la presencia de correlaciones entre las variables predictivas sino también por los espaciamientos de las observaciones en cada una de estas variables. Por lo tanto, a veces estos espaciamientos pueden ser bastante arbitrarios. , normalmente no es prudente interpretar las magnitudes de los coeficientes de regresión estandarizados como si reflejaran la importancia comparativa de las variables predictoras".

Estandarización en estadística matemática.

En estadística matemática , una variable aleatoria X se estandariza restándole su valor esperado y dividiendo la diferencia por su desviación estándar. $\operatorname {E} [X]$ $\sigma (X)={\sqrt {\operatorname {Var} (X)}}:$

Z={X-\operatorname {E} [X] \over \sigma (X)}

Si la variable aleatoria considerada es la media muestral de una muestra aleatoria de X : ${\ Displaystyle \ X_ {1}, \ puntos, X_ {n}}$

{\bar {X}}={1 \sobre n}\sum _ {i=1}^{n}X_ {i}

entonces la versión estandarizada es

Z={\frac {{\bar {X}}-\operatorname {E} [{\bar {X}}]}{\sigma (X)/{\sqrt {n}}}}

Donde la varianza de la media de la muestra estandarizada se calculó de la siguiente manera:

{\begin{array}{l}\operatorname {Var} \left(\sum x_{i}\right)=\sum \operatorname {Var} (x_{i})=n\operatorname {Var} (x_{i})=n\sigma ^{2}\\\operatorname {Var} ({\overline {X}})=\operatorname {Var} \left({\frac {\sum x_{i}}{n}}\right)={\frac {1}{n^{2}}}\operatorname {Var} \left(\sum x_{i}\right)={\frac {n\sigma ^{2}}{n^{2}}}={\frac {\sigma ^{2}}{n}}\end{array}}

puntuación T

En la evaluación educativa, la puntuación T es una puntuación estándar desplazada en Z y escalada para tener una media de 50 y una desviación estándar de 10. ^[14]^[15]^[16] También se conoce como hensachi en japonés, donde el concepto es mucho más conocido y utilizado en el contexto de las admisiones a la escuela secundaria y a la universidad.

En las mediciones de densidad ósea, el puntaje T es el puntaje estándar de la medición en comparación con la población de adultos sanos de 30 años, y tiene la media habitual de 0 y la desviación estándar de 1. ^[17]

Ver también

Referencias

^ Mulders, Martijn; Zanderighi, Giulia, eds. (2017). 2015 Escuela Europea de Física de Altas Energías: Bansko, Bulgaria, 2 - 15 de septiembre de 2015. Informes amarillos del CERN: Actas escolares. Ginebra: CERN. ISBN 978-92-9083-472-4.
^ Bruto, Eilam (6 de noviembre de 2017). "Estadística práctica para la física de altas energías". Informes amarillos del CERN: Actas escolares . 4/2017: 165–186. doi :10.23730/CYRSP-2017-004.165.
^ E. Kreyszig (1979). Matemáticas de ingeniería avanzada (Cuarta ed.). Wiley. pag. 880, ecuaciones. 5.ISBN 0-471-02140-7.
^ Spiegel, Murray R.; Stephens, Larry J (2008), Estadísticas de esquemas de Schaum (Cuarta ed.), McGraw Hill, ISBN 978-0-07-148584-5
^ Mendenhall, William; Sincich, Terry (2007), Estadística para la ingeniería y las ciencias (Quinta ed.), Pearson / Prentice Hall, ISBN 978-0131877061
^ Glantz, Stanton A.; Slinker, Bryan K.; Neilands, Torsten B. (2016), Introducción a la regresión aplicada y análisis de varianza (tercera ed.), McGraw Hill, ISBN 978-0071824118
^ Aho, Ken A. (2014), Estadística fundamental y aplicada para biólogos (Primera ed.), Chapman & Hall / CRC Press, ISBN 978-1439873380
^ E. Kreyszig (1979). Matemáticas de ingeniería avanzada (Cuarta ed.). Wiley. pag. 880, ecuaciones. 6.ISBN 0-471-02140-7.
^ Díez, David; Barr, Cristóbal; Çetinkaya-Rundel, Mine (2012), OpenIntro Statistics (Segunda ed.), openintro.org
^ Everitt, Brian; Hohorn, Torsten J (2011), Introducción al análisis multivariado aplicado con R , Springer, ISBN 978-1441996497
^ Johnson, Ricardo; Wichern, Wichern (2007), Análisis estadístico multivariado aplicado , Pearson / Prentice Hall
^ Afifi, Abdelmonem; Mayo, Susanne K.; Clark, Virginia A. (2012), Análisis práctico multivariado (Quinta ed.), Chapman & Hall/CRC, ISBN 978-1439816806
^ Kutner, Michael; Nachtsheim, Christopher; Neter, John (204), Modelos de regresión lineal aplicados (cuarta ed.), McGraw Hill, ISBN 978-0073014661
^ Juan Salvia; James Ysseldyke; Sara Witmer (29 de enero de 2009). Evaluación: En Educación Especial e Inclusiva. Aprendizaje Cengage. págs.43–. ISBN 978-0-547-13437-6.
^ Edward S. Neukrug; R. Charles Fawcett (1 de enero de 2014). Conceptos básicos de las pruebas y evaluaciones: una guía práctica para consejeros, trabajadores sociales y psicólogos. Aprendizaje Cengage. págs.133–. ISBN 978-1-305-16183-2.
^ Randy W. Kamphaus (16 de agosto de 2005). Evaluación Clínica de la Inteligencia Infantil y Adolescente. Saltador. págs.123–. ISBN 978-0-387-26299-4.
^ "Medición de la masa ósea: qué significan los números". Centro Nacional de Recursos de Osteoporosis y Enfermedades Óseas Relacionadas de los NIH . Instituto Nacional de Salud . Consultado el 5 de agosto de 2017 .

Otras lecturas

Carroll, Susan Rovezzi; Carroll, David J. (2002). Estadísticas simplificadas para líderes escolares (edición ilustrada). Rowman y Littlefield. ISBN 978-0-8108-4322-6. Consultado el 7 de junio de 2009 .
Larsen, Richard J.; Marx, Morris L. (2000). Introducción a la estadística matemática y sus aplicaciones (tercera ed.). pag. 282.ISBN 0-13-922303-7.

enlaces externos

calculadora de puntuación z