stringtranslate.com

Desviación (estadísticas)

Gráfico de desviación estándar de una distribución aleatoria.

En matemáticas y estadística , la desviación sirve como medida para cuantificar la disparidad entre un valor observado de una variable y otro valor designado, frecuentemente la media de esa variable. Las desviaciones con respecto a la media muestral y la media poblacional (o " valor verdadero ") se denominan errores y residuos , respectivamente. El signo de la desviación informa la dirección de esa diferencia: la desviación es positiva cuando el valor observado excede el valor de referencia. El valor absoluto de la desviación indica el tamaño o magnitud de la diferencia. En una muestra dada , hay tantas desviaciones como puntos muestrales . Las estadísticas resumidas se pueden derivar de un conjunto de desviaciones, como la desviación estándar y la desviación absoluta media , medidas de dispersión , y la desviación media con signo , una medida de sesgo. [1]

La desviación de cada punto de datos se calcula restando la media del conjunto de datos del punto de datos individual. Matemáticamente, la desviación d de un punto de datos x en un conjunto de datos está dada por

Este cálculo representa la "distancia" de un punto de datos desde la media y proporciona información sobre cuánto varían los valores individuales del promedio. Las desviaciones positivas indican valores por encima de la media, mientras que las desviaciones negativas indican valores por debajo de la media. [1]

La suma de las desviaciones al cuadrado es un componente clave en el cálculo de la varianza, otra medida de la dispersión de un conjunto de datos. La varianza se calcula promediando las desviaciones al cuadrado. La desviación es un concepto fundamental para comprender la distribución y variabilidad de los puntos de datos en el análisis estadístico. [1]

Tipos

Una desviación que es una diferencia entre un valor observado y el valor verdadero de una cantidad de interés (donde el valor verdadero denota el valor esperado, como la media poblacional) es un error. [2]

Desviaciones firmadas

Una desviación que es una diferencia entre un valor observado y el valor verdadero de una cantidad de interés (como la media poblacional) es un error .

Una desviación que es la diferencia entre el valor observado y una estimación del valor verdadero (por ejemplo, la media de la muestra) es un residual . Estos conceptos son aplicables a datos en los niveles de medición de intervalo y relación . [3]

Desviación absoluta o sin signo


La desviación absoluta promedio (AAD) en estadística es una medida de la dispersión o extensión de un conjunto de puntos de datos alrededor de un valor central, generalmente la media o la mediana. Se calcula tomando el promedio de las diferencias absolutas entre cada punto de datos y el valor central elegido. AAD proporciona una medida de la magnitud típica de las desviaciones del valor central en un conjunto de datos, brindando información sobre la variabilidad general de los datos. [5]

La desviación mínima absoluta (LAD) es un método estadístico utilizado en el análisis de regresión para estimar los coeficientes de un modelo lineal. A diferencia del método de mínimos cuadrados más común, que minimiza la suma de distancias verticales al cuadrado (residuales) entre los valores observados y predichos, el método LAD minimiza la suma de las distancias verticales absolutas.

En el contexto de la regresión lineal, si ( x 1 , y 1 ), ( x 2 , y 2 ), ... son los puntos de datos, y a y b son los coeficientes que se estimarán para el modelo lineal.

las estimaciones de desviación mínima absoluta ( a y b ) se obtienen minimizando la suma.

El método LAD es menos sensible a los valores atípicos en comparación con el método de mínimos cuadrados, lo que lo convierte en una técnica de regresión sólida en presencia de distribuciones residuales asimétricas o de cola pesada. [6]

Resumen estadístico

Desviación media con signo

Para un estimador insesgado , el promedio de las desviaciones con signo en todo el conjunto de todas las observaciones del valor del parámetro de población no observado tiene un promedio de cero en un número arbitrariamente grande de muestras. Sin embargo, por construcción, el promedio de las desviaciones con signo de los valores del valor medio muestral es siempre cero, aunque la desviación promedio con signo de otra medida de tendencia central, como la mediana muestral, no tiene por qué ser cero.

La desviación media con signo es una medida estadística que se utiliza para evaluar la desviación promedio de un conjunto de valores desde un punto central, generalmente la media. Se calcula tomando la media aritmética de las diferencias con signo entre cada punto de datos y la media del conjunto de datos.

El término "con signo" indica que las desviaciones se consideran con sus respectivos signos, es decir, si están por encima o por debajo de la media. Las desviaciones positivas (por encima de la media) y las desviaciones negativas (por debajo de la media) se incluyen en el cálculo. La desviación media con signo proporciona una medida de la distancia promedio y la dirección de los puntos de datos con respecto a la media, lo que ofrece información sobre la tendencia general y la distribución de los datos. [3]

Dispersión

Como medidas de dispersión estadística se utilizan estadísticas de la distribución de las desviaciones .

Una distribución con diferentes desviaciones estándar refleja distintos grados de dispersión entre sus puntos de datos. La primera desviación estándar de la media en una distribución normal abarca aproximadamente el 68% de los datos. La segunda desviación estándar de la media en una distribución normal abarca una porción mayor de los datos y cubre aproximadamente el 95% de las observaciones.

Normalización

Las desviaciones, que miden la diferencia entre los valores observados y algún punto de referencia, llevan inherentemente unidades correspondientes a la escala de medición utilizada. Por ejemplo, si se miden longitudes, las desviaciones se expresarían en unidades como metros o pies. Para hacer que las desviaciones no tengan unidades y facilitar las comparaciones entre diferentes conjuntos de datos, se puede adimensionalizar .

Un método común implica dividir las desviaciones por una medida de escala ( dispersión estadística ), utilizándose la desviación estándar de la población para la estandarización o la desviación estándar de la muestra para la estudentización (p. ej., residual estudentizado ).

Otro enfoque de la adimensionalización se centra en el escalamiento por ubicación en lugar de por dispersión. La desviación porcentual ofrece una ilustración de este método, calculada como la diferencia entre el valor observado y el valor aceptado, dividida por el valor aceptado y luego multiplicada por 100%. Al escalar la desviación en función del valor aceptado, esta técnica permite expresar las desviaciones en términos porcentuales, proporcionando una perspectiva clara sobre la diferencia relativa entre los valores observados y aceptados. Ambos métodos de adimensionalización sirven para hacer que las desviaciones sean comparables e interpretables más allá de las unidades de medida específicas. [10]

Ejemplos

En un ejemplo, se toman una serie de mediciones de la velocidad del sonido en un medio particular. El valor aceptado o esperado para la velocidad del sonido en este medio, según cálculos teóricos, es de 343 metros por segundo.

Ahora, durante un experimento, diferentes investigadores toman múltiples mediciones. El investigador A mide la velocidad del sonido en 340 metros por segundo, lo que da como resultado una desviación de -3 metros por segundo del valor esperado. El investigador B, por el contrario, mide la velocidad en 345 metros por segundo, lo que da como resultado una desviación de +2 metros por segundo.

En este contexto científico, la desviación ayuda a cuantificar cómo las mediciones individuales difieren del valor teóricamente predicho o aceptado. Proporciona información sobre la exactitud y precisión de los resultados experimentales, lo que permite a los investigadores evaluar la confiabilidad de sus datos y potencialmente identificar factores que contribuyen a las discrepancias.

En otro ejemplo, supongamos que se espera que una reacción química produzca 100 gramos de un compuesto específico según la estequiometría. Sin embargo, en un experimento de laboratorio real, se realizan varias pruebas con diferentes condiciones.

En la prueba 1, se mide que el rendimiento real es de 95 gramos, lo que da como resultado una desviación de -5 gramos del rendimiento esperado. En el ensayo 2, se mide que el rendimiento real es de 102 gramos, lo que da como resultado una desviación de +2 gramos. Estas desviaciones del valor esperado proporcionan información valiosa sobre la eficiencia y reproducibilidad de la reacción química en diferentes condiciones.

Los científicos pueden analizar estas desviaciones para optimizar las condiciones de reacción, identificar posibles fuentes de error y mejorar el rendimiento general y la confiabilidad del proceso. El concepto de desviación es crucial para evaluar la precisión de los resultados experimentales y tomar decisiones informadas para mejorar los resultados de los experimentos científicos.

Ver también

Referencias

  1. ^ abc Lee, Dong Kyu; En, Junyong; Lee, Sangseok (2015). "Desviación estándar y error estándar de la media". Revista Coreana de Anestesiología . 68 (3): 220. doi : 10.4097/kjae.2015.68.3.220 . ISSN  2005-6419. PMC  4452664 .
  2. ^ Livingston, Edward H. (junio de 2004). "La media y la desviación estándar: ¿qué significa todo esto?". Revista de investigación quirúrgica . 119 (2): 117-123. doi :10.1016/j.jss.2004.02.008. ISSN  0022-4804.
  3. ^ ab Dodge, Yadolah, ed. (7 de agosto de 2003). Diccionario Oxford de términos estadísticos. Prensa de la Universidad de Oxford, Oxford. ISBN 978-0-19-850994-3.
  4. ^ Konno, Hiroshi; Koshizuka, Tomoyuki (1 de octubre de 2005). "Modelo de desviación media-absoluta". Transacciones IIE . 37 (10): 893–900. doi :10.1080/07408170591007786. ISSN  0740-817X.
  5. ^ Pham-Gia, T.; Colgado, TL (1 de octubre de 2001). "Las desviaciones absolutas media y mediana". Modelado Matemático e Informático . 34 (7): 921–936. doi :10.1016/S0895-7177(01)00109-1. ISSN  0895-7177.
  6. ^ Chen, Kani; Ying, Zhiliang (1 de abril de 1996). "Un contraejemplo a una conjetura sobre la banda Hall-Wellner". Los anales de la estadística . 24 (2). doi : 10.1214/aos/1032894456 . ISSN  0090-5364.
  7. ^ "2. Media y desviación estándar | El BMJ". El BMJ | The BMJ: revista médica general líder. Investigación. Educación. Comentario . 2020-10-28 . Consultado el 2 de noviembre de 2022 .
  8. ^ ab Pham-Gia, T.; Colgado, TL (1 de octubre de 2001). "Las desviaciones absolutas media y mediana". Modelado Matemático e Informático . 34 (7): 921–936. doi :10.1016/S0895-7177(01)00109-1. ISSN  0895-7177.
  9. ^ Jones, Alan R. (9 de octubre de 2018). Probabilidad, estadística y otras cosas aterradoras. Rutledge. pag. 73.ISBN 978-1-351-66138-6.
  10. ^ Liberto, David; Pisani, Robert; Purves, Roger (2007). Estadísticas (4 ed.). Nueva York: Norton. ISBN 978-0-393-93043-6.