En matemáticas y estadística , la media aritmética ( / ˌærɪθˈmɛtɪk / arr -ith- MET - ik ) , promedio aritmético o simplemente la media o promedio ( cuando el contexto es claro) es la suma de una colección de números dividida por el recuento de números en la colección. [1] La colección es a menudo un conjunto de resultados de un experimento , un estudio observacional o una encuesta . El término "media aritmética" se prefiere en algunos contextos de matemáticas y estadística porque ayuda a distinguirla de otros tipos de medias, como la geométrica y la armónica .
Además de en matemáticas y estadística, la media aritmética se utiliza con frecuencia en economía , antropología , historia y, en mayor o menor medida, en casi todos los campos académicos. Por ejemplo, el ingreso per cápita es el ingreso promedio aritmético de la población de una nación.
Si bien la media aritmética se utiliza a menudo para informar tendencias centrales , no es una estadística robusta : está muy influenciada por los valores atípicos (valores mucho mayores o menores que la mayoría de los demás). En el caso de distribuciones sesgadas , como la distribución de ingresos en la que los ingresos de unas pocas personas son sustancialmente mayores que los de la mayoría, la media aritmética puede no coincidir con la noción que uno tiene de "medio". En ese caso, las estadísticas robustas, como la mediana , pueden proporcionar una mejor descripción de la tendencia central.
La media aritmética de un conjunto de datos observados es igual a la suma de los valores numéricos de cada observación, dividida por el número total de observaciones. Simbólicamente, para un conjunto de datos que consta de los valores , la media aritmética se define mediante la fórmula:
(Para una explicación del operador de suma, consulte suma .)
En términos más simples, la fórmula para la media aritmética es:
Por ejemplo, si los salarios mensuales de los empleados son , entonces la media aritmética es:
Si el conjunto de datos es una población estadística (es decir, consta de todas las observaciones posibles y no solo de un subconjunto de ellas), entonces la media de esa población se denomina media poblacional y se denota con la letra griega . Si el conjunto de datos es una muestra estadística (un subconjunto de la población), se denomina media muestral (que para un conjunto de datos se denota como ).
La media aritmética se puede definir de manera similar para vectores en múltiples dimensiones, no solo valores escalares ; esto a menudo se conoce como centroide . De manera más general, debido a que la media aritmética es una combinación convexa (lo que significa que sus coeficientes suman ), se puede definir en un espacio convexo , no solo en un espacio vectorial.
La media aritmética tiene varias propiedades que la hacen interesante, especialmente como medida de tendencia central. Entre ellas se incluyen:
La media aritmética puede contrastarse con la mediana . La mediana se define de modo que no más de la mitad de los valores sean mayores y no más de la mitad menores que ella. Si los elementos de los datos aumentan aritméticamente cuando se colocan en algún orden, entonces la mediana y la media aritmética son iguales. Por ejemplo, considere la muestra de datos . La media es , al igual que la mediana. Sin embargo, cuando consideramos una muestra que no se puede organizar para que aumente aritméticamente, como , la mediana y la media aritmética pueden diferir significativamente. En este caso, la media aritmética es , mientras que la mediana es . El valor promedio puede variar considerablemente de la mayoría de los valores de la muestra y puede ser mayor o menor que la mayoría.
Este fenómeno tiene aplicaciones en muchos campos. Por ejemplo, desde los años 1980, el ingreso medio en Estados Unidos ha aumentado más lentamente que la media aritmética de los ingresos. [4]
Un promedio ponderado, o media ponderada, es un promedio en el que algunos puntos de datos cuentan más que otros en el sentido de que se les da más peso en el cálculo. [5] Por ejemplo, la media aritmética de y es , o equivalentemente . En contraste, una media ponderada en la que el primer número recibe, por ejemplo, el doble de peso que el segundo (quizás porque se supone que aparece el doble de veces en la población general de la que se muestrearon estos números) se calcularía como . Aquí los pesos, que necesariamente suman uno, son y , siendo el primero el doble del segundo. La media aritmética (a veces llamada "promedio no ponderado" o "promedio igualmente ponderado") puede interpretarse como un caso especial de un promedio ponderado en el que todos los pesos son iguales al mismo número ( en el ejemplo anterior y en una situación en la que se promedian los números).
Si una propiedad numérica, y cualquier muestra de datos de ella, puede tomar cualquier valor de un rango continuo en lugar de, por ejemplo, solo números enteros, entonces la probabilidad de que un número caiga en algún rango de valores posibles se puede describir integrando una distribución de probabilidad continua a lo largo de este rango, incluso cuando la probabilidad ingenua para que un número de muestra tome un valor determinado de infinitos sea cero. En este contexto, el análogo de un promedio ponderado, en el que hay infinitas posibilidades para el valor preciso de la variable en cada rango, se llama media de la distribución de probabilidad . La distribución de probabilidad más ampliamente encontrada se llama distribución normal ; tiene la propiedad de que todas las medidas de su tendencia central, incluyendo no solo la media sino también la mediana mencionada anteriormente y la moda (las tres M [6] ), son iguales. Esta igualdad no se cumple para otras distribuciones de probabilidad, como se ilustra para la distribución log-normal aquí.
Se debe tener especial cuidado al utilizar datos cíclicos, como fases o ángulos . Si se toma la media aritmética de 1° y 359°, se obtiene un resultado de 180 ° . Esto es incorrecto por dos motivos:
En general, un descuido de este tipo hará que el valor medio se desplace artificialmente hacia la mitad del rango numérico. Una solución a este problema es utilizar la formulación de optimización (es decir, definir la media como el punto central: el punto alrededor del cual se tiene la menor dispersión) y redefinir la diferencia como una distancia modular (es decir, la distancia en el círculo: por lo tanto, la distancia modular entre 1° y 359° es 2°, no 358°).
La media aritmética a menudo se denota mediante una barra ( vinculum o macron ), como en . [3]
Es posible que algunos programas ( procesadores de texto , navegadores web ) no muestren correctamente el símbolo "x̄". Por ejemplo, el símbolo HTML "x̄" combina dos códigos: la letra base "x" más un código para la línea anterior ( ̄ o ¯). [7]
En algunos formatos de documentos (como PDF ), el símbolo puede reemplazarse por un símbolo "¢" ( centavo ) cuando se copia a un procesador de texto como Microsoft Word .