En matemáticas y estadística , la media aritmética ( / ˌ æ r ɪ θ ˈ m ɛ t ɪ k ˈ m iː n / arr-ith- MET -ik ), promedio aritmético , o simplemente la media o promedio (cuando el contexto es claro ) es la suma de una colección de números dividida por el recuento de números de la colección. [1] La colección es a menudo un conjunto de resultados de un experimento , un estudio observacional o una encuesta . El término "media aritmética" se prefiere en algunos contextos matemáticos y estadísticos porque ayuda a distinguirlo de otros tipos de medias, como las geométricas y las armónicas .
Además de en matemáticas y estadística, la media aritmética se utiliza con frecuencia en economía , antropología , historia y, hasta cierto punto, en casi todos los campos académicos. Por ejemplo, el ingreso per cápita es el ingreso promedio aritmético de la población de una nación.
Si bien la media aritmética se utiliza a menudo para informar tendencias centrales , no es una estadística sólida : está muy influenciada por valores atípicos (valores mucho mayores o menores que la mayoría de los demás). Para distribuciones sesgadas , como la distribución del ingreso en la que los ingresos de unas pocas personas son sustancialmente más altos que los de la mayoría, la media aritmética puede no coincidir con la noción de "medio". En ese caso, estadísticas sólidas, como la mediana , pueden proporcionar una mejor descripción de la tendencia central.
La media aritmética de un conjunto de datos observados es igual a la suma de los valores numéricos de cada observación, dividida por el número total de observaciones. Simbólicamente, para un conjunto de datos que consta de valores , la media aritmética se define mediante la fórmula:
(Para obtener una explicación del operador de suma, consulte suma ).
Por ejemplo, si los salarios mensuales de los empleados son , entonces la media aritmética es:
Si el conjunto de datos es una población estadística (es decir, consta de todas las observaciones posibles y no solo de un subconjunto de ellas), entonces la media de esa población se denomina media poblacional y se denota con la letra griega . Si el conjunto de datos es una muestra estadística (un subconjunto de la población), se denomina media muestral (que para un conjunto de datos se denota como ).
La media aritmética se puede definir de manera similar para vectores en múltiples dimensiones, no solo para valores escalares ; esto a menudo se denomina centroide . De manera más general, debido a que la media aritmética es una combinación convexa (es decir, sus coeficientes suman ), se puede definir en un espacio convexo , no solo en un espacio vectorial.
La media aritmética tiene varias propiedades que la hacen interesante, especialmente como medida de tendencia central. Éstas incluyen:
La media aritmética se puede contrastar con la mediana . La mediana se define de manera que no más de la mitad de los valores sean mayores y no más de la mitad sean menores que ella. Si los elementos de los datos aumentan aritméticamente cuando se colocan en algún orden, entonces la mediana y el promedio aritmético son iguales. Por ejemplo, considere la muestra de datos . La media es , al igual que la mediana. Sin embargo, cuando consideramos una muestra que no se puede ordenar para aumentar aritméticamente, como , la mediana y el promedio aritmético pueden diferir significativamente. En este caso, la media aritmética es , mientras que la mediana es . El valor promedio puede variar considerablemente de la mayoría de los valores de la muestra y puede ser mayor o menor que la mayoría.
Hay aplicaciones de este fenómeno en muchos campos. Por ejemplo, desde la década de 1980, el ingreso medio en Estados Unidos ha aumentado más lentamente que el promedio aritmético del ingreso. [4]
Un promedio ponderado, o media ponderada, es un promedio en el que algunos puntos de datos cuentan más que otros porque se les da más peso en el cálculo. [5] Por ejemplo, la media aritmética de y es , o equivalentemente . Por el contrario, una media ponderada en la que el primer número recibe, por ejemplo, el doble de peso que el segundo (tal vez porque se supone que aparece con el doble de frecuencia en la población general de la que se tomaron muestras) se calcularía como . Aquí los pesos, que necesariamente suman uno, son y , siendo el primero el doble del segundo. La media aritmética (a veces llamada "promedio no ponderado" o "promedio igualmente ponderado") se puede interpretar como un caso especial de promedio ponderado en el que todos los pesos son iguales al mismo número ( en el ejemplo anterior y en una situación con números siendo promediado).
Si una propiedad numérica, y cualquier muestra de datos de ella, puede tomar cualquier valor de un rango continuo en lugar de, por ejemplo, sólo números enteros, entonces la probabilidad de que un número caiga dentro de algún rango de valores posibles se puede describir integrando una distribución de probabilidad continua en este rango, incluso cuando la probabilidad ingenua de que un número de muestra tome un valor determinado de un número infinito sea cero. En este contexto, el análogo de un promedio ponderado, en el que hay infinitas posibilidades para el valor preciso de la variable en cada rango, se llama media de la distribución de probabilidad . La distribución de probabilidad más encontrada se llama distribución normal ; tiene la propiedad de que todas las medidas de su tendencia central, incluyendo no sólo la media sino también la mediana mencionada anteriormente y la moda (las tres M [6] ), son iguales. Esta igualdad no se cumple para otras distribuciones de probabilidad, como se ilustra aquí para la distribución log-normal.
Se necesita especial cuidado al utilizar datos cíclicos, como fases o ángulos . Tomando la media aritmética de 1° y 359° se obtiene un resultado de 180 ° . Esto es incorrecto por dos razones:
En la aplicación general, tal descuido conducirá a que el valor medio se mueva artificialmente hacia el centro del rango numérico. Una solución a este problema es utilizar la formulación de optimización (es decir, definir la media como el punto central: el punto sobre el cual se tiene la menor dispersión) y redefinir la diferencia como una distancia modular (es decir, la distancia en el círculo: por lo que la distancia modular entre 1° y 359° es 2°, no 358°).
La media aritmética a menudo se indica mediante una barra ( vinculum o macron ), como en . [3]
Es posible que algunos programas ( procesadores de texto , navegadores web ) no muestren el símbolo "x̄" correctamente. Por ejemplo, el símbolo HTML "x̄" combina dos códigos: la letra base "x" más un código para la línea anterior (̄ o ¯). [7]
En algunos formatos de documentos (como PDF ), el símbolo puede reemplazarse por un símbolo "¢" ( céntimos ) cuando se copia a un procesador de texto como Microsoft Word .