Una media es una cantidad numérica que representa el "centro" de una colección de números y es intermedia entre los valores extremos del conjunto de números. [1] Existen varios tipos de medias (o "medidas de tendencia central ") en matemáticas , especialmente en estadística . Cada una intenta resumir o tipificar un grupo dado de datos , ilustrando la magnitud y el signo del conjunto de datos . Cuál de estas medidas es más esclarecedora depende de lo que se esté midiendo y del contexto y el propósito. [2]
La media aritmética , también conocida como "promedio aritmético", es la suma de los valores dividida por el número de valores. La media aritmética de un conjunto de números x 1 , x 2 , ..., x n se denota típicamente usando una barra superior , . [nota 1] Si los números son de la observación de una muestra de un grupo más grande , la media aritmética se denomina media de la muestra ( ) para distinguirla de la media del grupo (o valor esperado ) de la distribución subyacente, denotada o . [nota 2] [3]
Además de la probabilidad y la estadística, en geometría y análisis matemático se utilizan a menudo otras nociones de media ; a continuación se ofrecen ejemplos.
La media aritmética (o simplemente media o promedio ) de una lista de números es la suma de todos los números dividida por su cantidad. De manera similar, la media de una muestra , que normalmente se denota por , es la suma de los valores muestreados dividida por la cantidad de elementos de la muestra.
Por ejemplo, la media aritmética de cinco valores: 4, 36, 45, 50, 75 es:
La media geométrica es un promedio que resulta útil para conjuntos de números positivos, que se interpretan según su producto (como es el caso de las tasas de crecimiento) y no de su suma (como es el caso de la media aritmética):
Por ejemplo, la media geométrica de cinco valores: 4, 36, 45, 50, 75 es:
La media armónica es un promedio que resulta útil para conjuntos de números que se definen en relación con alguna unidad , como en el caso de la velocidad (es decir, la distancia por unidad de tiempo):
Por ejemplo, la media armónica de los cinco valores: 4, 36, 45, 50, 75 es
Si tenemos cinco bombas que pueden vaciar un tanque de un tamaño determinado en respectivamente 4, 36, 45, 50 y 75 minutos, entonces la media armónica de nos dice que estas cinco bombas diferentes trabajando juntas bombearán al mismo ritmo tanto como cinco bombas que pueden vaciar el tanque cada una en minutos.
AM, GM y HM satisfacen estas desigualdades:
La igualdad se cumple si todos los elementos de la muestra dada son iguales.
En estadística descriptiva , la media puede confundirse con la mediana , la moda o el rango medio , ya que cualquiera de estos puede llamarse incorrectamente un "promedio" (más formalmente, una medida de tendencia central ). La media de un conjunto de observaciones es el promedio aritmético de los valores; sin embargo, para distribuciones sesgadas , la media no es necesariamente la misma que el valor medio (mediana) o el valor más probable (moda). Por ejemplo, el ingreso medio suele estar sesgado hacia arriba por un pequeño número de personas con ingresos muy altos, de modo que la mayoría tiene un ingreso inferior a la media. Por el contrario, el ingreso mediano es el nivel en el que la mitad de la población está por debajo y la otra mitad por encima. El ingreso moda es el ingreso más probable y favorece al mayor número de personas con ingresos más bajos. Si bien la mediana y la moda suelen ser medidas más intuitivas para tales datos sesgados, muchas distribuciones sesgadas se describen mejor de hecho por su media, incluidas las distribuciones exponencial y de Poisson .
La media de una distribución de probabilidad es el valor promedio aritmético de largo plazo de una variable aleatoria que tiene esa distribución. Si la variable aleatoria se denota por , entonces la media también se conoce como el valor esperado de (denotado ). Para una distribución de probabilidad discreta , la media está dada por , donde la suma se toma sobre todos los valores posibles de la variable aleatoria y es la función de masa de probabilidad . Para una distribución continua , la media es , donde es la función de densidad de probabilidad . [5] En todos los casos, incluidos aquellos en los que la distribución no es ni discreta ni continua, la media es la integral de Lebesgue de la variable aleatoria con respecto a su medida de probabilidad . La media no necesita existir o ser finita; para algunas distribuciones de probabilidad la media es infinita ( +∞ o −∞ ), mientras que para otras la media no está definida .
La media generalizada , también conocida como media de potencia o media de Hölder, es una abstracción de las medias cuadrática , aritmética, geométrica y armónica. Se define para un conjunto de n números positivos x i por
[1]
Eligiendo diferentes valores para el parámetro m , se obtienen los siguientes tipos de medias:
Esto se puede generalizar aún más como la f -media generalizada
y nuevamente una elección adecuada de una f invertible dará
La media aritmética ponderada (o promedio ponderado) se utiliza si se desean combinar valores promedio de muestras de diferentes tamaños de la misma población:
Donde y son la media y el tamaño de la muestra respectivamente. En otras aplicaciones, representan una medida de la fiabilidad de la influencia de los valores respectivos sobre la media.
A veces, un conjunto de números puede contener valores atípicos (es decir, valores de datos que son mucho más bajos o mucho más altos que los demás). A menudo, los valores atípicos son datos erróneos causados por artefactos . En este caso, se puede utilizar una media truncada . Implica descartar partes dadas de los datos en el extremo superior o inferior, normalmente una cantidad igual en cada extremo y luego tomar la media aritmética de los datos restantes. La cantidad de valores eliminados se indica como un porcentaje de la cantidad total de valores.
La media intercuartil es un ejemplo específico de media truncada. Es simplemente la media aritmética después de eliminar el cuartil más bajo y el cuartil más alto de los valores.
suponiendo que los valores han sido ordenados, por lo que es simplemente un ejemplo específico de una media ponderada para un conjunto específico de pesos.
En algunas circunstancias, los matemáticos pueden calcular la media de un conjunto infinito (o incluso incontable ) de valores. Esto puede suceder cuando se calcula el valor medio de una función . Intuitivamente, la media de una función puede considerarse como el cálculo del área bajo una sección de una curva y luego dividirla por la longitud de esa sección. Esto se puede hacer de manera rudimentaria contando cuadrados en papel cuadriculado o, más precisamente, mediante la integración . La fórmula de integración se escribe como:
En este caso, hay que tener cuidado de que la integral converja, pero la media puede ser finita incluso si la función misma tiende al infinito en algunos puntos.
Los ángulos , las horas del día y otras cantidades cíclicas requieren aritmética modular para sumar y combinar números. En todas estas situaciones, no habrá una media única. Por ejemplo, las horas una hora antes y después de la medianoche son equidistantes tanto de la medianoche como del mediodía. También es posible que no exista media. Considere una rueda de colores : no hay media para el conjunto de todos los colores. En estas situaciones, debe decidir qué media es la más útil. Puede hacerlo ajustando los valores antes de promediar o utilizando un enfoque especializado para la media de cantidades circulares .
La media de Fréchet proporciona una manera de determinar el "centro" de una distribución de masa en una superficie o, de manera más general, en una variedad de Riemann . A diferencia de muchas otras medias, la media de Fréchet se define en un espacio cuyos elementos no necesariamente se pueden sumar o multiplicar por escalares. A veces también se la conoce como media de Karcher (nombrada en honor a Hermann Karcher).
En geometría, existen miles de definiciones diferentes para el centro de un triángulo , que pueden interpretarse como la media de un conjunto triangular de puntos en el plano. [6]
Esta es una aproximación a la media para una distribución moderadamente sesgada. [7] Se utiliza en la exploración de hidrocarburos y se define como:
donde , y son los percentiles 10, 50 y 90 de la distribución, respectivamente.
bajo la dirección de Clark Kimberling, se ha desarrollado una enciclopedia electrónica de centros de triángulos (ETC), que contiene más de 7000 centros y muchas propiedades de estos puntos