En lenguaje corriente , un promedio es un número o valor único que representa mejor un conjunto de datos. El tipo de promedio que se considera más típicamente representativo de una lista de números es la media aritmética : la suma de los números dividida por la cantidad de números que hay en la lista. Por ejemplo, el promedio de los números 2, 3, 4, 7 y 9 (que suman 25) es 5. Dependiendo del contexto, la estadística más representativa que se tomará como promedio podría ser otra medida de tendencia central . como el rango medio , la mediana , la moda o la media geométrica . Por ejemplo, el ingreso personal promedio a menudo se da como la mediana (el número por debajo del cual es el 50% de los ingresos personales y por encima del cual es el 50% de los ingresos personales) porque la media sería mayor si incluyera los ingresos personales de unos pocos multimillonarios . Por esta razón, se recomienda evitar el uso de la palabra "promedio" cuando se habla de medidas de tendencia central y especificar qué tipo de medida de promedio se está utilizando.
Si todos los números de una lista son el mismo número, entonces su promedio también es igual a este número. Esta propiedad es compartida por cada uno de los muchos tipos de promedio.
Otra propiedad universal es la monotonicidad : si dos listas de números A y B tienen la misma longitud, y cada entrada de la lista A es al menos tan grande como la entrada correspondiente en la lista B , entonces el promedio de la lista A es al menos el de la lista B . Además, todos los promedios satisfacen la homogeneidad lineal : si todos los números de una lista se multiplican por el mismo número positivo, entonces su promedio cambia por el mismo factor.
En algunos tipos de promedio, a los elementos de la lista se les asignan pesos diferentes antes de determinar el promedio. Estos incluyen la media aritmética ponderada , la media geométrica ponderada y la mediana ponderada . Además, para algunos tipos de media móvil , el peso de un elemento depende de su posición en la lista. Sin embargo, la mayoría de los tipos de promedio satisfacen la insensibilidad a la permutación : todos los elementos cuentan por igual para determinar su valor promedio y sus posiciones en la lista son irrelevantes; el promedio de (1, 2, 3, 4, 6) es el mismo que el de (3, 2, 6, 4, 1).
La media aritmética , la media geométrica y la media armónica se conocen colectivamente como media pitagórica .
La moda , la mediana y el rango medio se utilizan a menudo además de la media como estimaciones de tendencia central en estadística descriptiva . Se puede considerar que todos ellos minimizan la variación en cierta medida; ver Tendencia central § Soluciones a problemas variacionales .
El número que aparece con más frecuencia en una lista se llama moda. Por ejemplo, la moda de la lista (1, 2, 2, 3, 3, 3, 4) es 3. Puede suceder que haya dos o más números que aparezcan con la misma frecuencia y con mayor frecuencia que cualquier otro número. En este caso no existe una definición acordada de modo. Algunos autores dicen que son todos modos y otros dicen que no hay ningún modo.
La mediana es el número medio del grupo cuando están clasificados en orden. (Si hay un número par de números, se toma la media de los dos del medio).
Por lo tanto, para encontrar la mediana, ordene la lista según la magnitud de sus elementos y luego elimine repetidamente el par que consta de los valores más alto y más bajo hasta que queden uno o dos valores. Si queda exactamente un valor, es la mediana; si son dos valores, la mediana es la media aritmética de estos dos. Este método toma la lista 1, 7, 3, 13 y la ordena para que lea 1, 3, 7, 13. Luego se eliminan el 1 y el 13 para obtener la lista 3, 7. Dado que hay dos elementos en esta lista restante, la mediana es su media aritmética, (3 + 7)/2 = 5.
El rango medio es la media aritmética de los valores más alto y más bajo de un conjunto.
La tabla de símbolos matemáticos explica los símbolos utilizados a continuación.
Otros promedios más sofisticados son: trimiana , trimiana y media normalizada, con sus generalizaciones. [1]
Uno puede crear su propia métrica promedio utilizando la media f generalizada :
donde f es cualquier función invertible. La media armónica es un ejemplo de esto usando f ( x ) = 1/ x , y la media geométrica es otro, usando f ( x ) = log x .
Sin embargo, este método para generar medias no es lo suficientemente general como para capturar todos los promedios. Un método más general [2] [ verificación fallida ] para definir un promedio toma cualquier función g ( x 1 , x 2 , ..., x n ) de una lista de argumentos que sea continua , estrictamente creciente en cada argumento y simétrica. (invariante bajo permutación de los argumentos). El promedio y es entonces el valor que, al reemplazar cada miembro de la lista, da como resultado el mismo valor de función: g ( y , y , ..., y ) = g ( x 1 , x 2 , ..., x norte ) . Esta definición más general aún captura la importante propiedad de todos los promedios de que el promedio de una lista de elementos idénticos es ese elemento en sí. La función g ( x 1 , x 2 , ..., x n ) = x 1 + x 2 + ··· + x n proporciona la media aritmética. La función g ( x 1 , x 2 , ..., x n ) = x 1 x 2 ··· x n (donde los elementos de la lista son números positivos) proporciona la media geométrica. La función g ( x 1 , x 2 , ..., x n ) = ( x 1 −1 + x 2 −1 + ··· + x n −1 ) −1 ) (donde los elementos de la lista son números positivos) proporciona la media armónica. [2]
Un tipo de promedio utilizado en finanzas es el rendimiento porcentual promedio. Es un ejemplo de media geométrica. Cuando los rendimientos son anuales, se denomina Tasa de Crecimiento Anual Compuesta (CAGR). Por ejemplo, si estamos considerando un período de dos años, y el rendimiento de la inversión en el primer año es −10% y el rendimiento en el segundo año es +60%, entonces se puede obtener el rendimiento porcentual promedio o CAGR, R. resolviendo la ecuación: (1 − 10%) × (1 + 60%) = (1 − 0,1) × (1 + 0,6) = (1 + R ) × (1 + R ) . El valor de R que hace que esta ecuación sea verdadera es 0,2 o 20%. Esto significa que el rendimiento total durante el período de 2 años es el mismo que si hubiera habido un crecimiento del 20% cada año. El orden de los años no hace ninguna diferencia: el rendimiento porcentual promedio de +60% y −10% es el mismo resultado que el de −10% y +60%.
Este método se puede generalizar a ejemplos en los que los períodos no son iguales. Por ejemplo, considere un período de medio año para el cual el rendimiento es -23% y un período de dos años y medio para el cual el rendimiento es +13%. El rendimiento porcentual promedio para el período combinado es el rendimiento de un solo año, R , que es la solución de la siguiente ecuación: (1 − 0,23) 0,5 × (1 + 0,13) 2,5 = (1 + R ) 0,5+2,5 , lo que da un retorno promedio R de 0.0600 o 6.00%.
Dada una serie de tiempo , como los precios diarios del mercado de valores o las temperaturas anuales, la gente suele querer crear una serie más suave. [3] Esto ayuda a mostrar tendencias subyacentes o quizás comportamientos periódicos. Una forma sencilla de hacer esto es la media móvil : se elige un número n y se crea una nueva serie tomando la media aritmética de los primeros n valores, luego se avanza un lugar eliminando el valor más antiguo e introduciendo un nuevo valor en el otro. final de la lista, y así sucesivamente. Esta es la forma más simple de media móvil. Las formas más complicadas implican el uso de un promedio ponderado . La ponderación se puede utilizar para mejorar o suprimir diversos comportamientos periódicos y existe un análisis muy extenso sobre qué ponderaciones utilizar en la literatura sobre filtrado . En el procesamiento de señales digitales, el término "media móvil" se utiliza incluso cuando la suma de los pesos no es 1,0 (por lo que la serie de salida es una versión escalada de los promedios). [4] La razón de esto es que el analista generalmente está interesado sólo en la tendencia o el comportamiento periódico.
La primera vez registrada que la media aritmética se amplió de 2 a n casos para su uso en estimación fue en el siglo XVI. Desde finales del siglo XVI en adelante, gradualmente se convirtió en un método común para reducir los errores de medición en diversas áreas. [5] [6] En aquel momento, los astrónomos querían conocer un valor real a partir de mediciones ruidosas, como la posición de un planeta o el diámetro de la luna. Utilizando la media de varios valores medidos, los científicos asumieron que los errores suman un número relativamente pequeño en comparación con el total de todos los valores medidos. De hecho, el método de calcular la media para reducir los errores de observación se desarrolló principalmente en astronomía. [5] [7] Un posible precursor de la media aritmética es el rango medio (la media de los dos valores extremos), utilizado por ejemplo en la astronomía árabe de los siglos IX al XI, pero también en la metalurgia y la navegación. [6]
Sin embargo, hay varias referencias vagas más antiguas al uso de la media aritmética (que no son tan claras, pero razonablemente podrían tener que ver con nuestra definición moderna de la media). En un texto del siglo IV, estaba escrito que (el texto entre corchetes es un posible texto faltante que podría aclarar el significado): [8]
Existen referencias potenciales aún más antiguas. Hay registros de que desde aproximadamente el año 700 a. C., comerciantes y transportistas acordaron que los daños a la carga y al barco (su "contribución" en caso de daños por mar) debían repartirse equitativamente entre ellos. [7] Esto podría haberse calculado utilizando el promedio, aunque no parece haber ningún registro directo del cálculo.
La raíz se encuentra en árabe como عوار ʿawār , un defecto, o cualquier cosa defectuosa o dañada, incluida la mercancía parcialmente estropeada; y عواري ʿawārī (también عوارة ʿawāra ) = "de o relacionado con ʿawār , un estado de daño parcial". [a] Dentro de las lenguas occidentales, la historia de la palabra comienza en el comercio marítimo medieval en el Mediterráneo. La avaria latina de Génova de los siglos XII y XIII significaba "daños, pérdidas y gastos anormales que surgieran en relación con un viaje por mar mercante"; y el mismo significado para avaria está en Marsella en 1210, Barcelona en 1258 y Florencia a finales del siglo XIII. [b] El avarie francés del siglo XV tenía el mismo significado y engendró al inglés "averay" (1491) y al inglés "average" (1502) con el mismo significado. Hoy en día, el avarie italiano , el avarie catalán y el avarie francés todavía tienen el significado principal de "daño". La enorme transformación del significado en inglés comenzó con la práctica en los contratos de derecho de la marina mercante occidental de finales de la Edad Media y principios de la Edad Moderna, según los cuales si el barco se encontraba con una fuerte tormenta y algunas de las mercancías tenían que ser arrojadas por la borda para hacerlo más liviano y seguro. , entonces todos los comerciantes cuyas mercancías estuvieran en el barco sufrirían proporcionalmente (y no quienes fueran arrojados por la borda); y de manera más general, debía haber una distribución proporcional de cualquier avaria . A partir de ahí, los aseguradores, acreedores y comerciantes británicos adoptaron la palabra para referirse a sus pérdidas como si estuvieran repartidas entre toda su cartera de activos y tuvieran una proporción media. El significado actual se desarrolló a partir de eso y comenzó a mediados del siglo XVIII en inglés. [b] [9]
Los daños marítimos son avería gruesa , que corre a cargo únicamente del propietario del bien dañado, o avería gruesa , donde el propietario puede reclamar una contribución proporcional de todas las partes del negocio marítimo. El tipo de cálculo utilizado para ajustar el promedio general dio lugar al uso de "promedio" para referirse a "media aritmética".
Un segundo uso en inglés, documentado ya en 1674 y a veces escrito "averish", es como residuo y segundo crecimiento de cultivos extensivos, que se consideraban aptos para el consumo de animales de tiro ("avers"). [10]
Existe un uso anterior (al menos del siglo XI) no relacionado de la palabra. Parece ser un término legal antiguo para la obligación de jornalero de un inquilino hacia un sheriff, probablemente en inglés de "avera" que se encuentra en el Domesday Book inglés (1085).
El Oxford English Dictionary, sin embargo, dice que las derivaciones del alemán hafen Haven y del árabe ʿawâr pérdida, daño, han sido "bastante eliminadas" y que la palabra tiene un origen romance. [11]
Debido a la naturaleza coloquial antes mencionada del término "promedio", el término puede usarse para ofuscar el verdadero significado de los datos y sugerir diferentes respuestas a las preguntas según el método de promediado (con mayor frecuencia media aritmética, mediana o moda) utilizado. En su artículo "Framed for Lying: Statistics as In/Artistic Proof", Daniel Libertz, miembro de la facultad de la Universidad de Pittsburgh, comenta que la información estadística con frecuencia se descarta de los argumentos retóricos por este motivo. [12] Sin embargo, debido a su poder de persuasión, los promedios y otros valores estadísticos no deben descartarse por completo, sino utilizarse e interpretarse con precaución. Libertz nos invita a involucrarnos críticamente no sólo con la información estadística como los promedios, sino también con el lenguaje utilizado para describir los datos y sus usos, diciendo: "Si las estadísticas dependen de la interpretación, los oradores deberían invitar a su audiencia a interpretar en lugar de insistir en una interpretación." [12] En muchos casos, se proporcionan datos y cálculos específicos para ayudar a facilitar esta interpretación basada en la audiencia.