Generalización de medios
En matemáticas y estadística , la media cuasi aritmética o media f generalizada o media de Kolmogorov-Nagumo-de Finetti [1] es una generalización de las medias más familiares , como la media aritmética y la media geométrica , utilizando una función . También se le llama media de Kolmogorov en honor al matemático soviético Andrey Kolmogorov . Es una generalización más amplia que la media generalizada regular .![{\displaystyle f}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Definición
Si f es una función que asigna un intervalo de la recta real a los números reales , y es continua e inyectiva , la media f de los números
se define como , que también se puede escribir ![{\displaystyle I}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle n}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle x_{1},\dots,x_{n}\en I}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle M_{f}(x_{1},\dots ,x_{n})=f^{-1}\left({\frac {f(x_{1})+\cdots +f(x_{ n})}{n}}\derecha)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle M_{f}({\vec {x}})=f^{-1}\left({\frac {1}{n}}\sum _{k=1}^{n}f( x_ {k}) \ derecha)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Requerimos que f sea inyectiva para que exista la función inversa . Dado que se define en un intervalo, se encuentra dentro del dominio de .![{\displaystyle f^{-1}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle f}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle {\frac {f(x_{1})+\cdots +f(x_{n})}{n}}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle f^{-1}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Dado que f es inyectiva y continua, se deduce que f es una función estrictamente monótona y, por lo tanto, que la f -media no es mayor que el número más grande de la tupla ni menor que el número más pequeño en .![{\displaystyle x}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle x}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Ejemplos
- Si = ℝ, la recta real , y , (o incluso cualquier función lineal , no igual a 0), entonces la media f corresponde a la media aritmética .
![{\displaystyle I}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle f(x)=x}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle x\mapsto a\cdot x+b}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle a}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
- Si = ℝ + , los números reales positivos y , entonces la media f corresponde a la media geométrica . Según las propiedades de f -media, el resultado no depende de la base del logaritmo siempre que sea positivo y no 1.
![{\displaystyle I}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle f(x)=\log(x)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
- Si = ℝ + y , entonces la media f corresponde a la media armónica .
![{\displaystyle I}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle f(x)={\frac {1}{x}}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
- Si = ℝ + y , entonces la media f corresponde a la media en potencia con exponente .
![{\displaystyle I}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle f(x)=x^{p}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle p}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
- Si = ℝ y , entonces la media f es la media en el semianillo logarítmico , que es una versión desplazada constante de la función LogSumExp (LSE) (que es la suma logarítmica) . El corresponde a dividir por n , ya que la división logarítmica es una resta lineal. La función LogSumExp es un máximo suave : una aproximación suave a la función máxima.
![{\displaystyle I}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle f(x)=\exp(x)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle M_{f}(x_{1},\dots,x_{n})=\mathrm {LSE} (x_{1},\dots,x_{n})-\log(n)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle -\log(n)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Propiedades
Las siguientes propiedades son válidas para cualquier función única :![{\ Displaystyle M_ {f}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle f}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Simetría: el valor de no cambia si se permutan sus argumentos.![{\ Displaystyle M_ {f}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Idempotencia: para todo x , .![{\displaystyle M_{f}(x,\dots,x)=x}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Monotonicidad : es monótono en cada uno de sus argumentos (ya que es monótono ).![{\ Displaystyle M_ {f}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle f}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Continuidad : es continua en cada uno de sus argumentos (ya que es continua).![{\ Displaystyle M_ {f}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle f}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Reemplazo : Se pueden promediar subconjuntos de elementos a priori, sin alterar la media, siempre que se mantenga la multiplicidad de elementos. Con él se sostiene:![{\displaystyle m=M_{f}(x_{1},\dots,x_{k})}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle M_{f}(x_{1},\dots ,x_{k},x_{k+1},\dots ,x_{n})=M_{f}(\underbrace {m,\dots , m} _{k{\text{ veces}}},x_{k+1},\dots,x_{n})}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Partición : el cálculo de la media se puede dividir en cálculos de subbloques de igual tamaño:![{\displaystyle M_{f}(x_{1},\dots,x_{n\cdot k})=M_{f}(M_{f}(x_{1},\dots,x_{k}),M_ {f}(x_{k+1},\dots,x_{2\cdot k}),\dots,M_{f}(x_{(n-1)\cdot k+1},\dots,x_{ n\cdot k}))}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Autodistributividad : Para cualquier media cuasi aritmética de dos variables: .![{\displaystyle M}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle M(x,M(y,z))=M(M(x,y),M(x,z))}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Medialidad : Para cualquier media cuasi aritmética de dos variables: .![{\displaystyle M}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle M(M(x,y),M(z,w))=M(M(x,z),M(y,w))}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Equilibrio : Para cualquier media cuasi aritmética de dos variables: .![{\displaystyle M}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle M{\big (}M(x,M(x,y)),M(y,M(x,y)){\big )}=M(x,y)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Teorema del límite central : En condiciones de regularidad, para una muestra suficientemente grande,es aproximadamente normal. [2]
Un resultado similar está disponible para las medias de Bajraktarević, que son generalizaciones de medias cuasi aritméticas. [3]![{\displaystyle {\sqrt {n}}\{M_{f}(X_{1},\dots,X_{n})-f^{-1}(E_{f}(X_{1},\dots ,X_ {n}))\}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Invariancia de escala : la media cuasi aritmética es invariante con respecto a las compensaciones y la escala de :. ![{\displaystyle f}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \forall a\ \forall b\neq 0((\forall t\ g(t)=a+b\cdot f(t))\Rightarrow \forall x\ M_{f}(x)=M_{ g}(x)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Caracterización
Hay varios conjuntos diferentes de propiedades que caracterizan la media cuasi aritmética (es decir, cada función que satisface estas propiedades es una f -media para alguna función f ).
- La medialidad es esencialmente suficiente para caracterizar medias cuasi aritméticas. [4] : capítulo 17
- La autodistributividad es esencialmente suficiente para caracterizar medias cuasi aritméticas. [4] : capítulo 17
- Reemplazo : Kolmogorov demostró que las cinco propiedades de simetría, punto fijo, monotonicidad, continuidad y reemplazo caracterizan completamente las medias cuasi aritméticas. [5]
- Equilibrio : Un problema interesante es si esta condición (junto con las propiedades de simetría, punto fijo, monotonicidad y continuidad) implica que la media es cuasi aritmética. Georg Aumann demostró en la década de 1930 que la respuesta es no en general, [6] pero que si además se supone que es una función analítica , entonces la respuesta es positiva. [7]
![{\displaystyle M}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Homogeneidad
Las medias suelen ser homogéneas , pero para la mayoría de las funciones , la media f no lo es. De hecho, las únicas medias cuasi aritméticas homogéneas son las medias de potencia (incluida la media geométrica ); ver Hardy – Littlewood – Pólya, página 68.![{\displaystyle f}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
La propiedad de homogeneidad se puede lograr normalizando los valores de entrada por alguna media (homogénea) .![{\displaystyle C}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle M_{f,C}x=Cx\cdot f^{-1}\left({\frac {f\left({\frac {x_{1}}{Cx}}\right)+\cdots +f\left({\frac {x_{n}}{Cx}}\right)}{n}}\right)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Sin embargo, esta modificación puede violar la monotonicidad y la propiedad de partición de la media.
Generalizaciones
Considere una función estrictamente convexa de tipo Legendre . Entonces, el mapa de gradiente es globalmente invertible y la media cuasi aritmética multivariada ponderada [8] se define por , donde es un vector de peso normalizado ( por defecto para un promedio equilibrado). De la dualidad convexa, obtenemos una media cuasi aritmética dual asociada a la media cuasi aritmética . Por ejemplo, tomemos una matriz simétrica definida positiva. El par de medias cuasi-aritméticas matriciales produce la media armónica matricial:![{\displaystyle F}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \nabla F}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle M_{\nabla F}(\theta _{1},\ldots ,\theta _{n};w)={\nabla F}^{-1}\left(\sum _{i=1 }^{n}w_{i}\nabla F(\theta _ {i})\right)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle w}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle w_{i}={\frac {1}{n}}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle M_{\nabla F^{*}}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle M_{\nabla F}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle F(X)=-\log \det(X)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle X}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle M_{\nabla F}(\theta _ {1},\theta _ {2})=2(\theta _ {1}^{-1}+\theta _ {2}^{-1} )^{-1}.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Ver también
Referencias
- ^ Nielsen, Frank; Nock, Richard (junio de 2017). "Generalización de divergencias sesgadas de Jensen y divergencias de Bregman con convexidad comparativa". Cartas de procesamiento de señales IEEE . 24 (8): 2. arXiv : 1702.04877 . doi :10.1109/LSP.2017.2712195. S2CID 31899023.
- ^ de Carvalho, Miguel (2016). "Quiero decir, ¿qué quieres decir?". El estadístico estadounidense . 70 (3): 764‒776. doi :10.1080/00031305.2016.1148632. hdl : 20.500.11820/fd7a8991-69a4-4fe5-876f-abcd2957a88c . S2CID 219595024.
- ^ Barczy, M. y Burai, P. (2019). "Teoremas de límite para medias del cociente de Bajraktarević y Cauchy de variables aleatorias independientes distribuidas idénticamente". arXiv : 1909.02968 [matemáticas.PR].
- ^ ab Aczél, J.; Dhombres, JG (1989). Ecuaciones funcionales en varias variables. Con aplicaciones a las matemáticas, la teoría de la información y a las ciencias naturales y sociales. Enciclopedia de Matemáticas y sus Aplicaciones, 31 . Cambridge: Universidad de Cambridge. Prensa.
- ^ Grudkin, Antón (2019). "Caracterización de la media cuasi aritmética". Intercambio de pila matemática .
- ^ Aumann, Georg (1937). "Vollkommene Funktionalmittel und gewisse Kegelschnitteigenschaften". Journal für die reine und angewandte Mathematik . 1937 (176): 49–55. doi :10.1515/crll.1937.176.49. S2CID 115392661.
- ^ Aumann, Georg (1934). "Grundlegung der Theorie der analytischen Analytische Mittelwerte". Sitzungsberichte der Bayerischen Akademie der Wissenschaften : 45–81.
- ^ Nielsen, Frank (2023). "Más allá de las medias cuasiaritméticas escalares: promedios cuasiaritméticos y mezclas cuasiaritméticas en geometría de la información". arXiv : 2301.10980 [cs.IT].
- Andrey Kolmogorov (1930) “Sobre la noción de media”, en “Matemáticas y mecánica” (Kluwer 1991), págs.
- Andrey Kolmogorov (1930) Sur la notion de la moyenne. Atti Accad. Naz. Lincei 12, págs. 388–391.
- John Bibby (1974) "Axiomatizaciones del promedio y una mayor generalización de secuencias monótonas", Glasgow Mathematical Journal, vol. 15, págs. 63–65.
- Hardy, GH; Littlewood, JE; Pólya, G. (1952) Desigualdades. 2da ed. Universidad de Cambridge. Prensa, Cambridge, 1952.
- B. De Finetti, “Sul concetto di media”, vol. 3, pág. 36996, 1931, instituto italiano degli attuari.