En matemáticas , unimodalidad significa poseer un modo único . En términos más generales, unimodalidad significa que solo existe un único valor máximo, definido de alguna manera, de algún objeto matemático . [1]
En estadística , una distribución de probabilidad unimodal o distribución unimodal es una distribución de probabilidad que tiene un único pico. El término "moda" en este contexto se refiere a cualquier pico de la distribución, no solo a la definición estricta de moda que es habitual en estadística.
Si hay una única moda, la función de distribución se denomina "unimodal". Si tiene más modas es "bimodal" (2), "trimodal" (3), etc., o en general, "multimodal". [2] La figura 1 ilustra las distribuciones normales , que son unimodales. Otros ejemplos de distribuciones unimodales incluyen la distribución de Cauchy , la distribución t de Student , la distribución de chi-cuadrado y la distribución exponencial . Entre las distribuciones discretas, la distribución binomial y la distribución de Poisson pueden considerarse unimodales, aunque para algunos parámetros pueden tener dos valores adyacentes con la misma probabilidad.
La Figura 2 y la Figura 3 ilustran distribuciones bimodales.
También existen otras definiciones de unimodalidad en funciones de distribución.
En distribuciones continuas, la unimodalidad se puede definir a través del comportamiento de la función de distribución acumulativa (cdf). [3] Si la cdf es convexa para x < m y cóncava para x > m , entonces la distribución es unimodal, siendo m la moda. Nótese que bajo esta definición la distribución uniforme es unimodal, [4] así como cualquier otra distribución en la que la distribución máxima se logra para un rango de valores, por ejemplo la distribución trapezoidal. Usualmente esta definición permite una discontinuidad en la moda; usualmente en una distribución continua la probabilidad de cualquier valor individual es cero, mientras que esta definición permite una probabilidad distinta de cero, o un "átomo de probabilidad", en la moda.
Los criterios de unimodalidad también se pueden definir a través de la función característica de la distribución [3] o a través de su transformada de Laplace-Stieltjes . [5]
Otra forma de definir una distribución discreta unimodal es por la ocurrencia de cambios de signo en la secuencia de diferencias de las probabilidades. [6] Una distribución discreta con una función de masa de probabilidad , , se llama unimodal si la secuencia tiene exactamente un cambio de signo (cuando los ceros no cuentan).
Una de las razones de la importancia de la distribución unimodal es que permite obtener varios resultados importantes. A continuación se presentan varias desigualdades que solo son válidas para distribuciones unimodales. Por lo tanto, es importante evaluar si un conjunto de datos determinado proviene o no de una distribución unimodal. En el artículo sobre distribución multimodal se ofrecen varias pruebas de unimodalidad .
Un primer resultado importante es la desigualdad de Gauss . [7] La desigualdad de Gauss proporciona un límite superior a la probabilidad de que un valor se encuentre a una distancia mayor que cualquier distancia dada de su moda. Esta desigualdad depende de la unimodalidad.
Una segunda desigualdad es la desigualdad de Vysochanskiï–Petunin , [8] un refinamiento de la desigualdad de Chebyshev . La desigualdad de Chebyshev garantiza que en cualquier distribución de probabilidad, "casi todos" los valores están "cerca" del valor medio. La desigualdad de Vysochanskiï–Petunin refina esto a valores aún más cercanos, siempre que la función de distribución sea continua y unimodal. Sellke y Sellke mostraron resultados adicionales. [9]
Gauss también demostró en 1823 que para una distribución unimodal [10]
y
donde la mediana es ν , la media es μ y ω es la desviación cuadrática media de la moda.
Se puede demostrar para una distribución unimodal que la mediana ν y la media μ se encuentran dentro de (3/5) 1/2 ≈ 0,7746 desviaciones estándar entre sí. [11] En símbolos,
donde | . | es el valor absoluto .
En 2020, Bernard, Kazzi y Vanduffel generalizaron la desigualdad anterior al derivar la distancia máxima entre el promedio cuantil simétrico y la media, [12]
Cabe señalar que la distancia máxima se minimiza en (es decir, cuando el promedio cuantil simétrico es igual a ), lo que de hecho motiva la elección común de la mediana como un estimador robusto para la media. Además, cuando , el límite es igual a , que es la distancia máxima entre la mediana y la media de una distribución unimodal.
Una relación similar existe entre la mediana y la moda θ : se encuentran dentro de 3 1/2 ≈ 1,732 desviaciones estándar una de otra:
También se puede demostrar que la media y la moda se encuentran dentro de 3 1/2 entre sí:
Rohatgi y Szekely afirmaron que la asimetría y la curtosis de una distribución unimodal están relacionadas por la desigualdad: [13]
donde κ es la curtosis y γ es la asimetría. Klaassen, Mokveld y van Es demostraron que esto solo se aplica en ciertos contextos, como el conjunto de distribuciones unimodales donde la moda y la media coinciden. [14]
Derivaron una desigualdad más débil que se aplica a todas las distribuciones unimodales: [14]
Este límite es preciso, ya que se alcanza mediante la mezcla de pesos iguales de la distribución uniforme en [0,1] y la distribución discreta en {0}.
Como el término "modal" se aplica a conjuntos de datos y distribuciones de probabilidad, y no en general a funciones , las definiciones anteriores no se aplican. La definición de "unimodal" se amplió también a funciones de números reales .
Una definición común es la siguiente: una función f ( x ) es una función unimodal si, para algún valor m , es monótonamente creciente para x ≤ m y monótonamente decreciente para x ≥ m . En ese caso, el valor máximo de f ( x ) es f ( m ) y no hay otros máximos locales.
Demostrar la unimodalidad es a menudo difícil. Una manera de hacerlo consiste en utilizar la definición de esa propiedad, pero resulta ser adecuada sólo para funciones simples. Existe un método general basado en derivadas [15] , pero no funciona para todas las funciones a pesar de su simplicidad.
Los ejemplos de funciones unimodales incluyen funciones polinomiales cuadráticas con un coeficiente cuadrático negativo, funciones de mapa de tiendas y más.
Lo anterior a veces se relaciona con:Unimodalidad fuerte , del hecho de que la monotonía implícita esmonotonía fuerte. Una funciónf(x) es unafunción débilmente unimodalsi existe un valormpara el cual es débilmente monótonamente creciente parax ≤ my débilmente monótonamente decreciente parax ≥ m. En ese caso, el valor máximof(m) se puede alcanzar para un rango continuo de valores dex. Un ejemplo de una función débilmente unimodal que no es fuertemente unimodal es cada dos filas enel triángulo de Pascal.
Dependiendo del contexto, la función unimodal también puede referirse a una función que tiene solo un mínimo local, en lugar de un máximo. [16] Por ejemplo, el muestreo unimodal local , un método para realizar optimización numérica, a menudo se demuestra con una función de este tipo. Se puede decir que una función unimodal bajo esta extensión es una función con un único extremo local .
Una propiedad importante de las funciones unimodales es que el extremo se puede encontrar utilizando algoritmos de búsqueda como la búsqueda de sección áurea , la búsqueda ternaria o la interpolación parabólica sucesiva . [17]
Una función f ( x ) es "S-unimodal" (a menudo denominada "mapa S-unimodal") si su derivada de Schwarz es negativa para todo , donde es el punto crítico. [18]
En geometría computacional, si una función es unimodal, permite el diseño de algoritmos eficientes para encontrar los extremos de la función. [19]
Una definición más general, aplicable a una función f ( X ) de una variable vectorial X es que f es unimodal si existe una función diferenciable biunívoca X = G ( Z ) tal que f ( G ( Z )) sea convexa. Por lo general, se desearía que G ( Z ) sea continuamente diferenciable con una matriz jacobiana no singular.
Las funciones cuasiconvexas y cuasiconcavas extienden el concepto de unimodalidad a funciones cuyos argumentos pertenecen a espacios euclidianos de dimensiones superiores .