stringtranslate.com

Distribución multimodal

Figura 1. Una distribución bimodal simple, en este caso una mezcla de dos distribuciones normales con la misma varianza pero medias diferentes. La figura muestra la función de densidad de probabilidad (fdp), que es un promedio igualmente ponderado de las fdp en forma de campana de las dos distribuciones normales. Si los pesos no fueran iguales, la distribución resultante aún podría ser bimodal pero con picos de diferentes alturas.
Figura 2. Una distribución bimodal.
Figura 3. Distribución multimodal bivariada
Un gráfico 3D de una distribución de probabilidad. Se ondula y gira en espiral alejándose del origen, con solo un máximo local cerca del origen.
Figura 4. Un no ejemplo: una distribución unimodal , que se volvería multimodal si estuviera condicionada por x o y.

En estadística , una distribución multimodal es una distribución de probabilidad con más de una moda (es decir, más de un pico local de la distribución). Estos aparecen como picos distintos (máximos locales) en la función de densidad de probabilidad , como se muestra en las Figuras 1 y 2. Todos los datos categóricos, continuos y discretos pueden formar distribuciones multimodales. Entre los análisis univariados, las distribuciones multimodales suelen ser bimodales. [ cita necesaria ]

Terminología

Cuando los dos modos son desiguales, el modo mayor se conoce como modo mayor y el otro como modo menor. El valor menos frecuente entre los modos se conoce como antimodo. La diferencia entre los modos mayor y menor se conoce como amplitud . En las series temporales, el modo mayor se denomina acrofase y el antimodo batifase. [ cita necesaria ]

clasificación de galtung

Galtung introdujo un sistema de clasificación (AJUS) para distribuciones: [1]

Desde entonces, esta clasificación se ha modificado ligeramente:

Bajo esta clasificación las distribuciones bimodales se clasifican como tipo S o U.

Ejemplos

Las distribuciones bimodales ocurren tanto en matemáticas como en ciencias naturales.

Distribuciones de probabilidad

Las distribuciones bimodales importantes incluyen la distribución arcoseno y la distribución beta (si ambos parámetros a y b son menores que 1). Otros incluyen la distribución U-cuadrática .

La proporción de dos distribuciones normales también se distribuye bimodalmente. Dejar

donde a y b son constantes y x e y se distribuyen como variables normales con una media de 0 y una desviación estándar de 1. R tiene una densidad conocida que puede expresarse como una función hipergeométrica confluente . [2]

La distribución del recíproco de una variable aleatoria distribuida t es bimodal cuando los grados de libertad son más de uno. De manera similar, el recíproco de una variable distribuida normalmente también se distribuye bimodalmente.

Una estadística t generada a partir de un conjunto de datos extraídos de una distribución de Cauchy es bimodal. [3]

Ocurrencias en la naturaleza

Ejemplos de variables con distribuciones bimodales incluyen el tiempo entre erupciones de ciertos géiseres , el color de las galaxias , el tamaño de las hormigas tejedoras obreras , la edad de incidencia del linfoma de Hodgkin , la velocidad de inactivación del fármaco isoniazida en adultos estadounidenses, la magnitud absoluta de novas y los patrones de actividad circadiana de aquellos animales crepusculares que están activos tanto en el crepúsculo matutino como vespertino. En la ciencia pesquera, las distribuciones de tallas multimodales reflejan las diferentes clases de años y, por lo tanto, pueden usarse para estimaciones de distribución de edades y crecimiento de la población de peces. [4] Los sedimentos suelen distribuirse de forma bimodal. Al muestrear galerías mineras que cruzan la roca huésped y las vetas mineralizadas, la distribución de variables geoquímicas sería bimodal. Las distribuciones bimodales también se observan en el análisis del tráfico, donde el tráfico alcanza su punto máximo durante la hora pico de la mañana y luego nuevamente en la hora pico de la tarde. Este fenómeno también se observa en la distribución diaria de agua, ya que la demanda de agua, en forma de duchas, cocina y uso del baño, generalmente alcanza su punto máximo en los períodos de la mañana y la tarde.

Econometría

En los modelos econométricos , los parámetros pueden distribuirse bimodalmente. [5]

Orígenes

Matemático

Una distribución bimodal surge comúnmente como una mezcla de dos distribuciones unimodales diferentes (es decir, distribuciones que tienen una sola moda). En otras palabras, la variable aleatoria X distribuida bimodalmente se define como con probabilidad o con probabilidad donde Y y Z son variables aleatorias unimodales y es un coeficiente de mezcla.

Las mezclas con dos componentes distintos no necesitan ser bimodales y las mezclas de dos componentes con densidades de componentes unimodales pueden tener más de dos modas. No existe una conexión inmediata entre el número de componentes de una mezcla y el número de modos de la densidad resultante.

Distribuciones particulares

Las distribuciones bimodales, a pesar de su frecuente aparición en conjuntos de datos, rara vez se han estudiado [ cita necesaria ] . Esto puede deberse a las dificultades para estimar sus parámetros ya sea con métodos frecuentistas o bayesianos. Entre los que se han estudiado se encuentran

La bimodalidad también surge naturalmente en la distribución de catástrofes cúspide .

Biología

En biología se sabe que cinco factores contribuyen a las distribuciones bimodales de tamaños de población [ cita necesaria ] :

La distribución bimodal del tamaño de las obreras de las hormigas tejedoras surge debido a la existencia de dos clases distintas de obreras, a saber, las obreras mayores y las obreras menores. [10]

La distribución de los efectos de aptitud de las mutaciones tanto para genomas completos [11] [12] como para genes individuales [13] también suele ser bimodal, siendo la mayoría de las mutaciones neutrales o letales y relativamente pocas tienen efectos intermedios.

Propiedades generales

Una mezcla de dos distribuciones unimodales con medias diferentes no es necesariamente bimodal. La distribución combinada de alturas de hombres y mujeres se utiliza a veces como ejemplo de distribución bimodal, pero en realidad la diferencia en las alturas medias de hombres y mujeres es demasiado pequeña en relación con sus desviaciones estándar para producir bimodalidad cuando se combinan las dos curvas de distribución. . [14]

Las distribuciones bimodales tienen la propiedad peculiar de que, a diferencia de las distribuciones unimodales, la media puede ser un estimador muestral más robusto que la mediana. [15] Este es claramente el caso cuando la distribución tiene forma de U como la distribución arcoseno. Puede que no sea cierto cuando la distribución tiene una o más colas largas.

Momentos de mezclas

Dejar

donde g i es una distribución de probabilidad y p es el parámetro de mezcla.

Los momentos de f ( x ) son [16]

dónde

y Si y Ki son la asimetría y la curtosis de la i- ésima distribución .

Mezcla de dos distribuciones normales.

No es raro encontrar situaciones en las que un investigador crea que los datos provienen de una combinación de dos distribuciones normales. Por este motivo, esta mezcla ha sido estudiada con cierto detalle. [17]

Una mezcla de dos distribuciones normales tiene cinco parámetros para estimar: las dos medias, las dos varianzas y el parámetro de mezcla. Una mezcla de dos distribuciones normales con desviaciones estándar iguales es bimodal sólo si sus medias difieren al menos en el doble de la desviación estándar común. [14] Las estimaciones de los parámetros se simplifican si se puede suponer que las varianzas son iguales (el caso homocedástico ).

Si las medias de las dos distribuciones normales son iguales, entonces la distribución combinada es unimodal. Eisenberger derivó las condiciones para la unimodalidad de la distribución combinada. [18] Ray y Lindsay han identificado las condiciones necesarias y suficientes para que una mezcla de distribuciones normales sea bimodal. [19]

Una mezcla de dos distribuciones normales de masa aproximadamente iguales tiene una curtosis negativa ya que los dos modos a cada lado del centro de masa reducen efectivamente las colas de la distribución.

Una mezcla de dos distribuciones normales con masa muy desigual tiene una curtosis positiva ya que la distribución más pequeña alarga la cola de la distribución normal más dominante.

Las mezclas de otras distribuciones requieren la estimación de parámetros adicionales.

Pruebas de unimodalidad

Resumen estadístico

Las distribuciones bimodales son un ejemplo comúnmente utilizado de cómo las estadísticas resumidas como la media , la mediana y la desviación estándar pueden ser engañosas cuando se usan en una distribución arbitraria. Por ejemplo, en la distribución de la Figura 1, la media y la mediana serían aproximadamente cero, aunque cero no es un valor típico. La desviación estándar también es mayor que la desviación de cada distribución normal.

Aunque se han sugerido varios, actualmente no existe una estadística resumida (o un conjunto de estadísticas) generalmente aceptada para cuantificar los parámetros de una distribución bimodal general. Para una mezcla de dos distribuciones normales, se suelen utilizar las medias y las desviaciones estándar junto con el parámetro de mezcla (el peso de la combinación): un total de cinco parámetros.

D de Ashman

Una estadística que puede resultar útil es la D de Ashman: [22]

donde μ 1 , μ 2 son las medias y σ 1 , σ 2 son las desviaciones estándar.

Para una mezcla de dos distribuciones normales, se requiere D > 2 para una separación limpia de las distribuciones.

La de van der Eijk

Esta medida es un promedio ponderado del grado de acuerdo con la distribución de frecuencias. [23] A oscila entre -1 ( bimodalidad perfecta ) y +1 ( unimodalidad perfecta ). Se define como

donde U es la unimodalidad de la distribución, S el número de categorías que tienen frecuencias distintas de cero y K el número total de categorías.

El valor de U es 1 si la distribución tiene alguna de las tres características siguientes:

Con distribuciones distintas a estas, los datos deben dividirse en "capas". Dentro de una capa las respuestas son iguales o cero. Las categorías no tienen por qué ser contiguas. Se calcula un valor de A para cada capa ( A i ) y se determina un promedio ponderado para la distribución. Los pesos ( wi ) para cada capa son el número de respuestas en esa capa. En simbolos

Una distribución uniforme tiene A = 0: cuando todas las respuestas caen en una categoría A = +1.

Un problema teórico con este índice es que supone que los intervalos están igualmente espaciados. Esto puede limitar su aplicabilidad.

Separación bimodal

Este índice supone que la distribución es una mezcla de dos distribuciones normales con medias ( μ 1 y μ 2 ) y desviaciones estándar ( σ 1 y σ 2 ): [24]

Coeficiente de bimodalidad

El coeficiente de bimodalidad b de Sarle es [25]

donde γ es la asimetría y κ es la curtosis . La curtosis se define aquí como el cuarto momento estandarizado alrededor de la media. El valor de b se encuentra entre 0 y 1. [26] La lógica detrás de este coeficiente es que una distribución bimodal con colas claras tendrá una curtosis muy baja, un carácter asimétrico o ambos, todo lo cual aumenta este coeficiente.

La fórmula para una muestra finita es [27]

donde n es el número de elementos de la muestra, g es la asimetría de la muestra y k es el exceso de curtosis de la muestra .

El valor de b para la distribución uniforme es 5/9. Este es también su valor para la distribución exponencial . Los valores superiores a 5/9 pueden indicar una distribución bimodal o multimodal, aunque los valores correspondientes también pueden dar lugar a distribuciones unimodales muy sesgadas. [28] El valor máximo (1,0) se alcanza únicamente mediante una distribución de Bernoulli con sólo dos valores distintos o la suma de dos funciones delta de Dirac diferentes (una distribución bi-delta).

Se desconoce la distribución de esta estadística. Está relacionado con una estadística propuesta anteriormente por Pearson: la diferencia entre la curtosis y el cuadrado de la asimetría ( ver más abajo ).

Amplitud de bimodalidad

Esto se define como [24]

donde A 1 es la amplitud del pico más pequeño y A an es la amplitud del antimodo.

A B es siempre < 1. Los valores más grandes indican picos más distintos.

relación bimodal

Esta es la proporción de los picos izquierdo y derecho. [24] Matemáticamente

donde Al y Ar son las amplitudes de los picos izquierdo y derecho respectivamente .

Parámetro de bimodalidad

Este parámetro ( B ) se debe a Wilcock. [29]

donde Al y Ar son las amplitudes de los picos izquierdo y derecho respectivamente y Pi es el logaritmo llevado a la base 2 de la proporción de la distribución en el iésimo intervalo . El valor máximo de ΣP es 1 pero el valor de B puede ser mayor que este.

Para utilizar este índice se toma el log de los valores. Luego, los datos se dividen en intervalos de ancho Φ cuyo valor es log 2. Se considera que el ancho de los picos es cuatro veces 1/4 Φ centrado en sus valores máximos.

Índices de bimodalidad

índice de Wang

El índice de bimodalidad propuesto por Wang et al supone que la distribución es una suma de dos distribuciones normales con varianzas iguales pero medias diferentes. [30] Se define de la siguiente manera:

donde μ 1 , μ 2 son las medias y σ es la desviación estándar común.

donde p es el parámetro de mezcla.

índice de sturrock

Sturrock ha propuesto un índice de bimodalidad diferente. [31]

Este índice ( B ) se define como

Cuando m = 2 y γ está distribuido uniformemente, B está distribuido exponencialmente. [32]

Esta estadística es una forma de periodograma . Adolece de los problemas habituales de estimación y fuga espectral comunes a esta forma de estadística.

Índice de Michele y Accatino

De Michele y Accatino han propuesto otro índice de bimodalidad. [33] Su índice ( B ) es

donde μ es la media aritmética de la muestra y

donde m i es el número de puntos de datos en el i ésimo contenedor, xi es el centro del i ésimo contenedor y L es el número de contenedores.

Los autores sugirieron un valor de corte de 0,1 para B para distinguir entre una distribución bimodal ( B > 0,1) y unimodal ( B < 0,1). No se ofreció ninguna justificación estadística para este valor.

Índice de Sambrook Smith

Sambrook Smith et al [34] propusieron otro índice ( B ).

donde p 1 y p 2 son la proporción contenida en el modo primario (el de mayor amplitud) y secundario (el de menor amplitud) y φ 1 y φ 2 son los φ -tamaños del modo primario y secundario. El tamaño φ se define como menos uno por el registro del tamaño de los datos llevado a la base 2. Esta transformación se usa comúnmente en el estudio de sedimentos.

Los autores recomendaron un valor de corte de 1,5, siendo B mayor que 1,5 para una distribución bimodal y menor que 1,5 para una distribución unimodal. No se proporcionó ninguna justificación estadística para este valor.

El método de Otsu

El método de Otsu para encontrar un umbral de separación entre dos modos se basa en minimizar la cantidad

n ii- ésimaσ i 2i -ésimamσ 2procesamiento de imágenes digitales[35]

Pruebas estadísticas

Hay varias pruebas disponibles para determinar si un conjunto de datos se distribuye de forma bimodal (o multimodal).

Métodos gráficos

En el estudio de sedimentos, el tamaño de las partículas es frecuentemente bimodal. Empíricamente, se ha encontrado útil trazar la frecuencia frente al log (tamaño) de las partículas. [36] [37] Esto generalmente proporciona una separación clara de las partículas en una distribución bimodal. En aplicaciones geológicas, el logaritmo normalmente se toma en base 2. Los valores logarítmicos transformados se denominan unidades phi (Φ). Este sistema se conoce como escala de Krumbein (o phi).

Un método alternativo es trazar el logaritmo del tamaño de partícula frente a la frecuencia acumulada. Este gráfico normalmente constará de dos líneas razonablemente rectas con una línea de conexión correspondiente al antimodo.

Estadísticas

A partir de los gráficos se pueden obtener valores aproximados para varias estadísticas. [36]

donde Mean es la media, StdDev es la desviación estándar, Skew es la asimetría, Kurt es la curtosis y φ x es el valor de la variable φ en el xésimo porcentaje de la distribución.

Distribución unimodal versus bimodal

Pearson en 1894 fue el primero en idear un procedimiento para probar si una distribución podía resolverse en dos distribuciones normales. [38] Este método requería la solución de un polinomio de noveno orden . En un artículo posterior, Pearson informó que para cualquier asimetría de distribución 2 + 1 <kurtosis. [26] Más tarde, Pearson demostró que [39]

donde b 2 es la curtosis y b 1 es el cuadrado de la asimetría. La igualdad es válida sólo para la distribución de Bernoulli de dos puntos o la suma de dos funciones delta de Dirac diferentes . Estos son los casos más extremos de bimodalidad posibles. La curtosis en ambos casos es 1. Como ambos son simétricos, su asimetría es 0 y la diferencia es 1.

Baker propuso una transformación para convertir una distribución bimodal en unimodal. [40]

Se han propuesto varias pruebas de unimodalidad versus bimodalidad: Haldane sugirió una basada en segundas diferencias centrales. [41] Larkin introdujo más tarde una prueba basada en la prueba F; [42] Benett creó uno basado en la prueba G de Fisher . [43] Tokeshi ha propuesto una cuarta prueba. [44] [45] Holzmann y Vollmer propusieron una prueba basada en una relación de verosimilitud. [20]

Se ha propuesto un método basado en la puntuación y las pruebas de Wald. [46] Este método puede distinguir entre distribuciones unimodales y bimodales cuando se conocen las distribuciones subyacentes.

Pruebas antimodo

Se conocen pruebas estadísticas para el antimodo. [47]

El método de Otsu

El método de Otsu se emplea comúnmente en gráficos por computadora para determinar la separación óptima entre dos distribuciones.

Pruebas generales

Para probar si una distribución no es unimodal, se han ideado varias pruebas adicionales: la prueba de ancho de banda, [48] la prueba de inmersión, [49] la prueba de exceso de masa, [50] la prueba MAP, [51] la prueba de existencia de modo , [52] la prueba de runt, [53] [54] la prueba de extensión, [55] y la prueba de silla de montar.

Está disponible una implementación de la prueba de inmersión para el lenguaje de programación R. [56] Los valores p para los valores de la estadística de caída oscilan entre 0 y 1. Los valores p inferiores a 0,05 indican una multimodalidad significativa y los valores p superiores a 0,05 pero inferiores a 0,10 sugieren una multimodalidad con significación marginal. [57]

prueba de silverman

Silverman introdujo un método de arranque para el número de modos. [48] ​​La prueba utiliza un ancho de banda fijo que reduce la potencia de la prueba y su interpretabilidad. Las densidades insuficientemente suavizadas pueden tener un número excesivo de modos cuyo recuento durante el arranque es inestable.

Prueba de Bajgier-Aggarwal

Bajgier y Aggarwal han propuesto una prueba basada en la curtosis de la distribución. [58]

Casos especiales

Hay pruebas adicionales disponibles para una serie de casos especiales:

Mezcla de dos distribuciones normales.

Un estudio de una densidad de mezcla de datos de dos distribuciones normales encontró que la separación en las dos distribuciones normales era difícil a menos que las medias estuvieran separadas por 4 a 6 desviaciones estándar. [59]

En astronomía, el algoritmo Kernel Mean Matching se utiliza para decidir si un conjunto de datos pertenece a una única distribución normal o a una mezcla de dos distribuciones normales.

Distribución beta normal

Esta distribución es bimodal para ciertos valores de sus parámetros. Se ha descrito una prueba para estos valores. [60]

Estimación de parámetros y ajuste de curvas.

Suponiendo que se sabe que la distribución es bimodal o se ha demostrado que es bimodal mediante una o más de las pruebas anteriores, con frecuencia es deseable ajustar una curva a los datos. Esto puede resultar difícil.

Los métodos bayesianos pueden resultar útiles en casos difíciles.

Software

Dos distribuciones normales

Hay disponible un paquete para R para realizar pruebas de bimodalidad. [61] Este paquete supone que los datos se distribuyen como una suma de dos distribuciones normales. Si esta suposición no es correcta, los resultados pueden no ser confiables. También incluye funciones para ajustar una suma de dos distribuciones normales a los datos.

Suponiendo que la distribución es una mezcla de dos distribuciones normales, entonces se puede utilizar el algoritmo de maximización de expectativas para determinar los parámetros. Hay varios programas disponibles para esto, incluido Cluster, [62] y el paquete R nor1mix. [63]

Otras distribuciones

El paquete mixtools disponible para R puede probar y estimar los parámetros de varias distribuciones diferentes. [64] Está disponible un paquete para una mezcla de dos distribuciones gamma de cola derecha. [sesenta y cinco]

Hay varios otros paquetes para R disponibles para adaptarse a modelos mixtos; estos incluyen flexmix, [66] mcclust, [67] agrmt, [68] y mixdist. [69]

El lenguaje de programación estadística SAS también puede adaptarse a una variedad de distribuciones mixtas con el procedimiento PROC FREQ.

Número de corredores en un parque por hora del día (X en horas) en una distribución de probabilidad bimodal

En Python, el paquete Scikit-learn contiene una herramienta para modelado de mezclas [70]

Aplicación de software de ejemplo

El programa CumFreqA [71] para el ajuste de distribuciones de probabilidad compuestas a un conjunto de datos (X) puede dividir el conjunto en dos partes con una distribución diferente. La figura muestra un ejemplo de una distribución de Gumbel reflejada generalizada doble como en el ajuste de distribución con ecuaciones de función de distribución acumulativa (CDF):

X < 8,10 : CDF = 1 - exp[-exp{-(0,092X ^ 0,01+935)}]X > 8,10 : CDF = 1 - exp[-exp{-(-0,0039X ^ 2,79+1,05)}]

Ver también

Referencias

  1. ^ Galtung, J. (1969). Teoría y métodos de la investigación social . Oslo: Universitetsforlaget. ISBN 0-04-300017-7.
  2. ^ Fieller E (1932). "La distribución del índice en una población bivariada normal". Biometrika . 24 (3–4): 428–440. doi :10.1093/biomet/24.3-4.428.
  3. ^ Fiorio, CV; HajivassILiou, VA; Phillips, PCB (2010). "Ratios t bimodales: el impacto de las colas gruesas en la inferencia". La revista de econometría . 13 (2): 271–289. doi :10.1111/j.1368-423X.2010.00315.x. S2CID  363740.
  4. ^ Introducción a la evaluación de poblaciones de peces tropicales.
  5. ^ Phillips, PCB (2006). "Un comentario sobre la bimodalidad y la instrumentación débil en la estimación de ecuaciones estructurales" (PDF) . Teoría econométrica . 22 (5): 947–960. doi :10.1017/S0266466606060439. S2CID  16775883.
  6. ^ Hassan, MI; Hijazi, RH (2010). "Una distribución de potencia exponencial bimodal". Revista de Estadísticas de Pakistán . 26 (2): 379–396.
  7. ^ Elal-Olivero, D (2010). "Distribución normal sesgada alfa". Revista Proyecciones de Matemáticas . 29 (3): 224–240. doi : 10.4067/s0716-09172010000300006 .
  8. ^ Hassan, MI; El-Bassiouni, MI (2016). "Distribución normal bimodal sesgada-simétrica". Comunicaciones en Estadística - Teoría y Métodos . 45 (5): 1527-1541. doi :10.1080/03610926.2014.882950. S2CID  124087015.
  9. ^ Bosea, S.; Shmuelib, G.; Sura, P.; Dubey, P. (2013). "Ajuste de mezclas Com-Poisson a datos de recuento bimodal" (PDF) . Actas de la Conferencia Internacional sobre Información, Gestión de Operaciones y Estadísticas de 2013 (ICIOMS2013), Kuala Lumpur, Malasia . págs. 1–8.
  10. ^ Weber, NA (1946). "Dimorfismo en la obrera africana de Oecophylla y una anomalía (Hym.: Formicidae)" (PDF) . Anales de la Sociedad Entomológica de América . 39 : 7–10. doi :10.1093/aesa/39.1.7.
  11. Sanjuán, R (27 de junio de 2010). "Efectos de aptitud mutacional en virus de ARN y ADN monocatenario: patrones comunes revelados por estudios de mutagénesis dirigida al sitio". Transacciones filosóficas de la Royal Society de Londres B: Ciencias biológicas . 365 (1548): 1975–82. doi :10.1098/rstb.2010.0063. PMC 2880115 . PMID  20478892. 
  12. ^ Eyre-Walker, A; Keightley, PD (agosto de 2007). "La distribución de los efectos de aptitud de nuevas mutaciones". Naturaleza Reseñas Genética . 8 (8): 610–8. doi :10.1038/nrg2146. PMID  17637733. S2CID  10868777.
  13. ^ Hietpas, RT; Jensen, JD; Bolon, DN (10 de mayo de 2011). "Iluminación experimental de un paisaje fitness". Actas de la Academia Nacional de Ciencias de los Estados Unidos de América . 108 (19): 7896–901. Código bibliográfico : 2011PNAS..108.7896H. doi : 10.1073/pnas.1016024108 . PMC 3093508 . PMID  21464309. 
  14. ^ abc Chelín, Mark F.; Watkins, Ann E .; Watkins, William (2002). "¿Es la altura humana bimodal?". El estadístico estadounidense . 56 (3): 223–229. doi :10.1198/00031300265. S2CID  53495657.
  15. ^ Mosteller, F.; Tukey, JW (1977). Análisis de datos y regresión: un segundo curso de estadística . Lectura, Misa: Addison-Wesley. ISBN 0-201-04854-X.
  16. ^ Kim, TH; Blanco, H. (2003). "Sobre una estimación más sólida de asimetría y curtosis: simulación y aplicación al índice S & P 500".
  17. ^ Robertson, California; Freidora, JG (1969). "Algunas propiedades descriptivas de mezclas normales". Skandinavisk Aktuarietídskrift . 69 (3–4): 137–146. doi :10.1080/03461238.1969.10404590.
  18. ^ Eisenberger, yo (1964). "Génesis de distribuciones bimodales". Tecnometría . 6 (4): 357–363. doi :10.1080/00401706.1964.10490199.
  19. ^ Rayo, S; Lindsay, BG (2005). "La topografía de mezclas normales multivariadas". Anales de Estadística . 33 (5): 2042-2065. arXiv : matemáticas/0602238 . doi :10.1214/009053605000000417. S2CID  36234163.
  20. ^ ab Holzmann, Hajo; Vollmer, Sebastián (2008). "Una prueba de razón de probabilidad para la bimodalidad en mezclas de dos componentes con aplicación a la distribución regional del ingreso en la UE". Avances de AStA en análisis estadístico . 2 (1): 57–69. doi :10.1007/s10182-008-0057-2. S2CID  14470055.
  21. ^ ab Behboodian, J (1970). "Sobre las modas de una mezcla de dos distribuciones normales". Tecnometría . 12 (1): 131-139. doi :10.2307/1267357. JSTOR  1267357.
  22. ^ Ashman KM; Pájaro CM; Zepf SE (1994). "Detección de bimodalidad en conjuntos de datos astronómicos". La Revista Astronómica . 108 : 2348–2361. arXiv : astro-ph/9408030 . Código bibliográfico : 1994AJ....108.2348A. doi :10.1086/117248. S2CID  13464256.
  23. ^ Van der Eijk, C (2001). "Medición de acuerdo en escalas de calificación ordenadas". Calidad cantidad . 35 (3): 325–341. doi :10.1023/a:1010374114305. S2CID  189822180.
  24. ^ abc Zhang, C; Mapes, BE; Soden, BJ (2003). "Bimodalidad en vapor de agua tropical". Revista trimestral de la Real Sociedad Meteorológica . 129 (594): 2847–2866. Código Bib : 2003QJRMS.129.2847Z. doi :10.1256/qj.02.166. S2CID  17153773.
  25. ^ Ellison, AM (1987). "Efecto del dimorfismo de semillas sobre la dinámica densodependiente de poblaciones experimentales de Atriplex triangularis (Chenopodiaceae)". Revista americana de botánica . 74 (8): 1280–1288. doi :10.2307/2444163. JSTOR  2444163.
  26. ^ ab Pearson, K (1916). "Contribuciones matemáticas a la teoría de la evolución, XIX: Segundo suplemento de una memoria sobre variación sesgada". Transacciones filosóficas de la Royal Society A. 216 (538–548): 429–457. Código Bib : 1916RSPTA.216..429P. doi : 10.1098/rsta.1916.0009 . JSTOR  91092.
  27. ^ Instituto SAS Inc. (2012). Guía del usuario de SAS/STAT 12.1. Cary, Carolina del Norte: Autor.
  28. ^ Pfister, R; Schwarz, KA; Janczyk, M.; Dale, R; Freeman, JB (2013). "Las cosas buenas alcanzan su punto máximo en parejas: una nota sobre el coeficiente de bimodalidad". Fronteras en Psicología . 4 : 700. doi : 10.3389/fpsyg.2013.00700 . PMC 3791391 . PMID  24109465. 
  29. ^ Wilcock, PR (1993). "La tensión cortante crítica de los sedimentos naturales". Revista de Ingeniería Hidráulica . 119 (4): 491–505. doi :10.1061/(asce)0733-9429(1993)119:4(491).
  30. ^ Wang, J; Wen, S; Symmans, WF; Pusztai, L; Coombes, KR (2009). "El índice de bimodalidad: un criterio para descubrir y clasificar firmas bimodales a partir de datos de perfiles de expresión de genes de cáncer". Informática del cáncer . 7 : 199–216. doi :10.4137/CIN.S2846. PMC 2730180 . PMID  19718451. 
  31. ^ Sturrock, P (2008). "Análisis de bimodalidad en histogramas formados a partir de datos de neutrinos solares GALLEX y GNO". Física Solar . 249 (1): 1–10. arXiv : 0711.0216 . Código Bib : 2008SoPh..249....1S. doi :10.1007/s11207-008-9170-3. S2CID  118389173.
  32. ^ Scargle, JD (1982). "Estudios en análisis de series temporales astronómicas. II - Aspectos estadísticos del análisis espectral de datos espaciados desigualmente". La revista astrofísica . 263 (1): 835–853. Código bibliográfico : 1982ApJ...263..835S. doi :10.1086/160554.
  33. ^ De Michele, C; Accatino, F (2014). "Bimodalidad de la cubierta arbórea en sabanas y bosques que emerge del cambio entre dos dinámicas de incendios". MÁS UNO . 9 (3): e91195. Código Bib : 2014PLoSO...991195D. doi : 10.1371/journal.pone.0091195 . PMC 3963849 . PMID  24663432. 
  34. ^ Sambrook Smith, GH; Nicolás, AP; Ferguson, Rhode Island (1997). "Medición y definición de sedimentos bimodales: problemas e implicaciones". Investigación de recursos hídricos . 33 (5): 1179–1185. Código Bib : 1997WRR....33.1179S. doi : 10.1029/97wr00365 .
  35. ^ Chaudhuri, D; Agrawal, A (2010). "Procedimiento de división y fusión para la segmentación de imágenes mediante un enfoque de detección de bimodalidad". Revista de ciencias de la defensa . 60 (3): 290–301. doi :10.14429/dsj.60.356.
  36. ^ ab Folk, RL; Ward, WC (1957). "Barra del río Brazos: un estudio sobre la importancia de los parámetros granulométricos". Revista de investigación sedimentaria . 27 (1): 3–26. Código Bib : 1957JSedR..27....3F. doi :10.1306/74d70646-2b21-11d7-8648000102c1865d.
  37. ^ Dyer, KR (1970). "Parámetros granulométricos para gravas arenosas". Revista de investigación sedimentaria . 40 (2): 616–620. doi :10.1306/74D71FE6-2B21-11D7-8648000102C1865D.
  38. ^ Pearson, K (1894). "Contribuciones a la teoría matemática de la evolución: sobre la disección de curvas de frecuencia asimétricas". Transacciones filosóficas de la Royal Society A. 185 : 71–90. Código bibliográfico : 1894RSPTA.185...71P. doi : 10.1098/rsta.1894.0003 .
  39. ^ Pearson, K (1929). "Nota editorial". Biometrika . 21 : 370–375.
  40. ^ Panadero, GA (1930). "Transformaciones de distribuciones bimodales". Anales de estadística matemática . 1 (4): 334–344. doi : 10.1214/aoms/1177733063 .
  41. ^ Haldane, JBS (1951). "Pruebas sencillas de bimodalidad y bitangencialidad". Anales de la eugenesia . 16 (1): 359–364. doi :10.1111/j.1469-1809.1951.tb02488.x. PMID  14953132.
  42. ^ Larkin, RP (1979). "Un algoritmo para evaluar la bimodalidad frente a la unimodalidad en una distribución univariada". Instrumentación y métodos de investigación del comportamiento . 11 (4): 467–468. doi : 10.3758/BF03205709 .
  43. ^ Bennett, Carolina del Sur (1992). "Dimorfismo sexual de Pteranodon y otros pterosaurios, con comentarios sobre las crestas craneales". Revista de Paleontología de Vertebrados . 12 (4): 422–434. doi :10.1080/02724634.1992.10011472.
  44. ^ Tokeshi, M (1992). "Dinámica y distribución en comunidades animales; teoría y análisis". Investigaciones sobre Ecología de Poblaciones . 34 (2): 249–273. doi :10.1007/bf02514796. S2CID  22912914.
  45. ^ Barreto, S; Borges, PAV; Guo, Q (2003). "Un error tipográfico en la prueba de bimodalidad de Tokeshi". Ecología Global y Biogeografía . 12 (2): 173–174. doi :10.1046/j.1466-822x.2003.00018.x. hdl : 10400.3/1408 .
  46. ^ Carolan, soy; Rayner, JCW (2001). "Una muestra prueba la ubicación de modos de datos no normales". Revista de Matemáticas Aplicadas y Ciencias de la Decisión . 5 (1): 1–19. CiteSeerX 10.1.1.504.4999 . doi : 10.1155/s1173912601000013 . 
  47. ^ Hartigan, JA (2000). "Prueba de antimodos". En la Galia W; Opitz O; Schader M (eds.). Análisis de los datos . Estudios en Clasificación, Análisis de Datos y Organización del Conocimiento. Saltador. págs. 169–181. ISBN 3-540-67731-3.
  48. ^ ab Silverman, BW (1981). "Uso de estimaciones de densidad del núcleo para investigar la multimodalidad". Revista de la Royal Statistical Society, Serie B. 43 (1): 97–99. Código bibliográfico : 1981JRSSB..43...97S. doi :10.1111/j.2517-6161.1981.tb01155.x. JSTOR  2985156.
  49. ^ Hartigan, JA; Hartigan, PM (1985). "La prueba de inmersión de la unimodalidad". Anales de Estadística . 13 (1): 70–84. doi : 10.1214/aos/1176346577 .
  50. ^ Mueller, DW; Sawitzki, G (1991). "Estimaciones de exceso de masa y pruebas de multimodalidad". Revista de la Asociación Estadounidense de Estadística . 86 (415): 738–746. doi :10.1080/01621459.1991.10475103. JSTOR  2290406.
  51. ^ Rozál, GPM Hartigan JA (1994). "La prueba MAP para multimodalidad". Revista de Clasificación . 11 (1): 5–36. doi :10.1007/BF01201021. S2CID  118500771.
  52. ^ Minnotte, MC (1997). "Pruebas no paramétricas de la existencia de modos". Anales de Estadística . 25 (4): 1646-1660. doi : 10.1214/aos/1031594735 .
  53. ^ Hartigan, JA; Mohanty, S (1992). "La prueba RUNT para multimodalidad". Revista de Clasificación . 9 : 63–70. doi :10.1007/bf02618468. S2CID  121960832.
  54. ^ Andrushkiw RI; Klyushin DD; Petunin YI (2008). "Una nueva prueba de unimodalidad". Teoría de Procesos Estocásticos . 14 (1): 1–6.
  55. ^ Hartigan, JA (1988). "La prueba de amplitud de la multimodalidad". En Bock, HH (ed.). Clasificación y métodos relacionados de análisis de datos . Amsterdam: Holanda Septentrional. págs. 229-236. ISBN 0-444-70404-3.
  56. ^ Ringach, Martin Maechler (originalmente de Fortran y S.-plus de Dario; NYU.edu) (5 de diciembre de 2016). "diptest: Estadística de prueba de inmersión de Hartigan para unimodalidad - corregida" - a través de R-Packages.
  57. ^ Hombre libre; Dale (2012). "Evaluación de la bimodalidad para detectar la presencia de un proceso cognitivo dual" (PDF) . Métodos de investigación del comportamiento . 45 (1): 83–97. doi : 10.3758/s13428-012-0225-x . PMID  22806703. S2CID  14500508.
  58. ^ Bajgier SM; Aggarwal LK (1991). "Poderes de las pruebas de bondad de ajuste en la detección de distribuciones normales mixtas equilibradas". Medición Educativa y Psicológica . 51 (2): 253–269. doi :10.1177/0013164491512001. S2CID  121113601.
  59. ^ Jackson, relaciones públicas; Tucker, GT; Maderas, HF (1989). "Prueba de bimodalidad en distribuciones de frecuencia de datos que sugieren polimorfismos del metabolismo de los fármacos - prueba de hipótesis". Revista británica de farmacología clínica . 28 (6): 655–662. doi :10.1111/j.1365-2125.1989.tb03558.x. PMC 1380036 . PMID  2611088. 
  60. ^ Inc., Soluciones Avanzadas Internacionales. "Secciones y grupos de interés" (PDF) . www.amstat.org . {{cite web}}: |last=tiene nombre genérico ( ayuda )
  61. ^ "Copia archivada" (PDF) . Archivado desde el original (PDF) el 3 de noviembre de 2013 . Consultado el 1 de noviembre de 2013 .{{cite web}}: CS1 maint: archived copy as title (link)
  62. ^ "Página de inicio del clúster". ingeniería.purdue.edu .
  63. ^ Mächler, Martin (25 de agosto de 2016). "nor1mix: modelos de mezcla normales (1-d) (clases y métodos S3)" - a través de R-Packages.
  64. ^ Joven, Derek; Benaglia, Tatiana; Chauveau, Didier; Cazador, David; Elmore, Ryan; Hettmansperger, Thomas; Thomas, Hoben; Xuan, Fengjuan (10 de marzo de 2017). "mixtools: herramientas para analizar modelos de mezclas finitas" - a través de R-Packages.
  65. ^ "DiscrimART" (PDF) . cran.r-project.org . Consultado el 22 de marzo de 2018 .
  66. ^ Gruen, Bettina; Leisch, Friedrich; Sarkar, Deepayán; Mortier, Federico; Picard, Nicolas (28 de abril de 2017). "flexmix: modelado de mezclas flexibles" - a través de R-Packages.
  67. ^ Fraley, Chris; Raftery, Adrián E.; Scrucca, Luca; Murphy, Thomas Brendan; Fop, Michael (21 de mayo de 2017). "mclust: modelado de mezclas gaussianas para agrupación, clasificación y estimación de densidad basadas en modelos", a través de R-Packages.
  68. ^ Ruedin, Didier (2 de abril de 2016). "acuerdo". cran.r-project.org.
  69. ^ Macdonald, Pedro; Du, con aportes de Juan (29 de octubre de 2012). "mixdist: modelos de distribución de mezclas finitas" - a través de R-Packages.
  70. ^ "Modelos de mezcla gaussiana". scikit-learn.org . Consultado el 30 de noviembre de 2023 .
  71. ^ CumFreq, programa gratuito para ajustar distribuciones de probabilidad a un conjunto de datos. En línea: [1]