stringtranslate.com

Gráfica de bolsa

Ejemplo de un bagplot creado en R.

Un gráfico de bolsas o gráfico de estrellas [ 1] [2] es un método de estadística robusta para visualizar datos estadísticos bidimensionales o tridimensionales, análogo al gráfico de cajas unidimensional . Introducido en 1999 por Rousseuw et al., el gráfico de bolsas permite visualizar la ubicación, la dispersión, la asimetría y los valores atípicos de un conjunto de datos. [3]

Construcción

El diagrama de bolsa consta de tres polígonos anidados , llamados "bolsa", "cerca" y "bucle".

Un símbolo de asterisco (*) cerca del centro del gráfico se utiliza para marcar la mediana de profundidad, el punto con la mayor profundidad de Tukey posible. Las observaciones entre la bolsa y la cerca están marcadas por segmentos de línea, en una línea hacia la mediana de profundidad, que los conecta con la bolsa.
La versión tridimensional consta de una bolsa interior y una exterior. [7] La ​​bolsa exterior debe dibujarse en colores transparentes para que la bolsa interior permanezca visible.

Propiedades

El gráfico de bolsas es invariante ante transformaciones afines del plano y robusto frente a valores atípicos. [8]

Referencias

  1. ^ Rousseeuw, Peter J.; Ruts I.; Tukey JW (1999). "El Bagplot: un diagrama de caja bivariado". The American Statistician . 53 (4): 382–387. doi :10.1080/00031305.1999.10474494.
  2. ^ Ronald K. Pearson (1 de abril de 2005). Minería de datos imperfectos: cómo lidiar con la contaminación y los registros incompletos. SIAM. pp. 204–. ISBN 978-0-89871-582-8.
  3. ^ Dominique Haughton ; Jonathan Haughton (18 de septiembre de 2011). Análisis de los niveles de vida: el desarrollo a través de la lente de los datos de las encuestas de hogares. Springer. pp. 14–. ISBN 978-1-4614-0385-2.
  4. ^ Sophie Dabo-Niang; Frédéric Ferraty (21 de mayo de 2008). Estadísticas funcionales y operativas. Springer. pp. 204–. ISBN 978-3-7908-2062-1.
  5. ^ John C. Gower; Sugnet Gardner Lubbe; Niel J. Le Roux (23 de febrero de 2011). Understanding Biplots [Comprender los diagramas de dispersión bidimensional]. John Wiley & Sons. pp. 59–. ISBN 978-1-119-97290-7.
  6. ^ Prabhanjan Narayanachar Tattar (24 de julio de 2013). Guía para principiantes sobre desarrollo de aplicaciones estadísticas mediante ejemplos. Packt Publishing Ltd., págs. 203–. ISBN 978-1-84951-945-8.
  7. ^ Kruppa, Jochen J.; Jung K. (2017). "Identificación automatizada de valores atípicos multigrupo en datos moleculares de alto rendimiento utilizando gráficos de bolsa y gráficos de gemas". BMC Bioinformatics . 18 : 232. doi : 10.1186/s12859-017-1645-5 . PMC 5414140 . PMID  28464790. 
  8. ^ Rajeev Raman; Robert Sedgewick; Matthias F. Stallmann (1 de enero de 2006). Actas del Octavo Taller sobre Ingeniería Algorítmica y Experimentos y del Tercer Taller sobre Algoritmia Analítica y Combinatoria. SIAM. pp. 62–. ISBN 978-0-89871-610-8.