stringtranslate.com

Parcela de equipaje

Ejemplo de un diagrama de bolsa creado en R.

Un diagrama de bolsa , o diagrama de explosión de estrellas , [1] [2] es un método en estadística robusta para visualizar datos estadísticos bidimensionales o tridimensionales, análogo al diagrama de caja unidimensional . Introducido en 1999 por Rousseuw et al., el diagrama de bolsa permite visualizar la ubicación, la dispersión, la asimetría y los valores atípicos de un conjunto de datos. [3]

Construcción

El diagrama de bolsa consta de tres polígonos anidados , llamados "bolsa", "cerca" y "bucle".

Se utiliza un símbolo de asterisco (*) cerca del centro del gráfico para marcar la mediana de profundidad, el punto con la profundidad de Tukey más alta posible. Las observaciones entre la bolsa y la cerca están marcadas por segmentos de línea, en una línea hasta la mediana de profundidad, que los conecta con la bolsa.
La versión tridimensional consta de una bolsa interior y otra exterior. [7] La ​​bolsa exterior debe dibujarse en colores transparentes para que la bolsa interior permanezca visible.

Propiedades

El diagrama de bolsa es invariante ante transformaciones afines del plano y robusto frente a valores atípicos. [8]

Referencias

  1. ^ Rousseeuw, Peter J.; Rutinas I.; Tukey JW (1999). "El diagrama de bolsa: un diagrama de caja bivariado". El estadístico estadounidense . 53 (4): 382–387. doi :10.1080/00031305.1999.10474494.
  2. ^ Ronald K. Pearson (1 de abril de 2005). Minería de datos imperfectos: cómo lidiar con la contaminación y los registros incompletos. SIAM. págs.204–. ISBN 978-0-89871-582-8.
  3. ^ Dominique Haughton ; Jonathan Haughton (18 de septiembre de 2011). Análisis de los niveles de vida: desarrollo a través de la lente de los datos de las encuestas de hogares. Saltador. págs.14–. ISBN 978-1-4614-0385-2.
  4. ^ Sophie Dabo-Niang; Frédéric Ferraty (21 de mayo de 2008). Estadísticas Funcionales y Operativas. Saltador. págs.204–. ISBN 978-3-7908-2062-1.
  5. ^ John C. Gower; Sugnet Gardner Lubbe; Niel J. Le Roux (23 de febrero de 2011). Comprender los biplots. John Wiley e hijos. págs.59–. ISBN 978-1-119-97290-7.
  6. ^ Prabhanjan Narayanachar Tattar (24 de julio de 2013). R Desarrollo de aplicaciones estadísticas mediante ejemplo Guía para principiantes. Packt Publishing Ltd. págs. ISBN 978-1-84951-945-8.
  7. ^ Kruppa, Jochen J.; Jung K. (2017). "Identificación automatizada de valores atípicos multigrupo en datos moleculares de alto rendimiento mediante diagramas de bolsa y diagramas de gemas". Bioinformática BMC . 18 : 232. doi : 10.1186/s12859-017-1645-5 . PMC 5414140 . PMID  28464790. 
  8. ^ Rajeev Raman; Robert Sedgewick; Matthias F. Stallmann (1 de enero de 2006). Actas del Octavo Taller sobre Experimentos e Ingeniería de Algoritmos y el Tercer Taller sobre Algorítmica Analítica y Combinatoria. SIAM. págs.62–. ISBN 978-0-89871-610-8.