stringtranslate.com

El cuarteto de Anscombe

Los cuatro conjuntos de datos que componen el cuarteto de Anscombe. Los cuatro conjuntos tienen parámetros estadísticos idénticos, pero los gráficos muestran que son considerablemente diferentes

El cuarteto de Anscombe comprende cuatro conjuntos de datos que tienen estadísticas descriptivas simples casi idénticas , pero que tienen distribuciones muy diferentes y parecen muy diferentes cuando se representan gráficamente . Cada conjunto de datos consta de once ( xy ) puntos . Fueron construidos en 1973 por el estadístico Francis Anscombe para demostrar tanto la importancia de representar gráficamente los datos al analizarlos como el efecto de los valores atípicos y otras observaciones influyentes sobre las propiedades estadísticas. Describió el artículo como destinado a contrarrestar la impresión entre los estadísticos de que "los cálculos numéricos son exactos, pero los gráficos son aproximados". [1]

Datos

Para los cuatro conjuntos de datos:

El cuarteto todavía se utiliza a menudo para ilustrar la importancia de observar gráficamente un conjunto de datos antes de comenzar a analizarlos según un tipo particular de relación, y la insuficiencia de las propiedades estadísticas básicas para describir conjuntos de datos realistas. [2] [3] [4] [5] [6]

Los conjuntos de datos son los siguientes. Los valores de x son los mismos para los primeros tres conjuntos de datos. [1]

No se sabe cómo Anscombe creó sus conjuntos de datos. [7] Desde su publicación, se han desarrollado varios métodos para generar conjuntos de datos similares con estadísticas idénticas y gráficos diferentes. [7] [8] Uno de ellos, la docena de Datasaurus , consta de puntos que trazan el contorno de un dinosaurio, además de otros doce conjuntos de datos que tienen las mismas estadísticas resumidas. [9] [10] [11]

Ver también


Referencias

  1. ^ ab Anscombe, FJ (1973). "Gráficos en análisis estadístico". Estadístico estadounidense . 27 (1): 17–21. doi :10.1080/00031305.1973.10478966. JSTOR  2682899.
  2. ^ Elert, Glenn (2021). "Regresión lineal". El hiperlibro de física .
  3. ^ Janert, Philipp K. (2010). Análisis de datos con herramientas de código abierto. Medios O'Reilly . págs. 65–66. ISBN 978-0-596-80235-6.
  4. ^ Chatterjee, Samprit; Hadi, Ali S. (2006). Análisis de regresión por ejemplo . John Wiley e hijos. pag. 91.ISBN 0-471-74696-7.
  5. ^ Saville, David J.; Madera, Graham R. (1991). Métodos estadísticos: el enfoque geométrico . Saltador . pag. 418.ISBN 0-387-97517-9.
  6. ^ Tufte, Edward R. (2001). La visualización visual de información cuantitativa (2ª ed.). Cheshire, CT: Prensa gráfica. ISBN 0-9613921-4-2.
  7. ^ ab Chatterjee, Sangit; Firat, Aykut (2007). "Generación de datos con estadísticas idénticas pero gráficos diferentes: una continuación del conjunto de datos de Anscombe". El estadístico estadounidense . 61 (3): 248–254. doi :10.1198/000313007X220057. JSTOR  27643902. S2CID  121163371.
  8. ^ Matejka, Justin; Fitzmaurice, George (2017). "Mismas estadísticas, diferentes gráficos: generación de conjuntos de datos con apariencia variada y estadísticas idénticas mediante recocido simulado". Actas de la Conferencia CHI de 2017 sobre factores humanos en sistemas informáticos . págs. 1290-1294. doi :10.1145/3025453.3025912. ISBN 9781450346559. S2CID  9247543.
  9. ^ Matejka, Justin; Fitzmaurice, George (2017). "Mismas estadísticas, diferentes gráficos: generación de conjuntos de datos con apariencia variada y estadísticas idénticas mediante recocido simulado". Investigación de Autodesk . Archivado desde el original el 4 de octubre de 2020 . Consultado el 20 de abril de 2021 .
  10. ^ Murray, Lori L.; Wilson, John G. (abril de 2021). "Generación de conjuntos de datos para enseñar la importancia del análisis de regresión". Revista de educación innovadora de Decision Sciences . 19 (2): 157–166. doi :10.1111/dsji.12233. ISSN  1540-4595. S2CID  233609149.
  11. ^ Andrienko, Natalia ; Andrienko, Gennady; Fuchs, Georg; Slingsby, Aidan; Turkay, Cagatay; Wrobel, Stefan (2020), "Visual Analytics for Investigating and Processing Data", Análisis visual para científicos de datos , Cham: Springer International Publishing, págs. 151–180, doi :10.1007/978-3-030-56146-8_5, ISBN 978-3-030-56145-1, S2CID  226648414 , consultado el 20 de abril de 2021 .

enlaces externos