stringtranslate.com

Exhibición de tallos y hojas

Un diagrama de tallo y hojas de números primos menores de 100 muestra que los dígitos de las decenas más frecuentes son 0 y 1, mientras que el menor es 9.

Un diagrama de tallo y hojas o diagrama de tallo y hojas es un dispositivo para presentar datos cuantitativos en un formato gráfico , similar a un histograma , para ayudar a visualizar la forma de una distribución . Evolucionaron a partir del trabajo de Arthur Bowley a principios de la década de 1900 y son herramientas útiles en el análisis exploratorio de datos . Los diagramas de tallo y hojas se comenzaron a usar más comúnmente en la década de 1980 después de la publicación del libro de John Tukey sobre análisis exploratorio de datos en 1977. [1] La popularidad durante esos años se debe al uso de estilos tipográficos monoespaciados (máquina de escribir) que permitieron que la tecnología informática de la época produjera fácilmente los gráficos. Las capacidades gráficas superiores de las computadoras modernas han hecho que estas técnicas se usen con menos frecuencia.

Esta gráfica se ha implementado en Octave [2] y R. [3]

Un diagrama de tallo y hojas también se denomina diagrama de tallos , pero este último término suele referirse a otro tipo de gráfico. Un diagrama de tallos simple puede referirse a trazar una matriz de valores y sobre un eje x común e identificar el valor x común con una línea vertical y los valores y individuales con símbolos en la línea. [4]

A diferencia de los histogramas, los diagramas de tallo y hojas conservan los datos originales hasta al menos dos dígitos significativos y los ordenan, facilitando así la transición a la inferencia basada en el orden y a las estadísticas no paramétricas .

Construcción

Para construir un diagrama de tallos y hojas, primero se deben ordenar las observaciones en orden ascendente: esto se puede hacer más fácilmente si se trabaja a mano, construyendo un borrador del diagrama de tallos y hojas sin ordenar las hojas y luego ordenando las hojas para producir el diagrama de tallos y hojas final. Aquí está el conjunto ordenado de valores de datos que se utilizará en el siguiente ejemplo:

44, 46, 47, 49, 63, 64, 66, 68, 68, 72, 72, 75, 76, 81, 84, 88, 106

A continuación, se debe determinar qué representarán los tallos y qué representarán las hojas. Normalmente, la hoja contiene el último dígito del número y el tallo contiene todos los demás dígitos. En el caso de números muy grandes, los valores de los datos se pueden redondear a un valor posicional particular (como la posición de las centenas) que se utilizará para las hojas. Los dígitos restantes a la izquierda del valor posicional redondeado se utilizan como tallo.

En este ejemplo, la hoja representa el lugar de las unidades y el tallo representará el resto del número (decenas y superiores).

La representación de tallos y hojas se dibuja con dos columnas separadas por una línea vertical. Los tallos se enumeran a la izquierda de la línea vertical. Es importante que cada tallo se enumere solo una vez y que no se omita ningún número, incluso si eso significa que algunos tallos no tienen hojas. Las hojas se enumeran en orden creciente en una fila a la derecha de cada tallo.

Cuando hay un número repetido en los datos (como dos 72), el gráfico debe reflejarlo (por lo que el gráfico se vería así 7 | 2 2 5 6 7 cuando tiene los números 72 72 75 76 77).

Llave:
Unidad de hoja: 1.0
Unidad de vástago: 10,0

Es posible que sea necesario redondear para crear un diagrama de tallos y hojas. Con base en el siguiente conjunto de datos, se crearía el diagrama de tallos que se muestra a continuación:

−23,678758, −12,45, −3,4, 4,43, 5,5, 5,678, 16,87, 24,7, 56,8

En el caso de los números negativos, se coloca un signo negativo delante de la unidad de tallo, que sigue siendo el valor X/10. Los números no enteros se redondean. Esto permite que el diagrama de tallo y hojas conserve su forma, incluso en conjuntos de datos más complejos. Como en el siguiente ejemplo:

Llave:

Uso

Los diagramas de tallo y hojas son útiles para mostrar la densidad relativa y la forma de los datos, lo que le da al lector una descripción general rápida de la distribución. Retienen (la mayoría de) los datos numéricos sin procesar, a menudo con una integridad perfecta. También son útiles para resaltar valores atípicos y encontrar la moda . Sin embargo, los diagramas de tallo y hojas solo son útiles para conjuntos de datos de tamaño moderado (alrededor de 15 a 150 puntos de datos). Con conjuntos de datos muy pequeños, los diagramas de tallo y hojas pueden ser de poca utilidad, ya que se requiere una cantidad razonable de puntos de datos para establecer propiedades de distribución definitivas. Un diagrama de puntos puede ser más adecuado para tales datos. Con conjuntos de datos muy grandes, un diagrama de tallo y hojas se volverá muy desordenado, ya que cada punto de datos debe representarse numéricamente. Un diagrama de caja o histograma puede volverse más apropiado a medida que aumenta el tamaño de los datos.

Uso no numérico

a│abdeghilmnrstwxyb│aeioyc│hdeaeioe│adefhlmnrstwxjoderDios míoholayo│dfnostYo aok│aioyyo aiomi aeimouyno-aeouyo│bdefhikmnoprsuwxypaeoq│yor│emierdateiou│ghmnprstv│w│eox│iuz│aeo

Los diagramas de tallo y hojas también se pueden utilizar para transmitir información no numérica. En este ejemplo de palabras válidas de dos letras en Collins Scrabble Words (la lista de palabras que se utiliza en los torneos de Scrabble fuera de los EE. UU.) con sus iniciales como tallos, se puede ver fácilmente que las tres iniciales más comunes son o , a y e . [5]

Notas

  1. ^ Tukey, John W. (1977). Análisis exploratorio de datos (1.ª edición). Pearson. ISBN 0-201-07616-0.
  2. ^ Función en Octava
  3. ^ Función en R
  4. ^ Ejemplos: funciones de tallo de MATLAB y Matplotlib. No crean una representación de tallo y hojas.
  5. ^ Gideon Goldin, Palabras de Scrabble de dos letras visualizadas como diagrama de tallo y hojas, 1 de octubre de 2020

Referencias