Vídeo: WWL RAP - 3X4 (Álbum completo) 2024
A gráfico de haste e folha é um dispositivo gráfico no qual a distribuição de um conjunto de dados é organizada pelo valor numérico das observações no conjunto de dados. O diagrama consiste em um "caule", que mostra as diferentes categorias nos dados, e uma "folha", que mostra os valores das observações individuais no conjunto de dados.
Por exemplo, o seguinte é um diagrama de haste e folha para os preços diários das ações da Microsoft de 1 de janeiro de 2013 a 31 de dezembro de 2013. Os preços variam de US $ 25. 16 a $ 38. 14:
No gráfico de haste e folha, cada linha representa uma única categoria; Para este conjunto de dados, cada categoria é um valor em dólares. Por exemplo, a categoria 32 consiste em todos os preços entre US $ 32. 00 e $ 32. 99. Cada preço do estoque da Microsoft é cotado em dólares e cêntimos. O lado esquerdo da barra mostra os dólares (as hastes); O lado direito da barra mostra os centavos (as folhas), depois de arredondar para os 10 centavos mais próximos. Por exemplo, um preço de $ 32. 23 é arredondado para $ 32. 20, e isso aparece como um 2 no lado direito da barra para a categoria 32. Um preço de $ 33. 48 é arredondado para $ 33. 50; isso aparece como um 5 no lado direito da barra para a categoria 33.
Usando esta técnica, é fácil ver quantos preços se enquadram em cada categoria. Por exemplo, houve 14 dias de negociação no conjunto de dados em que o preço do estoque da Microsoft estava entre US $ 25. 00 e US $ 25. 99. Houve três dias de negociação em que o preço do estoque da Microsoft estava entre US $ 29. 00 e $ 29. 99. Um preço entre US $ 33. 00 e $ 33. 99 ocorreram com maior freqüência, e um preço entre US $ 38. 00 e $ 38. 99 foi o mais frequente durante o ano.
Uma das vantagens de um diagrama de haste e folha é que é fácil identificar o modo de um conjunto de dados. (Lembre-se de que o modo é o valor que ocorre com mais freqüência em um conjunto de dados.) Se você olhar apenas para os intervalos de dólares, então é fácil detectar qual o intervalo que contém a maioria das observações - a que tem a folha mais longa. Nesse caso, um preço na faixa de 33 (US $ 33,00- $ 33,99) seria considerado como o modo porque contém mais observações.
Outra vantagem deste diagrama é que outliers são fáceis de detectar. Um outlier é uma observação em um conjunto de dados significativamente maior ou menor que as outras observações no conjunto de dados. Um outlier seria indicado por uma grande diferença entre o primeiro ou último tallo e o próximo mais próximo.(O capítulo 10 fala mais sobre outliers.)
Uma desvantagem para os diagramas de haste e folha é que eles se tornam difíceis de interpretar para grandes conjuntos de dados porque o tamanho da folha se torna pesado.