Vídeo: Interpretação de histogramas 2024
Um histograma é um gráfico que representa a distribuição de probabilidade de um conjunto de dados. Um histograma possui uma série de barras verticais onde cada barra representa um único valor ou uma gama de valores para uma variável. As alturas das barras indicam as frequências ou probabilidades para os diferentes valores ou intervalos de valores.
Por exemplo, esta figura mostra um histograma dos preços diários das ações da Apple de 1º de janeiro de 2013 a 31 de dezembro de 2013.
De acordo com este histograma, a maioria dos preços estava entre US $ 60 e US $ 65; O preço estava nesse intervalo de 81 vezes ao longo do ano. Os segundos preços mais freqüentemente observados foram entre US $ 55 e US $ 60; O preço desembarcou neste intervalo 44 vezes ao longo do ano. A terceira faixa de preços mais frequente foi entre US $ 65 e US $ 70, e a quarta gama de preços mais frequente foi entre US $ 70 e US $ 75. Muito poucos preços estavam entre US $ 50 e US $ 55, e o menor preço observado durante o ano estava entre US $ 80 e US $ 85.
Com base no gráfico, o preço médio e médio estava próximo do intervalo de US $ 60 a US $ 65. O valor real foi de US $ 65. 67, ea mediana real foi de US $ 63. 65. Uma vez que a média excede a mediana, a distribuição dos preços para 2013 foi positivamente comprometida. Isso indica que a probabilidade de um preço extremamente grande é um pouco maior do que a probabilidade de um preço extremamente baixo.
A distribuição é positivamente desviada se a média for maior que a mediana; É negativamente distorcido se a média for menor do que a mediana. A distribuição é simétrica sobre a média se a média é igual à mediana. O quanto os dados estão distorcidos depende de quão longe a média e a mediana diferem. Se eles são muito próximos, às vezes é prático tratar a distribuição como simétrica.
Como outro exemplo, este número mostra um histograma dos preços diários do índice de ações S & P 500 de 1 de janeiro de 2013 a 31 de dezembro de 2013.
Histograma de preços diários para o S & P 500.De acordo com o histograma na Figura 12-10, o intervalo de preços mais freqüentemente observado durante o ano foi entre $ 1, 650 e $ 1, 700. A média foi de US $ 1 643 80 e a mediana foi $ 1, 650. 41. Ao contrário do estoque de maçã, a média foi inferior a a mediana; a distribuição dos preços para 2013 é negativamente comprometida. Isso indica que houve uma tendência ligeiramente maior para que o Standard e Poor's 500 negociassem abaixo da média do que acima da média em 2013.
Um dos usos mais importantes dos histogramas é determinar se um conjunto de dados segue um especificado distribuição de probabilidade.Embora existam muitos testes estatísticos formais para determinar qual distribuição de probabilidade um conjunto de dados segue, é uma boa prática inspecionar visualmente os dados com um gráfico antes de se envolver em testes estatísticos formais.
O histograma dos preços da Apple fornece fortes evidências de que os preços das ações da Apple são não normalmente distribuídos. A distribuição normal é simétrica em relação a sua média, enquanto os preços das ações da Apple são positivamente distorcidos. O histograma dos preços da S & P fornece evidências fortes de que o S & P 500 também não é provável que seja normalmente distribuído porque sua distribuição está negativamente distorcida.
Testes estatísticos formais seriam necessários para mostrar que nenhuma distribuição é normal, mas os gráficos são altamente sugerentes. Como muitos testes estatísticos são baseados na suposição de normalidade, é importante determinar se uma distribuição é verdadeiramente normal antes de usar qualquer um desses testes.