Vídeo: Aplicando PROCV em dados Repetidos - Excel 2024
Ao trabalhar com grandes estatísticas de dados, você identifica a disseminação de um conjunto de dados do centro com várias medidas de resumo diferentes: variância, padrão desvio, quartis, intervalo interquartil (IQR).
A diferença é o desvio médio quadrático entre os elementos do conjunto de dados e a média. Para uma amostra de dados, a variância é calculada assim:
onde
-
x i é o valor de um único elemento na amostra.
-
é a média da amostra.
-
n é o tamanho da amostra.
O desvio padrão é a raiz quadrada da variância. Para a maioria das aplicações, o desvio padrão é mais conveniente para usar do que a variância como medida de propagação. Isso ocorre porque a variação é medida em unidades quadradas , enquanto o desvio padrão é medido nas mesmas unidades que os dados. Por exemplo, a variação de um conjunto de dados consistindo em preços seria medida em dólares quadrados, e o desvio padrão seria medido em dólares. O desvio padrão é a medida mais utilizada da propagação em um conjunto de dados.
Os quartis dividem um conjunto de dados em quatro partes iguais. O primeiro quartil (Q 1 ) divide os dados nas menores 25 por cento das observações e os 75 por cento mais altos (25 por cento das observações são inferiores a Q 1 < e 75% são maiores que Q 1 ). O segundo quartil (Q 2 ) divide os dados nos 50% mais baixos das observações e os 50% mais altos. O terceiro quartil (Q 3 ) divide os dados nas menores 75 por cento das observações e os 25 por cento mais altos. A faixa intercuartil (IQR) é igual a diferença entre o terceiro e o primeiro quartis:
Os quartis de um conjunto de dados são melhor ilustrados com um argumento de caixa
. A figura a seguir mostra um gráfico de caixa dos retornos diários para o ExxonMobil em 2013. Gráfico de caixa dos retornos diários ao estoque do ExxonMobil em 2013.
O gráfico da caixa mostra várias estatísticas-chave para os retornos do ExxonMobil: > O retorno mínimo é mostrado em um gráfico como um único ponto na parte inferior do gráfico (um gráfico de caixa mostra outliers
como pontos individuais). Q 1 é mostrado como a parte inferior da caixa, Q 2 é a linha preta sólida no meio da caixa, e Q 3 é o topo de a Caixa. O retorno máximo é mostrado como um único ponto na parte superior do enredo.