Vídeo: Privacidade e Proteção de Dados no Brasil. | Carlos Affonso Souza | TEDxPetrópolis 2024
Você identifica o centro de um conjunto de dados com várias medidas de resumo diferentes. Estes incluem os três grandes: média, mediana e modo. Você calcula a média de um conjunto de dados, somando os valores de todos os elementos e dividindo pelo número total de elementos. Por exemplo, suponha que um pequeno conjunto de dados consiste no número de dias necessários para receber um pacote pelos residentes de um complexo de apartamentos:
1, 2, 2, 4, 7, 9, 10
A média deste conjunto de dados seria a seguinte:
O tempo médio para que os residentes recebam um pacote é de 5 dias.
A mediana de um conjunto de dados é um valor que divide os dados pela metade. A primeira metade contém os elementos mais pequenos e a segunda metade consiste dos maiores elementos. No exemplo anterior, porque os dados consistem em sete observações, o quarto menor valor seria a mediana:
1, 2, 2, 4, 7, 9, 10
A mediana é 4, porque metade das observações são inferiores a 4 e metade são maiores do que 4.
O modo de um conjunto de dados é simplesmente o valor mais freqüente. Com o exemplo de entrega do pacote, o modo é 2.
Para um exemplo do mundo real, esta figura mostra um histograma para retornos diários do estoque do ExxonMobil em 2013.
Cada barra representa um intervalo de valores; a largura de cada intervalo é de 0. 005. As alturas das barras indicam quantos retornos caíram dentro de cada intervalo. O histograma facilita a visão de quais intervalos de valores ocorreram com maior frequência e que ocorreram com menos frequência.
O histograma mostra que a maioria dos retornos está perto da média, que é 0. 000632 (0. 0632 por cento). A mediana é -0. 000118, e o modo pode ser considerado como o intervalo de valores entre -0. 005 e 0.