Vídeo: Frecuencia, Media, Moda y Mediana 2024
Para ajudá-lo a entender a análise estatística com o Excel, ele ajuda a simular o Teorema do Limite Central. Isso quase não parece correto. Como uma população que normalmente não é distribuída resulta em uma distribuição de amostragem normalmente distribuída?
Para dar uma idéia de como funciona o Teorema do Limite Central, existe uma simulação. Esta simulação cria algo como uma distribuição de amostragem da média para uma amostra muito pequena, com base em uma população que normalmente não é distribuída. Como você verá, mesmo que a população não seja uma distribuição normal, e mesmo que a amostra seja pequena, a distribuição de amostragem da média parece bastante como uma distribuição normal.
Imagine uma grande população que consiste em apenas três pontuações - 1, 2 e 3 - e cada uma delas é igualmente susceptível de aparecer em uma amostra. Imagine também que você pode selecionar aleatoriamente uma amostra de três pontuações dessa população.
Amostra | Média | Amostra | Média | Amostra | Média |
1, 1, 1 | 1. 00 | 2, 1, 1 | 1. 33 | 3, 1, 1 | 1. 67 |
1, 1, 2 | 1. 33 | 2, 1, 2 | 1. 67 | 3, 1, 2 | 2. 00 |
1, 1, 3 | 1. 67 | 2, 1, 3 | 2. 00 | 3, 1, 3 | 2. 33 |
1, 2, 1 | 1. 33 | 2, 2, 1 | 1. 67 | 3, 2, 1 | 2. 00 |
1, 2, 2 | 1. 67 | 2, 2, 2 | 2. 00 | 3, 2, 2 | 2. 33 |
1, 2, 3 | 2. 00 | 2, 2, 3 | 2. 33 | 3, 2, 3 | 2. 67 |
1, 3, 1 | 1. 67 | 2, 3, 1 | 2. 00 | 3, 3, 1 | 2. 33 |
1, 3, 2 | 2. 00 | 2, 3, 2 | 2. 33 | 3, 3, 2 | 2. 67 |
1, 3, 3 | 2. 33 | 2, 3, 3 | 2. 67 | 3, 3, 3 | 3. 00 |
Se você olhar atentamente para a mesa, quase pode ver o que está prestes a acontecer na simulação. A amostra significa que aparece com mais frequência é 2. 00. A amostra significa que aparecem menos freqüentemente são 1. 00 e 3. 00. Hmmm …
Na simulação, uma pontuação foi selecionada aleatoriamente da população e, em seguida, seleciona aleatoriamente duas Mais. Esse grupo de três pontuações é uma amostra. Então você calcula a média dessa amostra. Este processo foi repetido para um total de 60 amostras, resultando em 60 meios de amostra. Finalmente, você grafica a distribuição da amostra.
O que a distribuição de amostragem simulada da média parece? A imagem abaixo mostra uma planilha que responde a esta pergunta.
Na planilha, cada linha é uma amostra.As colunas marcadas como x1, x2 e x3 mostram as três pontuações para cada amostra. A coluna E mostra a média da amostra em cada linha. A coluna G mostra todos os valores possíveis para a média da amostra e a coluna H mostra a frequência com que cada média aparece nas 60 amostras. As colunas G e H e o gráfico mostram que a distribuição tem sua freqüência máxima quando a média da amostra é de 2. 00. As freqüências são afastadas, pois a amostra significa mais e mais longe de 2. 00.
O ponto de tudo isso é que a população não se parece com uma distribuição normal e o tamanho da amostra é muito pequeno. Mesmo sob essas restrições, a distribuição de amostragem da média com base em 60 amostras começa a se parecer muito com uma distribuição normal.
E quanto aos parâmetros que o teorema do limite central prevê para a distribuição da amostragem? Comece com a população. A média da população é de 2. 00 e o desvio padrão da população é. 67. (Este tipo de população requer algumas matemáticas ligeiramente extravagantes para descobrir os parâmetros.)
Ligado à distribuição de amostragem. A média dos 60 significa é 1. 98, e seu desvio padrão (uma estimativa do erro padrão da média) é. 48. Esses números aproximam-se muito dos parâmetros preditos previstos pelo Teorema Limite Central para a distribuição de amostragem da média, 2. 00 (igual à média da população) e. 47 (desvio padrão,. 67, dividido pela raiz quadrada de 3, o tamanho da amostra).
Caso esteja interessado em fazer essa simulação, siga as etapas:
- Selecione uma célula para o seu primeiro número selecionado aleatoriamente.
Selecione a célula B2.
- Use a função da planilha
RANDBETWEEN
para selecionar 1, 2 ou 3.Isso simula desenhar um número de uma população consistindo nos números 1, 2 e 3 onde você tem uma chance igual de selecionar cada número. Você pode selecionar
FORMULAS | Math & Trig | RANDBETWEEN
e use a caixa de diálogo Argumentos de função ou digite= RANDBETWEEN (1, 3)
em B2 e pressione Enter. O primeiro argumento é o número mais pequeno que RANDBETWEEN retorna e o segundo argumento é o maior número. - Selecione a célula à direita da célula original e escolha outro número aleatório entre 1 e 3. Faça isso novamente para um terceiro número aleatório na célula à direita do segundo.
A maneira mais fácil de fazer isso é preencher automaticamente as duas células à direita da célula original. Nesta planilha, essas duas células são C2 e D2.
- Considere estas três células como uma amostra e calcule sua média na célula à direita da terceira célula.
A maneira mais fácil de fazer isso é apenas digitar
= MÉDIA (B2: D2)
na célula E2 e pressione Enter. - Repita este processo para tantas amostras quanto você deseja incluir na simulação. Cada linha corresponde a uma amostra.
60 amostras foram usadas aqui. A maneira rápida e fácil de fazer isso é selecionar a primeira linha de três números selecionados aleatoriamente e sua média e, em seguida, preencher automaticamente as linhas restantes. O conjunto de meios de amostra na coluna E é a distribuição de amostragem simulada da média.Use
MÉDIA
e
STDEV. P
para encontrar o seu desvio padrão e padrão.
Para ver como esta distribuição de amostragem simulada se parece, use a função de matriz
FREQUENCY
nos meios de amostra na coluna E. Siga estas etapas:
- Digite os valores possíveis da média da amostra em uma matriz.
Você pode usar a coluna G para isso. Você pode expressar os possíveis valores da média da amostra em forma de fração (3/3, 4/3, 5/3, 6/3, 7/3, 8/3 e 9/3) como os que foram inseridos nas células G2 através do G8. Excel converte-os em forma decimal. Verifique se essas células estão no formato Número.
- Selecione uma matriz para as frequências dos valores possíveis da média da amostra.
Você pode usar a coluna H para segurar as freqüências, selecionando células H2 até H8.
- No menu Funções estatísticas, selecione
FREQUÊNCIA
para abrir a caixa de diálogo Argumentos de função paraFREQUÊNCIA
- Na caixa de diálogo Argumentos de função, insira os valores apropriados para os argumentos.
Na caixa Data_array, insira as células que possuem a amostra significa. Neste exemplo, isso é E2: E61.
- Identifique a matriz que contém os valores possíveis da média da amostra.
FREQUENCY
contém esta matriz na caixa Bins_array. Para esta planilha, G2: G8 entra na caixa Bins_array. Depois de identificar ambos os arrays, a caixa de diálogo Argumentos de Função mostra as freqüências dentro de um par de suportes curly. - Pressione Ctrl + Shift + Enter para fechar a caixa de diálogo Argumentos de função e mostrar as freqüências.
Use esta combinação de teclas porque
FREQUENCY
é uma função de matriz. - Finalmente, com H2: H8 destacado, selecione
Inserir | Gráficos recomendados
e escolha o layout da Coluna em Cluster para produzir o gráfico das frequências. Seu gráfico provavelmente parecerá um pouco diferente do meu, porque você provavelmente terminará com um número aleatório diferente.
Por sinal, o Excel repete o processo de seleção aleatória quando você faz algo que faz com que o Excel recalcule a planilha. O efeito é que os números podem mudar à medida que você trabalha com isso. (Ou seja, você reeditar a simulação.) Por exemplo, se você voltar e preencher automaticamente uma das linhas novamente, os números mudam e o gráfico muda.