Índice:
- Significativo nem sempre significa importante
- A regressão nem sempre é linear
- Extrapolando além de um diagrama de dispersão de amostra é uma má idéia
- Examine a variabilidade em torno de uma linha de regressão
- Uma amostra pode ser muito grande
- Consumidores: Conheça seus eixos
- A representação gráfica de uma variável categórica como se fosse uma variável quantitativa é errada
- Sempre que apropriado, inclua variabilidade em seu gráfico
- Tenha cuidado ao relacionar os conceitos de livros de estatísticas com o Excel
Vídeo: Aula 02/38- Coesão Textual - Língua Portuguesa 2024
O mundo das estatísticas está cheio de armadilhas, mas também está cheio de oportunidades. Se você é um usuário de estatísticas ou alguém que deve interpretá-los, é possível cair nas armadilhas. Também é possível caminhar ao redor deles. Aqui estão dez dicas e armadilhas das áreas de teste de hipóteses, regressão, correlação e gráfico.
Significativo nem sempre significa importante
Importância é, em muitos aspectos, um termo mal escolhido. Quando um teste estatístico produz um resultado significativo, e a decisão é rejeitar H 0 , isso não garante que o estudo por trás dos dados seja importante. As estatísticas só podem ajudar a tomar decisões sobre números e inferências sobre os processos que os produziram. Eles não podem tornar esses processos importantes ou destruir a terra. Importância é algo que você tem que julgar por si mesmo - e nenhum teste estatístico pode fazer isso por você.
A regressão nem sempre é linear
Ao tentar ajustar um modelo de regressão a um diagrama de dispersão, a tentação é usar imediatamente uma linha. Este é o modelo de regressão mais compreendido, e quando você recebe o jeito, as encostas e os interceptos não são tão assustadores.
Mas a regressão linear não é o único tipo de regressão. É possível ajustar uma curva através de um diagrama de dispersão. Não se deixe enganar: os conceitos estatísticos por trás da regressão curvilínea são mais difíceis de entender do que os conceitos por trás da regressão linear.
Vale a pena tomar o tempo para dominar esses conceitos, no entanto. Às vezes, uma curva é um ajuste muito melhor do que uma linha.
Extrapolando além de um diagrama de dispersão de amostra é uma má idéia
Se você está trabalhando com regressão linear ou regressão curvilínea, tenha em mente que não é apropriado generalizar além dos limites do diagrama de dispersão.
Suponha que você tenha estabelecido uma sólida relação preditiva entre um teste de aptidão matemática e desempenho em cursos de matemática, e seu scatterplot cobre apenas uma gama restrita de aptitude matemática. Você não tem como saber se o relacionamento permanece além desse alcance. As previsões fora desse intervalo não são válidas.
Sua melhor opção é expandir o diagrama de dispersão testando mais pessoas. Você pode achar que a relação original apenas conta parte da história.
Examine a variabilidade em torno de uma linha de regressão
A análise cuidadosa dos resíduos (as diferenças entre valores observados e previstos) pode lhe dizer muito sobre a forma como a linha se encaixa nos dados. Uma suposição fundamental é que a variabilidade em torno de uma linha de regressão é a mesma de cima e de baixo da linha.Se não for, o modelo pode não ser tão preditivo quanto você pensa. Se a variabilidade é sistemática (maior variabilidade em uma extremidade do que na outra), a regressão curvilínea pode ser mais adequada do que linear. O erro padrão de estimativa nem sempre será o indicador.
Uma amostra pode ser muito grande
Acredite ou não, isso às vezes acontece com coeficientes de correlação. Uma amostra muito grande pode fazer um pequeno coeficiente de correlação estatisticamente significante.
Mas o que esse coeficiente de correlação realmente significa? O coeficiente de determinação -r 2 - é apenas. 038, o que significa que o SS Regression é inferior a 4% do SS Total . Essa é uma associação muito pequena.
Bottom line: quando se olha para um coeficiente de correlação, esteja ciente do tamanho da amostra. Se for grande o suficiente, pode fazer uma associação trivial se tornar estatisticamente significante. (Hmmm … significado - lá está novamente!)
Consumidores: Conheça seus eixos
Quando você olha para um gráfico, certifique-se de saber o que está em cada eixo. Certifique-se de compreender as unidades de medida. Você entende a variável independente? Você entende a variável dependente? Você pode descrever cada um em suas próprias palavras? Se a resposta a qualquer uma dessas questões for "Não", você não entende o gráfico que você está procurando.
Ao olhar para um gráfico em um anúncio de TV, fique muito cauteloso se desaparecer rapidamente, antes de ver o que está nos eixos. O anunciante pode estar tentando criar uma falsa impressão falsa sobre uma relação falsa dentro do gráfico. O relacionamento graficado pode ser tão válido como o outro grampo do anúncio de TV - prova científica através de desenho animado: Pequenas escovas de esfregaço animado, a limpeza de dentes de desenho animado pode não necessariamente garantir dentes mais brancos para você, se você comprar o produto.
A representação gráfica de uma variável categórica como se fosse uma variável quantitativa é errada
Então você está pronto para competir na série mundial Rock-Paper-Scissors. Em preparação para este torneio internacional, você compila todas as suas partidas nos últimos dez anos, listando a porcentagem de vezes que você ganhou quando jogou cada papel.
Para resumir todos os resultados, use recursos gráficos do Excel para criar um gráfico.
Muitas pessoas criam esses tipos de gráficos - pessoas que devem conhecer melhor. A linha no gráfico implica continuidade de um ponto para outro. Com esses dados, é claro, isso é impossível. O que há entre rock e papel? Por que as unidades iguais estão separadas? Por que as três categorias nessa ordem?
Simplificando, um gráfico de linha não é o gráfico apropriado quando pelo menos uma de suas variáveis é um conjunto de categorias. Em vez disso, crie um gráfico de colunas. Um gráfico de torta funciona aqui, também, porque os dados são porcentagens e você tem apenas algumas fatias.
Sempre que apropriado, inclua variabilidade em seu gráfico
Quando os pontos do seu gráfico representarem meios, verifique se o gráfico inclui o erro padrão de cada média.Isso dá ao visualizador uma idéia da variabilidade nos dados - o que é um aspecto importante dos dados.
Os meios por si só nem sempre lhe contam toda a história. Aproveite todas as oportunidades para examinar variâncias e desvios-padrão. Você pode encontrar alguns nuggets escondidos. Variação sistemática - valores elevados de variância associados a meios amplos, por exemplo - podem ser uma pista sobre um relacionamento que você não viu antes.
Tenha cuidado ao relacionar os conceitos de livros de estatísticas com o Excel
Se você for sério sobre fazer um trabalho estatístico, provavelmente terá a oportunidade de examinar um texto de estatísticas ou dois. Tenha em mente que os símbolos em algumas áreas de estatísticas não são padrão.
Conectando conceitos de livros didáticos às funções estatísticas do Excel pode ser um desafio por causa dos textos e do Excel. As mensagens nas caixas de diálogo e nos arquivos de Ajuda podem conter símbolos diferentes dos que você lê, ou podem usar os mesmos símbolos, mas de uma maneira diferente. Essa discrepância pode levá-lo a fazer uma entrada incorreta em um parâmetro em uma caixa de diálogo, resultando em um erro que é difícil de rastrear.