Lar Mídia social 9 Dicas e armadilhas estatísticas e gráficas - dummies

9 Dicas e armadilhas estatísticas e gráficas - dummies

Índice:

Vídeo: Aula 02/38- Coesão Textual - Língua Portuguesa 2025

Vídeo: Aula 02/38- Coesão Textual - Língua Portuguesa 2025
Anonim

O mundo das estatísticas está cheio de armadilhas, mas também está cheio de oportunidades. Se você é um usuário de estatísticas ou alguém que deve interpretá-los, é possível cair nas armadilhas. Também é possível caminhar ao redor deles. Aqui estão dez dicas e armadilhas das áreas de teste de hipóteses, regressão, correlação e gráfico.

Significativo nem sempre significa importante

Importância é, em muitos aspectos, um termo mal escolhido. Quando um teste estatístico produz um resultado significativo, e a decisão é rejeitar H 0 , isso não garante que o estudo por trás dos dados seja importante. As estatísticas só podem ajudar a tomar decisões sobre números e inferências sobre os processos que os produziram. Eles não podem tornar esses processos importantes ou destruir a terra. Importância é algo que você tem que julgar por si mesmo - e nenhum teste estatístico pode fazer isso por você.

A regressão nem sempre é linear

Ao tentar ajustar um modelo de regressão a um diagrama de dispersão, a tentação é usar imediatamente uma linha. Este é o modelo de regressão mais compreendido, e quando você recebe o jeito, as encostas e os interceptos não são tão assustadores.

Mas a regressão linear não é o único tipo de regressão. É possível ajustar uma curva através de um diagrama de dispersão. Não se deixe enganar: os conceitos estatísticos por trás da regressão curvilínea são mais difíceis de entender do que os conceitos por trás da regressão linear.

Vale a pena tomar o tempo para dominar esses conceitos, no entanto. Às vezes, uma curva é um ajuste muito melhor do que uma linha.

Extrapolando além de um diagrama de dispersão de amostra é uma má idéia

Se você está trabalhando com regressão linear ou regressão curvilínea, tenha em mente que não é apropriado generalizar além dos limites do diagrama de dispersão.

Suponha que você tenha estabelecido uma sólida relação preditiva entre um teste de aptidão matemática e desempenho em cursos de matemática, e seu scatterplot cobre apenas uma gama restrita de aptitude matemática. Você não tem como saber se o relacionamento permanece além desse alcance. As previsões fora desse intervalo não são válidas.

Sua melhor opção é expandir o diagrama de dispersão testando mais pessoas. Você pode achar que a relação original apenas conta parte da história.

Examine a variabilidade em torno de uma linha de regressão

A análise cuidadosa dos resíduos (as diferenças entre valores observados e previstos) pode lhe dizer muito sobre a forma como a linha se encaixa nos dados. Uma suposição fundamental é que a variabilidade em torno de uma linha de regressão é a mesma de cima e de baixo da linha.Se não for, o modelo pode não ser tão preditivo quanto você pensa. Se a variabilidade é sistemática (maior variabilidade em uma extremidade do que na outra), a regressão curvilínea pode ser mais adequada do que linear. O erro padrão de estimativa nem sempre será o indicador.

Uma amostra pode ser muito grande

Acredite ou não, isso às vezes acontece com coeficientes de correlação. Uma amostra muito grande pode fazer um pequeno coeficiente de correlação estatisticamente significante.

Mas o que esse coeficiente de correlação realmente significa? O coeficiente de determinação -r 2 - é apenas. 038, o que significa que o SS Regression é inferior a 4% do SS Total . Essa é uma associação muito pequena.

Bottom line: quando se olha para um coeficiente de correlação, esteja ciente do tamanho da amostra. Se for grande o suficiente, pode fazer uma associação trivial se tornar estatisticamente significante. (Hmmm … significado - lá está novamente!)

Consumidores: Conheça seus eixos

Quando você olha para um gráfico, certifique-se de saber o que está em cada eixo. Certifique-se de compreender as unidades de medida. Você entende a variável independente? Você entende a variável dependente? Você pode descrever cada um em suas próprias palavras? Se a resposta a qualquer uma dessas questões for "Não", você não entende o gráfico que você está procurando.

Ao olhar para um gráfico em um anúncio de TV, fique muito cauteloso se desaparecer rapidamente, antes de ver o que está nos eixos. O anunciante pode estar tentando criar uma falsa impressão falsa sobre uma relação falsa dentro do gráfico. O relacionamento graficado pode ser tão válido como o outro grampo do anúncio de TV - prova científica através de desenho animado: Pequenas escovas de esfregaço animado, a limpeza de dentes de desenho animado pode não necessariamente garantir dentes mais brancos para você, se você comprar o produto.

A representação gráfica de uma variável categórica como se fosse uma variável quantitativa é errada

Então você está pronto para competir na série mundial Rock-Paper-Scissors. Em preparação para este torneio internacional, você compila todas as suas partidas nos últimos dez anos, listando a porcentagem de vezes que você ganhou quando jogou cada papel.

Para resumir todos os resultados, use recursos gráficos do Excel para criar um gráfico.

Muitas pessoas criam esses tipos de gráficos - pessoas que devem conhecer melhor. A linha no gráfico implica continuidade de um ponto para outro. Com esses dados, é claro, isso é impossível. O que há entre rock e papel? Por que as unidades iguais estão separadas? Por que as três categorias nessa ordem?

Simplificando, um gráfico de linha não é o gráfico apropriado quando pelo menos uma de suas variáveis ​​é um conjunto de categorias. Em vez disso, crie um gráfico de colunas. Um gráfico de torta funciona aqui, também, porque os dados são porcentagens e você tem apenas algumas fatias.

Sempre que apropriado, inclua variabilidade em seu gráfico

Quando os pontos do seu gráfico representarem meios, verifique se o gráfico inclui o erro padrão de cada média.Isso dá ao visualizador uma idéia da variabilidade nos dados - o que é um aspecto importante dos dados.

Os meios por si só nem sempre lhe contam toda a história. Aproveite todas as oportunidades para examinar variâncias e desvios-padrão. Você pode encontrar alguns nuggets escondidos. Variação sistemática - valores elevados de variância associados a meios amplos, por exemplo - podem ser uma pista sobre um relacionamento que você não viu antes.

Tenha cuidado ao relacionar os conceitos de livros de estatísticas com o Excel

Se você for sério sobre fazer um trabalho estatístico, provavelmente terá a oportunidade de examinar um texto de estatísticas ou dois. Tenha em mente que os símbolos em algumas áreas de estatísticas não são padrão.

Conectando conceitos de livros didáticos às funções estatísticas do Excel pode ser um desafio por causa dos textos e do Excel. As mensagens nas caixas de diálogo e nos arquivos de Ajuda podem conter símbolos diferentes dos que você lê, ou podem usar os mesmos símbolos, mas de uma maneira diferente. Essa discrepância pode levá-lo a fazer uma entrada incorreta em um parâmetro em uma caixa de diálogo, resultando em um erro que é difícil de rastrear.

9 Dicas e armadilhas estatísticas e gráficas - dummies

Escolha dos editores

Noções básicas do arquivo de dados Flashback da Oracle 12c - dummies

Noções básicas do arquivo de dados Flashback da Oracle 12c - dummies

O Flashback Data Archive do oracle 12c é um mecanismo de banco de dados que permite que você para armazenar periodicamente ou indefinidamente todas as versões de linha em uma tabela ao longo da sua vida útil. Você pode então escolher uma hora para ver os dados como existia em um ponto específico. Esteja ciente de que o Flashback Data Archive é um recurso licenciado. ...

Noções básicas de clusters de aplicativos reais do Oracle 12c - manequins

Noções básicas de clusters de aplicativos reais do Oracle 12c - manequins

Se você visitou os sites da Oracle nos últimos 12 anos , você viu o byline de marketing: "Inquebrável. "Essa linha de tag refere-se ao recurso Real Application Clusters (RAC). Claro, muitos elementos estão envolvidos, mas o RAC tem o destaque. O RAC é a solução de clustering de banco de dados Oracle. Em certo sentido, funciona na teoria de que ...

Noções básicas de Redo Log Files no Oracle 12c - dummies

Noções básicas de Redo Log Files no Oracle 12c - dummies

Redo os arquivos de log armazenam as informações do buffer de log no banco de dados Oracle 12c. Eles são escritos pelo Log Writer (LGWR). Mais uma vez, você não pode ler esses arquivos binários sem a ajuda do software de banco de dados. Normalmente, os arquivos de reto de log são nomeados com a extensão. LOG ou. RDO. Pode ser qualquer coisa que você queira, ...

Escolha dos editores

São orgasmos ok durante a gravidez? - Dummies

São orgasmos ok durante a gravidez? - Dummies

As mulheres grávidas não só têm permissão para fazer sexo, mas muitas vezes o desejam. Mas é bom aproveitar a relação sexual com o ponto do orgasmo? Afinal, os orgasmos são nada mais do que contrações - e as pessoas sugeriram que isso poderia desencadear mão-de-obra. Isso é apenas um mito. De fato, grávida ...

Alimentando a Multidão em uma Reunião Familiar - manequins

Alimentando a Multidão em uma Reunião Familiar - manequins

Cozinhando uma refeição para um grande grupo (reunião familiar ou de outra forma ) requer planejamento e resistência. Aqui está um guia útil para quantidades de alimentos e segurança alimentar, e conselhos sobre a organização de uma festa de potluck. Planejando para potlucks A forma mais comum de comestibles de grupo é uma festa de potluck - qual é a maneira mais barata e fácil de ...

Anatomia do Penis humano - dummies

Anatomia do Penis humano - dummies

Sabendo como as funções de um pénis podem fornecer uma visão útil do sexo e do corpo humano - se você quer entender o pénis e a anatomia masculina melhor ou aprender sobre isso pela primeira vez. Basicamente, um pênis é composto de três estruturas, que são feitas de um material esponjoso que pode preencher com sangue: ...

Escolha dos editores

Como lidar com outliers causados ​​por Forças externas - manequins

Como lidar com outliers causados ​​por Forças externas - manequins

Certifique-se de verificar atentamente os outliers antes eles influenciam sua análise preditiva. Os outliers podem distorcer a análise de dados e dados. Por exemplo, qualquer análise estatística feita com dados que deixa outliers no lugar acaba por desviar os meios e variâncias. Os outliers não controlados ou mal interpretados podem levar a conclusões falsas. Diga os seus dados que ...

Como criar um modelo de análise preditiva com regressão R - manequins

Como criar um modelo de análise preditiva com regressão R - manequins

Você deseja criar um preditivo modelo de análise que você pode avaliar usando resultados conhecidos. Para fazer isso, vamos dividir nosso conjunto de dados em dois conjuntos: um para treinar o modelo e outro para testar o modelo. Uma divisão 70/30 entre treinamento e testes de conjuntos de dados será suficiente. As próximas duas linhas de código ...

Como definir objetivos de negócios para um modelo de análise preditiva - dummies

Como definir objetivos de negócios para um modelo de análise preditiva - dummies

Um modelo de análise preditiva visa resolvendo um problema comercial ou realizando um resultado comercial desejado. Esses objetivos comerciais se tornam os objetivos do modelo. Conhecer aqueles garante o valor comercial do modelo que você constrói - o que não deve ser confundido com a precisão do modelo. Hipotéticamente, você pode construir um modelo preciso para ...