Lar Finanças Pessoais Como usar o Suavização de Dados em Analisadores Preditivos - dummies

Como usar o Suavização de Dados em Analisadores Preditivos - dummies

Índice:

Vídeo: Roger Stein: A bold new way to fund drug research 2025

Vídeo: Roger Stein: A bold new way to fund drug research 2025
Anonim

O alinhamento de dados na análise preditiva é, essencialmente, tentando encontrar o "sinal" no "ruído" por descartando pontos de dados que são considerados "ruidosos". A idéia é afiar os padrões nos dados e destacar as tendências às quais os dados estão apontando.

A implicação por trás do suavização de dados é que os dados consistem em duas partes: uma parte (consistindo nos pontos de dados centrais ) que significa tendências gerais ou tendências reais e outra parte que consiste principalmente em desvios ( ruído ) - alguns pontos flutuantes que resultam de alguma volatilidade nos dados. Suavização de dados procura eliminar essa segunda parte.

Como reduzir o ruído

O suavização de dados opera em vários pressupostos:

  • Essa flutuação nos dados é mais provável de ser ruim.

  • Que a parte ruidosa dos dados é de curta duração.

  • Que a flutuação dos dados, independentemente de quão variada possa ser, não afetará as tendências subjacentes representadas pelos pontos de dados principais.

O ruído nos dados tende a ser aleatório; suas flutuações não devem afetar as tendências gerais decorrentes da análise do resto dos dados. Assim, reduzir ou eliminar pontos de dados ruidosos pode esclarecer tendências e padrões reais nos dados - efetivamente, melhorando a relação sinal / ruído dos dados. "

Desde que você identificou o ruído corretamente e depois reduziu, o alisamento de dados pode ajudá-lo a prever o próximo ponto de dados observado simplesmente seguindo as principais tendências detectadas nos dados.

O alisamento de dados se preocupa com a maioria dos pontos de dados, suas posições em um gráfico e o que os padrões resultantes prevêem sobre a tendência geral de (digamos) um preço de estoque, seja sua direção geral para cima, para baixo ou para os lados.

Esta técnica não irá prever com precisão o preço exato do próximo comércio para um estoque dado - mas prever uma tendência geral pode produzir insights mais poderosos do que saber o preço real ou suas flutuações.

Uma previsão baseada em uma tendência geral deduzida dos dados suavizados pressupõe que qualquer direção que os dados tenham seguido até agora continuará no futuro de forma consistente com a tendência. No mercado de ações, por exemplo, o desempenho passado não é uma indicação definitiva sobre o desempenho futuro, mas certamente pode ser um guia geral para o movimento futuro do preço das ações.

Métodos, vantagens e desvantagens do alisamento de dados

O alisamento de dados não é confundido com ajustando um modelo, , que faz parte da análise de dados consistindo de duas etapas:

  1. Encontre um adequado modelo que representa os dados.

  2. Certifique-se de que o modelo se adapta aos dados de forma eficaz.

O alisamento de dados concentra-se no estabelecimento de uma direção fundamental para os pontos de dados do núcleo por meio de (1) ignorar pontos de dados ruidosos e (2) desenhar uma curva mais suave através dos pontos de dados que salteiam os que se torciam e enfatiza padrões primários - tendências Os dados, não importa o quão lento seu surgimento. Conseqüentemente, em uma série de tempo numérico, o suavização de dados serve como uma forma de filtragem.

O alisamento de dados pode usar qualquer um dos seguintes métodos:

  • Random walk baseia-se na idéia de que o próximo resultado, ou ponto de dados futuro, é um desvio aleatório do último ponto de dados conhecido ou atual.

  • A média móvel é uma média em execução de períodos consecutivos e igualmente espaçados. Um exemplo seria o cálculo de uma média móvel de 200 dias de um preço de ações.

  • Suavização exponencial atribui exponencialmente mais peso ou importância aos pontos de dados recentes do que aos pontos de dados mais antigos.

    • Simples: Este método deve ser usado quando os dados da série temporal não apresentam tendências e sem sazonalidade.

    • Linear: Este método deve ser usado quando os dados da série temporal têm uma linha de tendência.

    • Sazonal: Este método deve ser usado quando os dados da série temporal não têm nenhuma tendência, mas a sazonalidade.

O que esses métodos de suavização têm em comum é que eles realizam algum tipo de processo de média em vários pontos de dados. Essa média de pontos de dados adjacentes é a maneira essencial para zero em tendências ou padrões subjacentes.

As vantagens do alisamento de dados são

  • É fácil de implementar.

  • Ajuda a identificar tendências.

  • Ajuda a expor os padrões nos dados.

  • Ele elimina os pontos de dados que você decidiu que não são de interesse.

  • Ajuda a prever a direção geral dos próximos pontos de dados observados.

  • Ele gera bons gráficos suaves.

Mas tudo tem uma desvantagem. As desvantagens do alisamento de dados são

  • Pode eliminar pontos de dados válidos resultantes de eventos extremos.

  • Pode levar a predições imprecisas se os dados do teste são apenas sazonais e não totalmente representativos da realidade que gerou os pontos de dados.

  • Pode mudar ou distorcer os dados, especialmente os picos, resultando em uma imagem distorcida do que está acontecendo.

  • Pode ser vulnerável a interrupções significativas dos valores atípicos dentro dos dados.

  • Pode resultar em um grande desvio dos dados originais.

Se o alisamento de dados não for mais do que dar aos dados uma simples facelift, ele pode criar um erro fundamental nas seguintes formas:

  • Ele pode introduzir erros através de distorções que tratam os dados suavizados como se fossem idênticos ao original dados.

  • Pode desviar a interpretação ao ignorar - e ocultar - os riscos incorporados nos dados.

  • Pode levar a uma perda de detalhes dentro de seus dados - o que é uma maneira de uma curva suavizada se desviar muito da dos dados originais.

Quão sério o alisamento de dados pode afetar seus dados depende da natureza dos dados em mãos e qual técnica de suavização foi implementada nesses dados.Por exemplo, se os dados originais tiverem mais picos nele, o alisamento de dados levará a grandes deslocamentos desses picos nos gráficos suavizados - provavelmente uma distorção.

Aqui estão alguns pontos de precaução a ter em mente ao abordar o alisamento de dados:

  • É uma boa idéia comparar gráficos suavizados com gráficos intocados que traçam os dados originais.

  • Os pontos de dados removidos durante o alisamento de dados podem não ser ruídos; eles podem ser válidos, pontos de dados reais que resultam de eventos raros, mas reais.

  • O alisamento de dados pode ser útil com moderação, mas o uso excessivo pode levar a uma falsa representação de seus dados.

Ao aplicar seu julgamento profissional e sua experiência em conhecimento de negócios, você pode usar o alisamento de dados efetivamente. A remoção de ruídos de seus dados - sem afetar negativamente a precisão e utilidade dos dados originais - é pelo menos tanto uma arte como uma ciência.

Como usar o Suavização de Dados em Analisadores Preditivos - dummies

Escolha dos editores

A Igreja Católica nos séculos XIV e XV - manequins

A Igreja Católica nos séculos XIV e XV - manequins

Enquanto o Papa Inocêncio III (1198-1216) ) sintetizou o zênite do poder e influência papal, o Papa Bonifácio VIII (1294-1303) personificou um dos pontificados mais complicados, misteriosos e às vezes contraditórios da Igreja. O rei Filipe IV da França e Bonifácio tornaram-se inimigos amargos no começo. Seu relacionamento piorou ao longo do tempo, e em 1303, Philip enviou mercenários ...

Catolicismo All-In-One For Dummies Cheat Sheet - dummies

Catolicismo All-In-One For Dummies Cheat Sheet - dummies

Enquanto diz as orações do Rosário, os católicos meditam sobre os chamados Mistérios Alegres, luminosos, dolorosos e gloriosos do Rosário. Mas dizer que os mistérios não são realmente mistérios, porque cada chamado mistério se refere a uma passagem diferente na vida de Cristo ou Maria, sua mãe. Cada década (um Nosso ...

10 Católicos famosos - manequins

10 Católicos famosos - manequins

Aqui está uma lista de dez dos católicos mais famosos, começando com os mais famosos. Mas tome cuidado: apenas ser batizado católico não significa que uma pessoa seja uma boa católica. A Igreja Católica acredita que um bom católico é aquele que regularmente e fielmente pratica sua fé todos os dias de sua vida. Uma pessoa ...

Escolha dos editores

Como girar objetos de desenho no PowerPoint 2007 - dummies

Como girar objetos de desenho no PowerPoint 2007 - dummies

O PowerPoint rotate handle permite que você dê os desenhos seus slides são inclinados. Com a alça de rotação do PowerPoint, você pode girar um objeto para qualquer ângulo arbitrário apenas arrastando-o com o mouse. O identificador de rotação é o identificador verde que aparece quando você seleciona um objeto que pode ser girado. A rotação ...

Como executar um programa através de uma hiperligação no PowerPoint 2013 - dummies

Como executar um programa através de uma hiperligação no PowerPoint 2013 - dummies

Uma hiperligação do PowerPoint pode também executar qualquer programa dentro de uma apresentação. Por exemplo, você pode criar uma apresentação que explica como comercializar um novo programa de computador e, em seguida, criar um hiperlink para o mesmo programa para que você possa demonstrar como esse programa realmente funciona. Quando você sair desse programa, você retorna para o seu ...

Como reorganizar slides na exibição do classificador de slides do PowerPoint 2016 - dummies

Como reorganizar slides na exibição do classificador de slides do PowerPoint 2016 - dummies

Exibição normal no PowerPoint 2016 is a visão em que você normalmente trabalha para editar seus slides, mover as coisas, adicionar texto ou gráficos, e assim por diante. No entanto, a Visão Normal tem uma limitação séria: não dá uma imagem muito importante da sua apresentação. Você pode ver os detalhes de apenas um slide em um ...

Escolha dos editores

Gerentes de comunidade on-line são multitarefas - manequins

Gerentes de comunidade on-line são multitarefas - manequins

Não só você tem que usar muitos chapéus como uma comunidade on-line gerente, mas às vezes você também sente que está vestindo todos eles ao mesmo tempo. Em qualquer dia, você pode esperar ter pelo menos meia dúzia de janelas do computador abertas ao mesmo tempo. Você pode ter ...

Community Manager: como representar a marca - dummies

Community Manager: como representar a marca - dummies

Como a representação mais pública do seu A marca, você, o gerente da comunidade online, é a pessoa a quem todos estarão buscando comentários, perguntas, sugestões e até propostas de negócios. Ao atuar como porta-voz da marca, você tem muitos itens a considerar: políticas sobre divulgação, transparência e o que divulgar ao público: Às vezes ...

Gerentes de comunidade on-line devem encontrar humor em situações difíceis - manequins

Gerentes de comunidade on-line devem encontrar humor em situações difíceis - manequins

Não todas as crises que enfrenta como on-line O gerente da comunidade tem que ser silencioso ou super sério. Você encontrará que as pessoas apreciam marcas que mostram um lado humano. Se você pode tratar a negatividade com humor e não insultar a inteligência de sua comunidade, você não só controlará os danos, mas também poderá atrair uma série de novos ...