Lar Finanças Pessoais Como preparar dados para um modelo de análise preditiva - dummies

Como preparar dados para um modelo de análise preditiva - dummies

Índice:

Vídeo: Cap09 - O Que é Um Modelo Preditivo - Parte 1 2025

Vídeo: Cap09 - O Que é Um Modelo Preditivo - Parte 1 2025
Anonim

Quando você definiu os objetivos do modelo para análise preditiva, o próximo passo é identificar e preparar os dados que você usará para construir seu modelo. A sequência geral de passos parece assim:

  1. Identifique suas fontes de dados.

    Os dados podem estar em diferentes formatos ou residir em vários locais.

  2. Identifique como você irá acessar esses dados.

    Às vezes, você precisaria adquirir dados de terceiros, ou dados de propriedade de uma divisão diferente em sua organização, etc.

  3. Considere quais variáveis ​​incluir na sua análise.

    Uma abordagem padrão é iniciar com uma ampla gama de variáveis ​​e eliminar aqueles que não oferecem valores preditivos para o modelo.

  4. Determine se as variáveis ​​derivadas devem ser utilizadas.

    Em muitos casos, uma variável derivada (como a relação preço por lucro usada para analisar os preços das ações) teria maior impacto direto no modelo do que a variável bruta.

  5. Explore a qualidade dos seus dados, procurando entender tanto o estado quanto as limitações.

    A precisão das previsões do modelo está diretamente relacionada às variáveis ​​selecionadas e à qualidade de seus dados. Você gostaria de responder algumas questões específicas de dados neste ponto:

    • Os dados são completos?

    • Tem algum outliers?

    • Os dados precisam ser limpos?

    • Você precisa preencher valores perdidos, mantê-los como estão ou eliminá-los completamente?

Compreender seus dados e suas propriedades podem ajudá-lo a escolher o algoritmo que será mais útil na construção de seu modelo. Por exemplo:

  • Os algoritmos de regressão podem ser usados ​​para analisar dados de séries temporais.

  • Os algoritmos de classificação podem ser usados ​​para analisar dados discretos.

  • Os algoritmos de associação podem ser usados ​​para dados com atributos correlatos.

O conjunto de dados usado para treinar e testar o modelo deve conter informações comerciais relevantes para responder o problema que você está tentando resolver. Se o seu objetivo é (por exemplo) determinar qual cliente é susceptível de churn, o conjunto de dados que você escolher deve conter informações sobre os clientes que se agitaram no passado, além de clientes que não o fizeram.

Alguns modelos criados para extrair os dados e dar sentido às suas relações subjacentes - por exemplo, aqueles construídos com algoritmos de cluster - não precisam ter um resultado final específico em mente.

Dois problemas surgem ao lidar com dados à medida que você está construindo seu modelo: inadequada e excessiva.

Underfitting

Underfitting é quando seu modelo não consegue detectar nenhum relacionamento em seus dados.Isso geralmente é uma indicação de que as variáveis ​​essenciais - aquelas com poder preditivo - não foram incluídas em sua análise. Por exemplo, uma análise de estoque que inclui apenas dados de um mercado em alta (onde os preços gerais das ações estão subindo) não explica crises ou bolhas que podem trazer grandes correções para o desempenho geral dos estoques.

Falha na inclusão de dados que abrangem os mercados bear < e (quando os preços das ações estão caindo) mantém o modelo produzindo a melhor seleção de portfólio possível.

Overfitting

Overfitting é quando seu modelo inclui dados que não têm poder preditivo, mas é apenas específico para o conjunto de dados que você está analisando. Ruído - variações aleatórias no conjunto de dados - pode encontrar seu caminho no modelo, de modo que a execução do modelo em um conjunto de dados diferente produz uma grande queda no desempenho e precisão preditiva do modelo. A barra lateral que acompanha fornece um exemplo.

Se o seu modelo funcionar perfeitamente em um conjunto de dados específico e apenas for inferior ao teste quando você testá-lo em um conjunto de dados diferente, suspeite de superação.

Como preparar dados para um modelo de análise preditiva - dummies

Escolha dos editores

Como modelar paredes no SketchUp que se encontram em ângulos não diretos - manequins

Como modelar paredes no SketchUp que se encontram em ângulos não diretos - manequins

Se você estiver lidando com um canto no Sketchup que não é de 90 graus, você pode prosseguir de maneiras diferentes; Usar a ferramenta Intersect Faces é um ótimo lugar para começar. As etapas a seguir elaboram a técnica: Modelar cada segmento de parede reta de forma independente, mas não se sobrepõem às extremidades ainda. Construa cada parede para ...

Com a Ferramenta de Escala do SketchUp - dummies

Com a Ferramenta de Escala do SketchUp - dummies

Os heróis reais raramente são óbvios. A ferramenta Scale é o membro mais incompreendido do kit de ferramentas misericordioso. Novos modelistas assumem que o Scale é para redimensionar as coisas no seu modelo. Isso é tecnicamente verdadeiro, mas a maioria das pessoas só o usa para redimensionar objetos inteiros; o verdadeiro poder da Escala acontece quando você usa ...

Escolha dos editores

Ao se mover para um ambiente híbrido em nuvem pode ser benéfico - dummies

Ao se mover para um ambiente híbrido em nuvem pode ser benéfico - dummies

Para otimizar o benefício econômico de movendo-se para um ambiente de nuvem híbrido, você deve primeiro ter uma boa compreensão de seus requisitos de carga de trabalho. Normalmente, uma organização possui diversos tipos de carga de trabalho para gerenciar em seu centro de dados, e algumas dessas cargas de trabalho serão mais adequadas do que outras para um ambiente de nuvem híbrido. ...

Por que a orientação do serviço é importante para modelos de computação em nuvem - os serviços dummies

Por que a orientação do serviço é importante para modelos de computação em nuvem - os serviços dummies

São importantes para a computação em nuvem a partir de ambos uma infra-estrutura e uma perspectiva de aplicação. Quando você tem algum conhecimento sobre como adotar uma abordagem orientada para o serviço para projetar sistemas de tecnologia, você pode começar a ver a relação entre essa abordagem e a computação em nuvem. A orientação do serviço permeia a nuvem e a nuvem serve como ambiente ...

Híbridos Elementos Fundamentais da Nuvem - manequins

Híbridos Elementos Fundamentais da Nuvem - manequins

A nuvem híbrida requer elementos fundamentais para fazer um modelo híbrido trabalhar no mundo real. Embora existam muitos problemas e considerações técnicas ao usar a nuvem híbrida, a compreensão dos seguintes elementos é particularmente importante: serviços de virtualização: não é surpreendente que muitas empresas tenham aproveitado o tempo para agilizar seus data centers através de tecnologias ...

Escolha dos editores

Como criar e editar a configuração CLI do Junos - manequins

Como criar e editar a configuração CLI do Junos - manequins

Você cria ou edita a configuração do seu dispositivo em o modo de configuração da interface de linha de comando Junos (CLI). Para entrar no modo de configuração, use o comando configure no prompt do modo operacional: wiley @ netnik> configure Iniciando o modo de configuração [editar] wiley @ netnik # Isso permite que você crie ou edite a configuração do candidato. Enter set? Após o prompt do modo de configuração ...

Como criar um chassi virtual de dois ou mais Juniper EX Switches - manequins

Como criar um chassi virtual de dois ou mais Juniper EX Switches - manequins

Quando você deseja criar uma unidade de Chassi Virtual a partir de duas ou mais (até dez) switches da série EX, você normalmente as interconecta usando as portas dedicadas do Chassi Virtual (VCPs) de 64 Gbps na parte traseira do chassi do switch, que são projetadas exclusivamente para interruptores de interconexão (e que não requerem configuração extra no interruptor). Você ...

Como projetar um filtro de firewall Junos - manequins

Como projetar um filtro de firewall Junos - manequins

Para projetar um filtro de firewall Junos corretamente, você precisa saber Como Junos processa os filtros. Há duas considerações básicas a ter em conta para garantir que seus filtros de firewall Junos se comportem da maneira que você pretende: na maioria dos dispositivos, você pode aplicar vários filtros de firewall em uma cadeia ordenada. Se você aplicar o limite-ssh-telnet ...