Vídeo: Machine Learning e Analise Preditiva 2024
Parte de Analytics Preditivos para Dummies Cheat Sheet
Um projeto de análise preditiva bem-sucedido é executado passo a passo. À medida que você mergulha nos detalhes do projeto, observe esses principais marcos:
-
Definindo Objetivos de Negócios
O projeto começa com o uso de um objetivo comercial bem definido. O modelo deve abordar uma questão comercial. Declarando claramente que esse objetivo permitirá que você defina o alcance do seu projeto e lhe fornecerá o teste exato para medir seu sucesso.
-
Preparando dados
Você usará dados históricos para treinar seu modelo. Os dados geralmente são dispersos em várias fontes e podem exigir limpeza e preparação. Os dados podem conter registros duplicados e outliers; dependendo da análise e do objetivo comercial, você decide se deseja mantê-los ou removê-los. Além disso, os dados podem ter valores em falta, podem precisar sofrer alguma transformação e podem ser usados para gerar atributos derivados que tenham mais poder preditivo para seu objetivo. Em geral, a qualidade dos dados indica a qualidade do modelo.
-
Amostragem de seus dados
Você precisará dividir seus dados em dois conjuntos: treinar e testar conjuntos de dados. Você constrói o modelo usando o conjunto de dados de treinamento. Você usa o conjunto de dados do teste para verificar a precisão da saída do modelo. Fazer isso é absolutamente crucial. Caso contrário, você corre o risco de superar seu modelo - treinando o modelo com um conjunto de dados limitado, a ponto de escolher todas as características (tanto o sinal quanto o ruído) que são verdadeiras para esse conjunto de dados específico. Um modelo que está superado para um conjunto de dados específico irá realizar miseravelmente quando você executá-lo em outros conjuntos de dados. Um conjunto de dados de teste garante uma maneira válida de medir com precisão o desempenho do seu modelo.
-
Construindo o Modelo
Às vezes, os dados ou os objetivos comerciais se prestam a um algoritmo ou modelo específico. Outras vezes, a melhor abordagem não é tão clara. À medida que você explora os dados, execute tantos algoritmos quanto possível; compare suas saídas. Baseie sua escolha do modelo final nos resultados globais. Às vezes você está melhor executando um conjunto de modelos simultaneamente nos dados e escolhendo um modelo final, comparando suas saídas.
-
Implementando o Modelo
Depois de construir o modelo, você deve implantá-lo para obter seus benefícios. Esse processo pode exigir a coordenação com outros departamentos. Aponte para a construção de um modelo implantável. Além disso, certifique-se de saber como apresentar seus resultados às partes interessadas da empresa de forma compreensível e convincente para que adotem seu modelo.Depois que o modelo for implantado, você precisará monitorar seu desempenho e continuar melhorando. A maioria dos modelos decai após um certo período de tempo. Mantenha seu modelo atualizado, atualizando-o com dados recém-disponíveis.