Vídeo: Python Tutorial for Beginners [Full Course] Learn Python for Web Development 2024
Por Meta S. Brown
A mineração de dados é a forma como os empresários comuns usam uma variedade de técnicas de análise de dados para descobrir informações úteis informações de dados e colocar essa informação em prática. Mineradores de dados não se preocupam com a teoria e os pressupostos. Eles validam suas descobertas testando. E eles entendem que as coisas mudam, então, quando a descoberta que funcionou como um encanto ontem não aguenta hoje, elas se adaptam.
As 9 Leis da Mineração de Dados: um Guia de Referência
O mineiro de dados pioneiro Thomas Khabaza desenvolveu suas "Nove Leis da Mineração de Dados" para orientar os novos mineiros de dados à medida que começam a trabalhar. Este guia de referência mostra o que cada uma dessas leis significa para o seu trabalho diário.
-
1ª Lei de Mineração de Dados, ou "Lei de Objetivos de Negócios": Os objetivos de negócios são a origem de cada solução de mineração de dados.
Um mineiro de dados é alguém que descobre informações úteis de dados para suportar objetivos comerciais específicos. A mineração de dados não é definida pela ferramenta que você usa.
-
2ª Lei da Mineração de Dados, ou "Lei do Conhecimento Empresarial": O Conhecimento Empresarial é central para cada etapa do processo de mineração de dados .
Você não precisa ser um estatístico elegante para fazer mineração de dados, mas você precisa saber algo sobre o que os dados significam e como o negócio funciona.
-
3ª Lei de Mineração de Dados ou "Lei de Preparação de Dados": A preparação de dados é mais de metade de todo processo de mineração de dados .
Praticamente todos os mineradores de dados passarão mais tempo na preparação de dados do que na análise.
-
4ª Lei da Mineração de Dados, ou "Nenhum Almoço Gratuito para o Minerador de Dados": O modelo certo para uma determinada aplicação só pode ser descoberto pela experiência .
Na mineração de dados, os modelos são selecionados por meio de tentativa e erro.
-
5ª Lei da Mineração de Dados: Existem sempre padrões nos dados .
Como mineiro de dados, você explora dados em busca de padrões úteis. A compreensão dos padrões nos dados permite influenciar o que acontece no futuro.
-
6ª Lei da Mineração de Dados, ou "Insight Law": A mineração de dados amplifica a percepção no domínio comercial .
Os métodos de mineração de dados permitem compreender melhor o seu negócio do que você poderia ter feito sem eles.
-
7ª Lei de Mineração de Dados ou "Lei de Predição": A previsão aumenta a informação localmente por generalização.
A mineração de dados nos ajuda a usar o que sabemos para fazer melhores previsões (ou estimativas) de coisas que não conhecemos.
-
8ª Lei de Mineração de Dados, ou "Lei do Valor": O valor dos resultados da mineração de dados não é determinado pela precisão ou estabilidade dos modelos preditivos .
Seu modelo deve produzir boas previsões, de forma consistente. É isso aí.
-
9ª Lei de Mineração de Dados, ou "Lei de Mudança": Todos os padrões estão sujeitos a alterações.
Qualquer modelo que lhe dê excelentes previsões hoje pode ser inútil amanhã.
Fases do processo de mineração de dados
O Processo padrão entre indústrias cruzadas para mineração de dados ( CRISP-DM ) é a estrutura dominante do processo de mineração de dados. É um padrão aberto; qualquer um pode usá-lo. A lista a seguir descreve as várias fases do processo.
-
Compreensão do negócio: Obtenha uma compreensão clara do problema que você está tentando resolver, como isso afeta sua organização e seus objetivos para abordá-lo. As tarefas nesta fase incluem:
-
Identificando seus objetivos de negócios
-
Avaliando sua situação
-
Definindo seus objetivos de mineração de dados
-
Produzindo seu plano de projeto
-
-
Compreensão de dados: Revise os dados que você possui, documentá-lo, identificar problemas de gerenciamento de dados e qualidade de dados. As tarefas para esta fase incluem:
-
Recolher dados
-
Descrevendo
-
Explorando
-
Verificar qualidade
-
-
Preparação de dados: Obtenha seus dados prontos para serem usados para modelagem. As tarefas para esta fase incluem:
-
Selecionando dados
-
Dados de limpeza
-
Construindo
-
Integrando
-
Formatação
-
-
Modelagem: Use técnicas matemáticas para identificar padrões em seus dados. As tarefas para esta fase incluem:
-
Selecionando técnicas
-
Projetando testes
-
Modelos de construção
-
Avaliando modelos
-
-
Avaliação: Revise os padrões que você descobriu e avalie seu potencial para uso comercial. As tarefas para esta fase incluem:
-
Avaliando os resultados
-
Revisando o processo
-
Determinando os próximos passos
-
-
Implantação: Coloque suas descobertas no trabalho diário. As tarefas para esta fase incluem:
-
Implementação de planejamento (seus métodos para integrar as descobertas de mineração de dados em uso)
-
Resultados finais de relatório
-
Revisão dos resultados finais
-