Índice:
- Concentrando-se no negócio da mineração de dados
- Compreendendo como os mineiros de dados passam seu tempo
- Conhecendo o processo de mineração de dados
- Fazendo modelos
- Compreendendo os modelos matemáticos
- Colocando informações em ação
Vídeo: O que é Big Data - Conceitos básicos 2024
Se você acha de dados como matéria-prima e as informações que você pode obter de dados como algo valioso e relativamente refinado, o processo de extração de informações pode ser em comparação com a extração de metal de minério ou gemas da sujeira. Foi assim que o termo data mining se originou.
Concentrando-se no negócio da mineração de dados
Os mineros de dados não apenas ponderam dados sem rumo, esperando encontrar algo interessante. Todo projeto de mineração de dados começa com um problema de negócios específico e um objetivo para combinar.
Como mineiro de dados, você provavelmente não terá autoridade para tomar decisões finais de negócios, por isso é importante que alinhe seu trabalho com as necessidades dos tomadores de decisão. Você deve entender seus problemas, necessidades e preferências e concentrar seus esforços no fornecimento de informações que suportam boas decisões de negócios.
O seu próprio conhecimento comercial é muito importante. Os executivos não vão se sentar ao seu lado enquanto trabalham, fornecendo feedback sobre a relevância de suas descobertas para suas preocupações. Você deve usar sua própria experiência e perspicácia para julgar isso por você enquanto trabalha.
Compreendendo como os mineiros de dados passam seu tempo
Seria ótimo se os mineros de dados pudessem passar o dia fazendo descobertas que mudassem a vida, construindo modelos valiosos e integrando-os aos negócios cotidianos. Mas é como dizer que seria ótimo se os atletas pudessem passar todos os torneios vencedores do dia. É preciso muita preparação para construir esses momentos de triunfo. Assim, como atletas, os mineiros de dados gastam muito tempo na preparação.
Conhecendo o processo de mineração de dados
Um bom processo de trabalho ajuda você a aproveitar ao máximo seu tempo, seus dados e todos os outros recursos. Neste livro, você descobrirá o processo de mineração de dados mais popular, CRISP-DM. É um ciclo de descoberta e ação de seis fases criado por um consórcio de mineiros de dados de várias indústrias e um padrão aberto que qualquer um pode usar.
As fases do processo CRISP-DM são
-
Compreensão de negócios
-
Compreensão de dados
-
Preparação de dados
-
Modelagem
-
Avaliação
-
Implantação (usando modelos no negócio cotidiano)
Cada A fase traz igual peso em importância para a qualidade dos resultados e valor para o negócio. Mas em termos do tempo necessário, a preparação de dados domina. A preparação de dados geralmente leva mais tempo do que todas as outras fases do processo de mineração de dados combinadas.
Fazendo modelos
Quando os objetivos são compreendidos, e os dados são limpos e prontos para usar, você pode voltar sua atenção para construir modelos preditivos.Os modelos fazem o que os relatórios não podem; Eles lhe dão informações que apóiam a ação.
Um relatório pode dizer que as vendas estão baixas. Pode quebrar as vendas por região, produto e canal para que você saiba onde as vendas diminuíram e se essas quedas foram generalizadas ou afetadas apenas em certas áreas. Mas eles não lhe dão pistas sobre porque vendas declinaram ou quais ações podem ajudar a reviver o negócio.
Os modelos ajudam você a entender os fatores que afetam as vendas, as ações que tendem a aumentar ou diminuir as vendas e as estratégias e táticas que mantêm o seu negócio funcionando sem problemas. Isso é emocionante, não é? Talvez seja por isso que a maioria dos mineradores de dados considera que a modelagem é a parte divertida do trabalho.
Compreendendo os modelos matemáticos
Os modelos matemáticos são fundamentais para a mineração de dados, mas o que eles são? O que eles fazem, como eles funcionam e como eles são criados?
Um modelo matemático é, simples e simples, uma equação ou conjunto de equações que descrevem uma relação entre duas ou mais coisas. Tais equações são taquigrafia para teorias sobre o funcionamento da natureza e da sociedade. A teoria pode ser apoiada por uma substancial evidência ou pode ser apenas um palpite selvagem. O idioma da matemática é o mesmo em ambos os casos.
Termos como modelo preditivo, modelo estatístico, ou modelo linear referem-se a tipos específicos de modelos matemáticos, os nomes que refletem o uso pretendido, o formulário ou o método de derivação um modelo particular. Estes três exemplos são apenas alguns desses termos.
Quando um modelo é mencionado em uma configuração de negócios, provavelmente é um modelo usado para fazer previsões. Os modelos são usados para prever preços de ações, vendas de produtos e taxas de desemprego, entre muitas outras coisas.
Estas previsões podem ou não ser precisas, mas para qualquer dado conjunto de valores (fatores conhecidos como estes são chamados variáveis independentes ou entradas ) incluídos no modelo, você irá encontre uma predição bem definida (também chamada de variável dependente, saída, ou resultado ). Os modelos matemáticos também são usados para outros fins nos negócios, como descrever os mecanismos de trabalho que conduzem um processo particular.
Na mineração de dados, você cria modelos ao encontrar padrões em dados usando métodos de aprendizado de máquina ou estatística. Os mineradores de dados não seguem a mesma abordagem rigorosa que os estatísticos clássicos fazem, mas todos os modelos são derivados de dados reais e técnicas consistentes de modelagem matemática. Todos os modelos de mineração de dados são suportados por um conjunto de evidências.
Por que usar modelos matemáticos? Os mesmos relacionamentos não podiam ser descritos usando palavras? Isso é possível, mas você encontra certas vantagens para o uso de equações. Estes incluem
-
Conveniência: Em comparação com descrições equivalentes escritas em frases, as equações são breves. O simbolismo matemático evoluiu especificamente para o propósito de representar relações matemáticas; idiomas como o inglês não.
-
Claridade: As equações transmitem idéias sucintamente e são inequívocas.Eles não estão sujeitos a diferentes interpretações baseadas na cultura, e o simbolismo da matemática é uma espécie de linguagem comum amplamente utilizada em todo o mundo.
-
Consistência: Como as representações matemáticas são inequívocas, as implicações de qualquer situação particular são claramente definidas por um modelo matemático.
Colocando informações em ação
Um modelo só oferece valor quando você usa o negócio. As previsões de um modelo podem apoiar a tomada de decisões de várias maneiras. Você pode
-
Incorporar previsões em um relatório ou apresentação para ser usado na tomada de uma decisão específica.
-
Integre o modelo em um sistema operacional (como um sistema de atendimento ao cliente) para fornecer previsões em tempo real para o uso diário. (Por exemplo, você pode sinalizar as reivindicações de seguro para pagamento imediato, negação imediata ou posterior investigação.)
-
Use o modelo para previsões em lotes. (Por exemplo, você pode marcar a lista interna de clientes para decidir quais clientes devem receber uma oferta específica.)