Índice:
- Exploração de dados em missões comerciais específicas
- Dados de mineração e inteligência artificial
- Dados de mineração e estatísticas
Vídeo: CURSO DE DATA MINING (MINERAÇÃO DE DADOS) AULA 01 2024
A característica distintiva sobre a mineração de dados, em comparação com consultas, relatórios ou mesmo OLAP, é que você pode obter informações sem ter que fazer perguntas específicas.
A mineração de dados atende a dois papéis principais em sua missão de inteligência de negócios:
-
O papel "Diga-me o que pode acontecer": O primeiro papel da mineração de dados é preditivo, no qual você basicamente diz: "Diga-me o que pode acontecer. "Usando oculto conhecimento trancado em seu data warehouse, probabilidades e a probabilidade de futuras tendências e ocorrências são ferradas e apresentadas para você.
-
O papel "Conte-me algo interessante": Além de possíveis eventos e ocorrências futuras, a mineração de dados também tenta retirar informações interessantes que você provavelmente deve saber, como particularmente relacionamento incomum entre vendas de dois produtos diferentes e como essa relação varia de acordo com a colocação em suas lojas de varejo.
Embora muitas dessas sugestões interessantes possam existir, quais perguntas você perguntaria se você estivesse usando uma ferramenta de consulta ou OLAP e como você interpreta os resultados? A mineração de dados ajuda você nesta árdua tarefa de descobrir quais as perguntas a fazer ao fazer um grande trabalho de grunhagem para você.
Exploração de dados em missões comerciais específicas
A mineração de dados é particularmente adequada para esses tipos específicos de missões comerciais:
-
Detectando fraude
-
Determinando a eficácia do programa de marketing
-
Selecionando quem, a partir de uma grande base de clientes ou a população em geral, você deve segmentar como parte de um programa de marketing
-
Gerenciando o ciclo de vida do cliente, incluindo a missão de retenção de clientes
-
Execução de modelos avançados de processos de negócios e cenários de problema
Pense sobre o que está por trás de cada uma das missões comerciais na lista anterior:
-
Uma grande quantidade de dados
-
Um ainda maior número de combinações de várias peças de dados
-
Análise de conjuntos de resultados intensivos, geralmente envolvendo algoritmos complexos e técnicas estatísticas avançadas
Agora, pense sobre o que você teria que fazer se você estivesse usando uma ferramenta de relatório ou OLAP para realizar essas missões. Você acharia praticamente impossível executar completamente qualquer uma das missões anteriores, se você tivesse que fazer uma pergunta e obter um resultado, fazer outra pergunta e obter outro resultado e, em seguida, continuar repetindo essas etapas.
Dados de mineração e inteligência artificial
Se você esteve no campo da tecnologia da informação (TI) há pelo menos uma década, alguns dos termos anteriores podem parecer vagamente familiares.Desbloqueando conhecimento escondido? Funcionalidade preditiva? Aguarde um minuto - isso é inteligência artificial!
Desde os primeiros dias da computação comercial, tem havido um tremendo interesse no desenvolvimento de "máquinas de pensamento" que podem processar grandes quantidades de dados e tomar decisões com base nessa análise.
O interesse pela inteligência artificial (AI) atingiu o seu ponto de vista em meados da década de 1980. Naquela época, os fornecedores de banco de dados trabalhavam na produção de sistemas de gerenciamento de base de conhecimento (KBMSs); outros fornecedores vieram com shells de sistema especializado, ou frameworks de desenvolvimento de aplicativos baseados em AI que usavam técnicas como encadeamento para frente e encadeamento para avisar os usuários sobre decisões; e as redes neurais foram posicionadas como o próximo grande desenvolvimento de AI.
O interesse pela AI diminuiu no início da década de 1990, quando as expectativas excederam as capacidades disponíveis e outros frenesi, como a migração de cliente / servidor e, obviamente, o armazenamento de dados, tomou o centro do palco.
Agora, AI está de volta!
A técnica de AI de perfil mais alto utilizada na mineração de dados é redes neurais. As redes neurais foram originalmente concebidas como um modelo de processamento que imitaria a maneira como o cérebro humano resolve problemas, usando neurônios e processamento altamente paralelo para fazer a resolução de padrões.
Aplicando algoritmos de rede neural às áreas de inteligência de negócios que os mecanismos de gerenciamento de dados (novamente, missões preditivas e "me dizem algo interessante") parece ser uma combinação natural.
Embora o jogo de rede de mineração de dados / rede neural vale definitivamente a pena verificar, você deve fazê-lo com cuidado. Você pode encontrar muitas tecnologias interessantes e excitantes que, nas mãos daqueles que não entendem os algoritmos, provavelmente falharão.
No entanto, com conhecimento e educação adequados, você pode assumir um compromisso em grande escala para trazer esse tipo de processamento para sua estrutura de business intelligence como o emparelhamento técnico-analítico para a análise de negócios com foco em OLAP.
Dados de mineração e estatísticas
A área mais madura de mineração de dados é a aplicação de técnicas estatísticas avançadas contra os grandes volumes de dados em seu data warehouse. Diferentes ferramentas utilizam diferentes tipos de técnicas estatísticas, adaptadas às áreas específicas que estão tentando abordar.
Sem um histórico estatístico, você pode achar muito confuso para a mineração de dados. Você precisa fazer muito trabalho para treinar os algoritmos e criar as regras para garantir resultados adequados com conjuntos de dados maiores. No entanto, supondo que você se sinta confortável com este conceito ou tenha um colega que possa ajudar, aqui estão alguns dos algoritmos mais amplamente alavancados:
-
Algoritmos de classificação: Prever uma ou mais variáveis discretas, com base no outro atributos no conjunto de dados. Ao usar algoritmos de classificação, a ferramenta de mineração de dados pode analisar grandes quantidades de dados e, em seguida, informá-lo que, por exemplo, "Os clientes que são retidos através de pelo menos duas gerações de compras de produtos tendem a ter essas características: eles têm uma renda de pelo menos US $ 75.000, e eles possuem suas próprias casas."
-
Algoritmos de regressão: Preveja uma ou mais variáveis contínuas, como lucro ou perda, com base em outros atributos no conjunto de dados. Os algoritmos de regressão são conduzidos através de informações históricas apresentadas à ferramenta de mineração de dados "ao longo do tempo", mais conhecidas como séries temporais .
-
Algoritmos de segmentação: Divida dados em grupos ou clusters de itens que possuem propriedades semelhantes.
-
Algoritmos de associação: Encontre correlações entre diferentes atributos em um conjunto de dados. A aplicação mais comum deste tipo de algoritmo cria regras de associação, que você pode usar em uma análise de cesta de mercado. Observe que, por exemplo, se um cliente adquire um pacote de software específico, ele ou ela tem uma chance de 65 por cento de comprar pelo menos dois pacotes de suplemento específicos do produto dentro de duas semanas.
-
Algoritmos de análise de seqüência: Resuma sequências ou episódios freqüentes em dados, como um fluxo de caminho da web.
Existem muitos outros métodos. Retire o antigo livro de estatísticas e comece a ler.