Lar Finanças Pessoais Dados Mining - dummies

Dados Mining - dummies

Índice:

Vídeo: CURSO DE DATA MINING (MINERAÇÃO DE DADOS) AULA 01 2025

Vídeo: CURSO DE DATA MINING (MINERAÇÃO DE DADOS) AULA 01 2025
Anonim

A característica distintiva sobre a mineração de dados, em comparação com consultas, relatórios ou mesmo OLAP, é que você pode obter informações sem ter que fazer perguntas específicas.

A mineração de dados atende a dois papéis principais em sua missão de inteligência de negócios:

  • O papel "Diga-me o que pode acontecer": O primeiro papel da mineração de dados é preditivo, no qual você basicamente diz: "Diga-me o que pode acontecer. "Usando oculto conhecimento trancado em seu data warehouse, probabilidades e a probabilidade de futuras tendências e ocorrências são ferradas e apresentadas para você.

  • O papel "Conte-me algo interessante": Além de possíveis eventos e ocorrências futuras, a mineração de dados também tenta retirar informações interessantes que você provavelmente deve saber, como particularmente relacionamento incomum entre vendas de dois produtos diferentes e como essa relação varia de acordo com a colocação em suas lojas de varejo.

    Embora muitas dessas sugestões interessantes possam existir, quais perguntas você perguntaria se você estivesse usando uma ferramenta de consulta ou OLAP e como você interpreta os resultados? A mineração de dados ajuda você nesta árdua tarefa de descobrir quais as perguntas a fazer ao fazer um grande trabalho de grunhagem para você.

Exploração de dados em missões comerciais específicas

A mineração de dados é particularmente adequada para esses tipos específicos de missões comerciais:

  • Detectando fraude

  • Determinando a eficácia do programa de marketing

  • Selecionando quem, a partir de uma grande base de clientes ou a população em geral, você deve segmentar como parte de um programa de marketing

  • Gerenciando o ciclo de vida do cliente, incluindo a missão de retenção de clientes

  • Execução de modelos avançados de processos de negócios e cenários de problema

Pense sobre o que está por trás de cada uma das missões comerciais na lista anterior:

  • Uma grande quantidade de dados

  • Um ainda maior número de combinações de várias peças de dados

  • Análise de conjuntos de resultados intensivos, geralmente envolvendo algoritmos complexos e técnicas estatísticas avançadas

Agora, pense sobre o que você teria que fazer se você estivesse usando uma ferramenta de relatório ou OLAP para realizar essas missões. Você acharia praticamente impossível executar completamente qualquer uma das missões anteriores, se você tivesse que fazer uma pergunta e obter um resultado, fazer outra pergunta e obter outro resultado e, em seguida, continuar repetindo essas etapas.

Dados de mineração e inteligência artificial

Se você esteve no campo da tecnologia da informação (TI) há pelo menos uma década, alguns dos termos anteriores podem parecer vagamente familiares.Desbloqueando conhecimento escondido? Funcionalidade preditiva? Aguarde um minuto - isso é inteligência artificial!

Desde os primeiros dias da computação comercial, tem havido um tremendo interesse no desenvolvimento de "máquinas de pensamento" que podem processar grandes quantidades de dados e tomar decisões com base nessa análise.

O interesse pela inteligência artificial (AI) atingiu o seu ponto de vista em meados da década de 1980. Naquela época, os fornecedores de banco de dados trabalhavam na produção de sistemas de gerenciamento de base de conhecimento (KBMSs); outros fornecedores vieram com shells de sistema especializado, ou frameworks de desenvolvimento de aplicativos baseados em AI que usavam técnicas como encadeamento para frente e encadeamento para avisar os usuários sobre decisões; e as redes neurais foram posicionadas como o próximo grande desenvolvimento de AI.

O interesse pela AI diminuiu no início da década de 1990, quando as expectativas excederam as capacidades disponíveis e outros frenesi, como a migração de cliente / servidor e, obviamente, o armazenamento de dados, tomou o centro do palco.

Agora, AI está de volta!

A técnica de AI de perfil mais alto utilizada na mineração de dados é redes neurais. As redes neurais foram originalmente concebidas como um modelo de processamento que imitaria a maneira como o cérebro humano resolve problemas, usando neurônios e processamento altamente paralelo para fazer a resolução de padrões.

Aplicando algoritmos de rede neural às áreas de inteligência de negócios que os mecanismos de gerenciamento de dados (novamente, missões preditivas e "me dizem algo interessante") parece ser uma combinação natural.

Embora o jogo de rede de mineração de dados / rede neural vale definitivamente a pena verificar, você deve fazê-lo com cuidado. Você pode encontrar muitas tecnologias interessantes e excitantes que, nas mãos daqueles que não entendem os algoritmos, provavelmente falharão.

No entanto, com conhecimento e educação adequados, você pode assumir um compromisso em grande escala para trazer esse tipo de processamento para sua estrutura de business intelligence como o emparelhamento técnico-analítico para a análise de negócios com foco em OLAP.

Dados de mineração e estatísticas

A área mais madura de mineração de dados é a aplicação de técnicas estatísticas avançadas contra os grandes volumes de dados em seu data warehouse. Diferentes ferramentas utilizam diferentes tipos de técnicas estatísticas, adaptadas às áreas específicas que estão tentando abordar.

Sem um histórico estatístico, você pode achar muito confuso para a mineração de dados. Você precisa fazer muito trabalho para treinar os algoritmos e criar as regras para garantir resultados adequados com conjuntos de dados maiores. No entanto, supondo que você se sinta confortável com este conceito ou tenha um colega que possa ajudar, aqui estão alguns dos algoritmos mais amplamente alavancados:

  • Algoritmos de classificação: Prever uma ou mais variáveis ​​discretas, com base no outro atributos no conjunto de dados. Ao usar algoritmos de classificação, a ferramenta de mineração de dados pode analisar grandes quantidades de dados e, em seguida, informá-lo que, por exemplo, "Os clientes que são retidos através de pelo menos duas gerações de compras de produtos tendem a ter essas características: eles têm uma renda de pelo menos US $ 75.000, e eles possuem suas próprias casas."

  • Algoritmos de regressão: Preveja uma ou mais variáveis ​​contínuas, como lucro ou perda, com base em outros atributos no conjunto de dados. Os algoritmos de regressão são conduzidos através de informações históricas apresentadas à ferramenta de mineração de dados "ao longo do tempo", mais conhecidas como séries temporais .

  • Algoritmos de segmentação: Divida dados em grupos ou clusters de itens que possuem propriedades semelhantes.

  • Algoritmos de associação: Encontre correlações entre diferentes atributos em um conjunto de dados. A aplicação mais comum deste tipo de algoritmo cria regras de associação, que você pode usar em uma análise de cesta de mercado. Observe que, por exemplo, se um cliente adquire um pacote de software específico, ele ou ela tem uma chance de 65 por cento de comprar pelo menos dois pacotes de suplemento específicos do produto dentro de duas semanas.

  • Algoritmos de análise de seqüência: Resuma sequências ou episódios freqüentes em dados, como um fluxo de caminho da web.

Existem muitos outros métodos. Retire o antigo livro de estatísticas e comece a ler.

Dados Mining - dummies

Escolha dos editores

10 Klout Marcas a assistir - dummies

10 Klout Marcas a assistir - dummies

Algumas marcas com bons escores Klout estão simplesmente conectando-se recreativamente, enquanto outras são marcas com estratégias de mídia social completas e departamentos dedicados a servir seus clientes através de seus canais de mídia social. Uma marca que "obtém" é uma que pode promover seu serviço ou produto, mantendo a brincadeira pessoal e a conexão de uma amizade. ...

O aplicativo do Google SDK do iPhone do Google Analytics - dummies

O aplicativo do Google SDK do iPhone do Google Analytics - dummies

O uso de dispositivos de rastreamento agora faz parte da boa análise da web, desde que as pessoas usem o navegador móvel para alcançar suas páginas de destino e navegar no seu site. Alguns programas para rastrear métricas de mídia social tornam esse processo mais intuitivo do que outros. Para avançar com o Google Analytics SDK para o seu aplicativo para iPhone, siga estes ...

Noções básicas de métricas de conteúdo compartilhado - dummies

Noções básicas de métricas de conteúdo compartilhado - dummies

Métricas de conteúdo compartilhado recebem muita importância agora no espaço social da web. Na web social, o compartilhamento é um dado. Longe foram os dias em que as pessoas queriam visitar ou promover um site com conteúdo bloqueado. Se eles virem algo de valor, eles querem imediatamente dizer a todos que eles sabem ir ...

Escolha dos editores

Como usar o ponteiro de inserção no Word 2013 - dummies

Como usar o ponteiro de inserção no Word 2013 - dummies

A chave para tirar muitos truques no Word 2013 é saber como mover o ponteiro de inserção para o ponto exato que deseja. A beleza do processador de texto é que você pode editar qualquer parte do seu documento; você nem sempre precisa trabalhar no "fim". "Movendo o ponteiro de inserção ...

Como usar a régua para formatar um parágrafo no Word 2013 - dummies

Como usar a régua para formatar um parágrafo no Word 2013 - dummies

Formatação de parágrafo no Word 2013 pode ser confuso. Dois lugares na Faixa de opções são para formatação de parágrafo, ou se você optar por usar a caixa de diálogo Parágrafo, sua mente pode entrar em estado de choque com a abundância de opções. Uma maneira mais gráfica e, portanto, mais divertida de manipular a indentação e as margens de um parágrafo é ...

Como usar o Word 2010 Find Command - dummies

Como usar o Word 2010 Find Command - dummies

Palavra 2010 pode rapidamente e graficamente encontrar texto em seu documento, do mais pequeno texto de texto para a frase de execução mais longa do mundo. Essa pesquisa é tratada pelo comando Localizar do Word. Você pode usar esse comando em dois lugares diferentes. Pesquisando com o painel de navegação do Word 2010 O painel de navegação fornece-lhe um fácil ...

Escolha dos editores

Fantasia Desenhos de baseball: conselhos e estratégias - manequins

Fantasia Desenhos de baseball: conselhos e estratégias - manequins

Se você estiver pronto para a nova temporada de beisebol e é procurando conselhos para ajudá-lo a "subir" o resto da sua liga de fantasia, siga estas estratégias simples. Você estará à frente do pacote em nenhum momento. Crédito: © iStockphoto. com / justinkendra Saiba o que os utilitários funcionam melhor para a sua liga de fantasia Existem muitas maneiras diferentes ...

Fantasy Baseball Roster Cheat Sheet - manequins

Fantasy Baseball Roster Cheat Sheet - manequins

Ao investir tempo em uma liga de beisebol de fantasia, ajuda a saber quem é o top Os jogadores projetados estão em cada categoria. A seguinte lista é uma folha de truques dos 10 melhores jogadores em cada uma dessas categorias: Catchers First Basemen Outfielders Relief Pitchers Segundo Basemen Shortstops Starting Pitchers Third Basemen Crédito: © iStockphoto. Com / Kameleon007 Top 10 ...

Exemplo Prática de beisebol de uma hora - manequins

Exemplo Prática de beisebol de uma hora - manequins

A maior parte do tempo de um treinador de baseball é gasto na prática, então estruturando isso A prática de aproveitar ao máximo é importante. A lista a seguir oferece sugestões sobre quanto tempo gastar em quais atividades para uma prática de uma hora: 10 minutos: período de aquecimento. 20 minutos: Exercícios individuais e de equipe de 5 minutos: Base running ...