Lar Finanças Pessoais E Data Mining - dummies

E Data Mining - dummies

Vídeo: What is Data Mining? 2024

Vídeo: What is Data Mining? 2024
Anonim
  • Os dados coletados por grandes organizações no curso do negócio cotidiano geralmente são armazenados em bancos de dados. Mas os administradores de banco de dados podem não estar dispostos a permitir que os mineiros de dados tenham acesso direto a esses as fontes de dados e o acesso direto podem também não ser a melhor opção do seu ponto de vista. O acesso direto aos bancos de dados operacionais (usados ​​para operações comerciais de rotina) pode ser uma má idéia porque Os mineradores de dados usam muitos dados. > Você poderia unir involuntariamente os recursos e interferir nas operações comerciais normais.

  • As obrigações legais e de outra empresa são importantes. Você pode violar involuntariamente uma lei de privacidade de dados ou outro gerenciamento de dados requisito se o seu acesso a dados não for devidamente controlado.

  • Os bancos de dados operacionais não estão organizados para a mineração de dados. Você pode gastar muito tempo lutando para obter os dados que precisa e ainda não tem certeza de corrigi-lo.

Quando você precisa de dados de um banco de dados operacional (e você tem a aprovação apropriada para usar os dados), você deve discutir suas necessidades com o administrador responsável por esses dados. Você precisará explicar exatamente quais dados você precisa, o formato que você precisa para a mineração de dados e se você precisa dos dados apenas uma vez ou de forma contínua.

A melhor abordagem para solicitações únicas é muitas vezes para o administrador extrair os dados para você e entregá-lo em um arquivo de texto ou outro formato aceitável.

O acesso contínuo aos dados é outro assunto. O administrador pode não querer fornecer extratos de dados mais e mais, e dar-lhe acesso direto a sistemas de negócios é arriscado. Uma solução comum é criar um banco de dados analítico . Este é um banco de dados relacional comum que é separado dos sistemas comerciais convencionais. Os dados são rotineiramente (e automaticamente) transferidos de sistemas de negócios para o banco de dados analítico, e os mineradores de dados podem acessá-lo a qualquer momento.

Se você usa um banco de dados analítico, verifique se ele está organizado corretamente para suportar a mineração de dados. Ajude o administrador do banco de dados esboçando um diagrama como O que demonstra demonstrar como os dados devem ser organizados.

Se o administrador do banco de dados insistir que os dados não podem ser armazenados dessa maneira, pergunte se é possível criar uma vista (uma consulta armazenada que pode ser consultada como se fosse uma tabela de dados convencional) com a organização que você precisa.

Muitos produtos de mineração de dados podem ler dados de bancos de dados. As etapas necessárias variam de acordo com o

  • Design da aplicação de mineração de dados

  • Estrutura do banco de dados de origem

  • Middleware, geralmente chamado de driver ( driver ODBC, driver JDBC <), software especial que medeia entre o banco de dados e o software de aplicativos A documentação para seu aplicativo de mineração de dados deve indicar se ele pode ler dados de um banco de dados e, em caso afirmativo, qual ferramenta ou função usar e como.O administrador que configura o banco de dados analítico pode fornecer detalhes sobre como acessar o banco de dados.

Se você já está confortável em trabalhar com bancos de dados e outros aplicativos, não encontrará nada de surpreendente ao fazer as mesmas coisas com um aplicativo de mineração de dados. Se os bancos de dados forem novos para você, obtenha uma pessoa conhecedora da sua organização para orientá-lo através do processo com seu próprio banco de dados e aplicativo de mineração de dados.

E Data Mining - dummies

Escolha dos editores

Origem e Design de Hadoop - dummies

Origem e Design de Hadoop - dummies

Então, o que é exatamente isso com o nome engraçado - Hadoop? No seu núcleo, o Hadoop é uma estrutura para armazenar dados em grandes clusters de hardware de commodities - hardware de computador todos os dias acessível e facilmente disponível - e executando aplicativos contra esses dados. Um cluster é um grupo de computadores interligados (conhecido como ...

A arquitetura do porco em Hadoop - dummies

A arquitetura do porco em Hadoop - dummies

"Simples" geralmente significa "elegante" quando se trata de desenhos arquitetônicos para Essa nova mansão do Vale do Silício que você planejou quando o dinheiro começa a rolar depois de implementar o Hadoop. O mesmo princípio se aplica à arquitetura de software. O porco é composto por dois componentes (count 'em, two): O próprio idioma: como prova de que os programadores ...

MapReduce Application Flow em Hadoop - dummies

MapReduce Application Flow em Hadoop - dummies

No seu núcleo, MapReduce é um modelo de programação para o processamento de conjuntos de dados que são armazenados de forma distribuída nos nós de escravo de um cluster Hadoop. O conceito-chave aqui é dividir e conquistar. Especificamente, você deseja quebrar um grande conjunto de dados em muitas peças menores e processá-las em paralelo com o mesmo algoritmo. ...

Escolha dos editores

Apoiando a sua campanha PPC com análise de palavras-chave - manequins

Apoiando a sua campanha PPC com análise de palavras-chave - manequins

A base de todo o trabalho do mecanismo de pesquisa é uma análise de palavras-chave. Fazer uma análise de palavras-chave realmente não é tão complicado e pode significar a diferença entre sucesso e falha em sua campanha PPC. Comece digitando as palavras-chave óbvias em um editor de texto ou processador de texto - aqueles que você já pensou ou, se você ...

Envie seu site para Yahoo! Search Directory - dummies

Envie seu site para Yahoo! Search Directory - dummies

Envios para o Yahoo! O diretório costumava ser muito difícil. Pesquisas mostraram que as pessoas que conseguiram obter seus sites listados no diretório tiveram que tentar várias vezes em questão de meses. Era grátis, mas era um aborrecimento. A boa notícia: você pode obter seu site listado em Yahoo! Diretório ...

Dicas para criar e otimizar conteúdo para objetos e indústrias difíceis - manequins

Dicas para criar e otimizar conteúdo para objetos e indústrias difíceis - manequins

Em A superfície, a criação de conteúdo não soa tão difícil até você se sentar e tentar escrever. Sua estratégia de SEO depende desse conteúdo. É ainda pior se você estiver escrevendo conteúdo para o que muitas pessoas podem considerar uma indústria chata. A boa notícia é que é possível transformar indivíduos potencialmente chatos em bons ...

Escolha dos editores

Componentes eletrônicos: transistores como um potenciômetro mágico - manequins

Componentes eletrônicos: transistores como um potenciômetro mágico - manequins

Um transistor dentro de um O circuito eletrônico funciona como uma combinação de um diodo e um resistor variável, também chamado de potenciômetro ou pote. Mas isso não é apenas um pote comum; é um pote mágico cujo botão é misteriosamente conectado ao diodo por raios invisíveis, tipo desse tipo: quando a tensão direta é aplicada em ...

Componentes eletrônicos: Resistores - manequins

Componentes eletrônicos: Resistores - manequins

Um resistor é um pequeno componente projetado para fornecer um específico quantidade de resistência em um circuito eletrônico. Como a resistência é um elemento essencial de quase todos os circuitos eletrônicos, você usará resistores em quase todos os circuitos que você constrói. Embora os resistores venham em uma variedade de tamanhos e formas, o tipo mais comum ...