Como trabalhar com dados do programa de fidelidade - manequins
Se você possui um programa de fidelidade e os dados que produz, O que você deveria fazer com isso? Como um mineiro de dados, é seu papel fornecer aos decisores uma análise que suporte o negócio. Alguns executivos entendem programas de fidelidade e podem solicitar informações específicas, talvez mais do que você tem horas para ...
Investigar variáveis com gráficos de barras e histogramas - dummies
Uma parte básica da fase de compreensão de dados dos dados O processo de mineração está investigando as variáveis uma de cada vez, revisando suas distribuições e verificando problemas óbvios de qualidade de dados. Gráficos de barras e histogramas são resumos visuais que tornam fácil e rápido entender as distribuições variáveis. Os dois tipos de gráfico são muito semelhantes. Se a variável ...
Manter o Big Data Analytics in Perspective - dummies
Grandes dados estão começando a ter um impacto importante na estratégia de negócios. Devido à crescente importância dos grandes dados, manter a análise de dados em perspectiva é uma boa prática comercial. As empresas estão começando a perceber que podem começar a alavancar dados ao longo do ciclo de planejamento e não ao final. À medida que o grande mercado de dados começa ...
Chave-Value Stores em NoSQL - dummies
Armazenamento de valor-chave NoSQL tem uma gravação com um campo ID - o chave nas lojas de valor-chave e um conjunto de dados. Esses dados podem ser um dos seguintes: Um dado arbitrário que o desenvolvedor do aplicativo interpreta (em oposição ao banco de dados) Qualquer conjunto de pares nome-valor (chamado de caixas) Pense nisso ...
Dados de rotulagem - dummies
Usando códigos de dados reduz o tempo de entrada de dados, evita erros e reduz os requisitos de memória para armazenar os dados. Mas os códigos não são significativos, a menos que você tenha documentação, ou rótulos, para explicar seu significado. Alguns formatos de dados permitem que você aproveite as vantagens de usar códigos enquanto mantém as informações sobre o significado do ...
Colocando a base para sua grande estratégia de dados - dummies
As empresas estão nadando em grandes dados. O problema é que muitas vezes não sabem como usar pragmaticamente esses dados para poder prever o futuro, executar processos comerciais importantes ou simplesmente obter novos conhecimentos. O objetivo de sua grande estratégia e plano de dados deve ser encontrar uma maneira pragmática de alavancar dados ...
Programas de fidelização e mineração de dados - manequins
Um programa de fidelidade é um acordo entre uma empresa e seus clientes. Os clientes concordam em permitir que a empresa acompanhe as compras (e, possivelmente, outras ações também) e, em troca, a empresa oferece recompensas. Recompensas típicas incluem preços mais baixos ou um produto ou serviço gratuito. Você pode estar envolvido em vários programas de fidelidade como ...
Localizando o Algoritmo que você precisa - manequins
A tabela a seguir descreve algoritmos e tipos de algoritmos que você pode achar úteis para vários tipos de análise de dados. (Você pode encontrar discussões de todos esses algoritmos em Algoritmos para Dummies.) Algoritmo Descrição Link Útil A * Pesquisa O algoritmo rastreia o custo dos nós à medida que os explora usando a equação: f (n) = g (n) ...
Conheça o Original Data Miner: Tom Khabaza - dummies
Como Tom Khabaza chegou para estabelecer as leis de mineração de dados? Há algo a ser dito para ser o primeiro na cena. Khabaza iniciou a exploração de dados no início da década de 1990, quando poucas pessoas já ouviram falar da mineração de dados, e muito menos tentaram. Ele começou sua carreira em psicologia e gravitou para ...
Mesclando e anexando dados - manequins
Quando seus dados estão em mais de um lugar, você precisa de maneiras de juntar tudo . Quando você junta dois conjuntos de dados com diferentes variáveis, você está mesclando dados. A fusão é uma operação comum. A fusão é usada com freqüência na mineração de dados, combinando dados vinculados, como registros de clientes e dados da campanha de marketing antes e depois do teste ...
Gerenciamento de disponibilidade no NoSQL - dummies
Como com outros tipos de banco de dados NoSQL, com lojas de valor-chave, você pode trocar alguma consistência para alguma disponibilidade. As lojas de valor-chave geralmente fornecem uma ampla gama de modelos de consistência e durabilidade - isto é, entre disponibilidade e tolerância de partição e entre tolerância consistente e de partição. Algumas lojas de valor-chave vão muito mais longe no braço de consistência, abandonando BASE ...
Novas dimensões para o grande ciclo de planejamento de dados - manequins
Com o advento de dados importantes, algumas mudanças podem Impacte a maneira como você aborda o planejamento de negócios. À medida que mais empresas começam a usar a nuvem como forma de implantar serviços novos e inovadores para os clientes, o papel da análise de dados explodirá. Você pode querer pensar sobre outra parte do seu processo de planejamento. Depois de ...
De NoSQL gerenciando diferentes tipos de dados com NoSQL - dummies
Os bancos de dados noSQL não estão restritos a uma abordagem de linhas e colunas . Eles são projetados para lidar com uma grande variedade de dados, incluindo dados cuja estrutura muda ao longo do tempo e cujas inter-relações ainda não são conhecidas. Os bancos de dados NoSQL vêm em quatro tipos principais: um para cada tipo de dados que o banco de dados deve gerenciar: Columnar: Extensão para ...
Dados correspondentes para algoritmos de várias fontes - dummies
Interagindo com dados de uma única fonte é um problema; > dados correspondentes para Algoritmos de várias fontes
Gerenciando Keys no NoSQL - dummies
As capacidades de leitura rápida das lojas de valor-chave derivam do uso de chaves bem definidas. Essas chaves são tipicamente hash, o que fornece a uma loja de valores-chave uma maneira muito previsível de determinar quais dados de partição (e, portanto, servidor) reside. Um servidor específico gerencia uma ou mais partições. Uma boa chave permite que você identifique exclusivamente a gravação única ...
Gerenciando dados no NoSQL - dummies
Uma vez que você gerencia as chaves adequadamente, você está pronto para projetar como armazenar dados com NoSQL e garantir que seja seguro e sempre acessível para o trabalho que você precisa fazer. Tipos de dados em lojas de valores-chave As lojas de valor-chave normalmente atuam como & ldquo; baldes & rdquo; para dados binários. Alguns bancos de dados fornecem uma forte digitação de dados internos e até ...
Apache Zookeeper e bases de dados NoSQL - dummies
Um grande cluster de bases de dados NoSQL é uma coisa difícil de gerenciar. Apache Zookeeper para o resgate! Manter o controle de quais nós estão no cluster, quais dados cada um está gerenciando e garantir que os novos mestres sejam selecionados quando um mestre falhar não são tarefas fáceis. A coordenação de grandes sistemas distribuídos é, portanto, muito difícil. Hadoop ...
Gerenciando informações do usuário com NoSQL - dummies
Há dados de missão crítica, e há dados de suporte. Está tudo bem se os seus dados de missão crítica aparecer um pouco devagar porque você quer ter certeza de que ele é seguro e gerenciado corretamente. Mas você não quer que os dados de suporte da sua aplicação prejudiquem as transações gerais e as experiências dos usuários. Embora os dados de suporte possam ter menor valor, é ...
Triplo e Graph Stores - dummies
As lojas triplas parecem romper com as convenções associadas ao NoSQL. Por um lado, eles são todos compatíveis com ACID. Ao contrário dos bancos de dados NoSQL mais atuais, muitas lojas triplas são exclusivas. Além disso, existem padrões abertos para aplicações semânticas de uma maneira que não é o caso das lojas de valor-chave, das lojas Bigtable / wide column e dos bancos de dados NoSQL do documento. Totalmente viciado em ...
Outros bancos de dados híbridos NoSQL - dummies
Existem alguns bancos de dados NoSQL que provavelmente ouviu falar frequentemente - OrientDB e MarkLogic e talvez ArangoDB. No entanto, existem outros bancos de dados híbridos NoSQL de interesse. FoundationDB FoundationDB é uma loja de código-chave compatível com ACID e código aberto. O que é exclusivo sobre o FoundationDB é que ele é projetado para permitir que os desenvolvedores conectem eficientemente seus próprios dados ...
Recursos de pesquisa noSQL a considerar - dummies
Muitos bancos de dados NoSQL suportam recursos de consulta e determinadas capacidades de pesquisa. Escolher o direito, muitas vezes se resume a compreender os recursos que você precisa suportar. Embora estejam relacionados, a consulta e a pesquisa são bastante diferentes. Uma consulta retorna apenas os resultados que combinam todos os termos nele. A pesquisa, por outro lado, pode incluir ...
Microtargeting para ganhar eleições - dummies
A maioria das campanhas políticas depende de consultores para fornecer pesquisa de eleitores, ou então passar por muito informal avaliações das atitudes dos eleitores e interesse em votar para um determinado candidato (ou votar em tudo). Mas nos últimos anos, certas campanhas políticas, incluindo campanhas candidatas e de problemas, começaram a usar microtargeting, programas organizados de pesquisa ...
NoSQL e Search Engines - dummies
Pode parecer estranho mencionar motores de busca e NoSQL juntos, mas muitos dos motores de busca de hoje use uma arquitetura muito semelhante aos bancos de dados NoSQL. Seus índices e processamento de consulta estão altamente distribuídos. Muitos motores de busca são mesmo capazes de atuar como uma loja de valores-chave ou de documentos por conta própria. Os bancos de dados NoSQL são muitas vezes ...
Organizando dados para mineração - dummies
A mineração de dados tem requisitos muito rígidos para a organização de dados. Não são exigências exóticas, complexas ou difíceis de cumprir, mas são rigorosas. A figura mostra uma amostra de dados vistos como uma tabela no software de mineração de dados. Cada linha representa uma parcela de imóveis. Informações sobre as encomendas de imóveis estão organizadas em ...
10 Aplicativos NoSQL assassinos - dummies
Muitas vezes as pessoas adquirem uma plataforma específica por causa dos aplicativos assassinos que são executados nele. Muitos aplicativos baseados em NoSQL se enquadram na categoria de aplicativos assassinos. Essas aplicações não poderiam se tornar realidade usando tecnologias de banco de dados relacionais existentes. Plataforma de mensagens do Facebook A Apache Cassandra foi criada pelo Facebook para alimentar sua Caixa de entrada. Isso fez isso para um ...
Características não tão comuns de NoSQL - dummies
Embora alguns recursos sejam bastante comuns aos bancos de dados NoSQL ( por exemplo, agnosticismo de esquema e estrutura não-relacional), não é incomum que um banco de dados não tenha um ou mais dos seguintes recursos e ainda se qualifique como um banco de dados NoSQL moderno. O software NoSQL de código aberto é único porque o movimento de código aberto orientou o desenvolvimento em vez de seguir um ...
Desempenho e Big Data - dummies
Apenas ter um computador mais rápido não é suficiente para garantir o nível correto de desempenho para lidar grandes dados. Você precisa distribuir componentes de seu grande serviço de dados em uma série de nós. Na computação distribuída, um nó é um elemento contido dentro de um conjunto de sistemas ou dentro de um rack. A ...
Superando a grande falta de habilidades de dados - dummies
As habilidades de dados grandes são escassas. Como a quantidade de informações digitais geradas pelas empresas cresceu exponencialmente, surgiu um desafio (algumas pessoas até chamam de crise): não há pessoas suficientes com as habilidades necessárias para analisar e interpretar todos esses grandes dados. Em uma pesquisa recente, mais da metade de ...
Fase 5 do modelo de processo CRISP-DM: Avaliação - manequins
Nos primeiros quatro fases do modelo de processo Cross-Industry Standard for Data Mining (CRISP-DM), você explorou dados e você encontrou padrões, e agora você tem que perguntar: os resultados são bons? Você avaliará não apenas os modelos que você criou, mas também o processo que você usou para criá-los e seu potencial ...
Termos e definições de noSQL - dummies
Começando a cabeça no NoSQL pode ser um pouco difícil. Se você estudou bancos de dados na escola, você pode ter sido adoctrinado de forma relacional. Diga banco de dados para a maioria das pessoas, e eles pensam sistema de gerenciamento de banco de dados relacional. Isso é natural porque durante os últimos 30 anos, o RDBMS tem sido tão dominante. Para ...
NoSQL For Dummies Cheat Sheet - dummies
Como um desenvolvedor NoSQL, selecionando a categoria de produto certa eo produto certo é o Primeiro passo. Esses guias comparam os recursos mais importantes em alguns dos bancos de dados NoSQL mais populares.
De grandes dados para assegurar a grande governança de dados - manequins
Com os desafios de governança apresentados por grandes dados, é sábio e absolutamente necessário ter práticas em vigor para garantir que você esteja protegendo suas informações. Embora o grau em que você faça isso variará dependendo da sua empresa, certifique-se de tomar as precauções necessárias. Auditoria de seu grande processo de dados No ...
Colocando os Fundamentos de Modelagem de Informação do Edifício no Lugar - manequins
Você deseja melhorar o seu combate de negócios e o BIM pronto, Mas obter os fundamentos corretos está tudo na preparação. O BIM permite que você crie novos processos e fluxos de trabalho e trabalhe de forma colaborativa em seus projetos. O BIM é útil ao longo de todo o cronograma do projeto desde o estágio conceitual, a construção e, em seguida, ...
Coloque seus grandes dados juntos - manequins
Como você saberá como juntar todos os seus dados? Com um grande projeto de dados, o que você quer fazer com seus dados estruturados e não estruturados indica por que você pode escolher uma peça de tecnologia em outra. Também determina a necessidade de entender as estruturas de dados de entrada para colocar esses dados em ...
Fase 6 do modelo de processo do processo CRISP-DM: Deployment - dummies
É Onde os dados A mineração vale a pena. Nesta fase final do Processo de Processo Padrão Interindustrial para Processo de Mineração de Dados (CRISP-DM), não importa o quão brilhante suas descobertas podem ser, ou a perfeição de seus modelos se encaixam nos dados, se você realmente não usa esses coisas para melhorar a maneira como você faz negócios. A implantação ...
Fase 3 do modelo de processo CRISP-DM: preparação de dados - dummies
Mineiros de dados passam a maior parte do tempo na terceira fase do modelo de processo Cross-Industry Standard for Data Mining (CRISP-DM): preparação de dados. A maioria dos dados utilizados para mineração de dados foi originalmente coletado e preservado para outros fins e precisa de algum refinamento antes de estar pronto para usar para modelagem. A fase de preparação de dados inclui ...
Fase 4 do modelo de processo CRISP-DM: Modelagem - modelagens
É A parte do Processo Padrão Cross-Industry para modelo de processo de Mineração de Dados (CRISP-DM) que a maioria dos mineradores de dados gosta melhor. Os seus dados já estão em boa forma, e agora você pode procurar padrões úteis em seus dados. A fase de modelagem inclui quatro tarefas. Estas são técnicas de modelagem de seleção Criando teste (s) Modelo (s) de construção Avaliando ...
Fase 1 do modelo de processo CRISP-DM: Business Understanding - dummies
A cruz - Processo padrão da indústria para mineração de dados (CRISP-DM) é a estrutura de processo dominante para a mineração de dados. Na primeira fase de um projeto de mineração de dados, antes de abordar dados ou ferramentas, você define o que você está procurando e define as razões para querer atingir esse objetivo. A fase de compreensão comercial inclui quatro tarefas (primário ...
Coloque a Estrutura Organizacional de Dados Principais Direita - os manequins
Normalmente, as empresas começam sua jornada para grande dados começando com uma experiência organizacional para ver se grandes dados podem desempenhar um papel importante na definição e impacto da estratégia de negócios. No entanto, depois de ficar claro que os grandes dados terão um papel estratégico como parte do ambiente de gerenciamento de informações, você deve ter certeza de ...
Fase 2 do modelo de processo CRISP-DM: conhecimento de dados - manequins
No segunda fase do modelo de processo do Processo Padrão Interindustrial para o Mineração de Dados (CRISP-DM), você obtém dados e verifica se ele é apropriado para suas necessidades. Você pode identificar problemas que fazem com que você volte ao entendimento da empresa e revise seu plano. Você pode até descobrir falhas na compreensão do seu negócio, outro motivo para ...