Implementar um Data Mart - Rapidamente - dummies
, Não importa como você decida dividir o universo de possíveis conteúdos em alguns subconjunto para seu data mart, lembre-se de que, para obter o máximo de valor comercial do seu data mart, você deve implementá-lo rapidamente. Aqui estão as três chaves para rápida implementação: siga uma metodologia iterativa e em fase. Você gasta a maioria de ...
Como definir a base arquitetônica para dados grandes - manequins
É Importante estabelecer uma arquitetura sólida fundação se você quer ser bem sucedido com dados importantes. Além de suportar os requisitos funcionais, é importante suportar o desempenho exigido. Suas necessidades dependerão da natureza da análise que você está apoiando. Você precisará da quantidade certa de poder computacional ...
Como otimizar MapReduce Tasks - dummies
Além de otimizar o código de aplicativo real com MapReduce para grandes projetos de dados, você pode use algumas técnicas de otimização para melhorar a confiabilidade e o desempenho. Eles se dividem em três categorias: topologia de hardware / rede, sincronização e sistema de arquivos. Grande topologia de hardware / rede de dados Independente da aplicação, o hardware e as redes mais rápidas provavelmente renderão os tempos de execução mais rápidos ...
Identifique os dados que você precisa para seus grandes dados - manequins
Faça um balanço do tipo de dados que você estão lidando com seu grande projeto de dados. Muitas organizações estão reconhecendo que muitos dados internamente gerados não foram usados para todo seu potencial no passado. Ao alavancar novas ferramentas, as organizações estão ganhando novos conhecimentos de fontes anteriormente não exploradas de dados não estruturados em ...
Como usar MapReduce para Big Data - dummies
MapReduce é uma estrutura de software que é ideal para dados grandes porque ele permite aos desenvolvedores escrever programas que podem processar enormes quantidades de dados não estruturados em paralelo em um grupo distribuído de processadores. A função do mapa para grandes dados A função do mapa faz parte de muitas linguagens de programação funcionais há anos. Mapa ...
Camada 0 da grande pilha de dados: infra-estrutura física redundante - manequins
No nível mais baixo da grande pilha de dados é a infra-estrutura física. Sua empresa já pode ter um data center ou fazer investimentos em infra-estruturas físicas, então você vai querer encontrar uma maneira de usar os ativos existentes. As grandes implementações de dados têm requisitos muito específicos em todos os elementos da arquitetura de referência, ...
Camada 2 da grande pilha de dados: bancos de dados operacionais - manequins
No núcleo de qualquer grande ambiente de dados e camada 2 da grande pilha de dados, são os mecanismos de banco de dados contendo as coleções de elementos de dados relevantes para sua empresa. Esses mecanismos precisam ser rápidos, escaláveis e sólidos. Eles não são todos iguais e certos grandes ambientes de dados serão melhores com ...
Camada 3 da grande pilha de dados: organizando serviços de dados e ferramentas - manequins
Organizando serviços e ferramentas de dados, a camada 3 da grande pilha de dados, captura, valida e monta vários grandes elementos de dados em coleções contextualmente relevantes. Como os grandes dados são enormes, as técnicas evoluíram para processar os dados de forma eficiente e transparente. MapReduce é uma técnica altamente utilizada. Basta dizer que muitos desses organizadores ...
Chave-Value Pair Databases em um grande ambiente de dados - dummies
De longe, o mais simples de Os bancos de dados NoSQL (não-apenas-SQL) em um grande ambiente de dados são aqueles que empregam o modelo de par chave-valor (KVP). Os bancos de dados KVP não exigem um esquema (como RDBMSs) e oferecem grande flexibilidade e escalabilidade. As bases de dados KVP não oferecem capacidade ACID (Atomicidade, Consistência, Isolação, Durabilidade) e exigem que os implementadores pensem sobre dados ...
Se encontram com representantes de Data Warehousing - dummies
As compras em produtos de armazenagem de dados podem incluir reuniões com representantes da empresa. Antes que um representante de vendas do fornecedor ponha o pé dentro do seu escritório ou inicie uma conferência da Web com você, deixe absolutamente claro o que você espera cobrir durante essa reunião inicial de uma ou duas horas. Você deve fazer pelo menos o seguinte: ouça uma apresentação de ...
Camada 1 da grande pilha de dados: infra-estrutura de segurança - padrões
Requisitos de segurança e privacidade, camada 1 da grande pilha de dados, são semelhantes aos requisitos para ambientes de dados convencionais. Os requisitos de segurança devem ser alinhados com as necessidades comerciais específicas. Alguns desafios únicos surgem quando grandes dados se tornam parte da estratégia: acesso a dados: o acesso do usuário a dados grandes crus ou calculados tem ...
Camada 4 da Big Data Stack: Data Warehouses Analíticos - manequins
O data warehouse, A camada 4 da grande pilha de dados e seu companheiro de dados, são as principais técnicas que as organizações usam para otimizar os dados para ajudar os tomadores de decisão. Normalmente, data warehouses e marts contêm dados normalizados coletados de uma variedade de fontes e montados para facilitar a análise do negócio. Dados ...
Gerenciar a virtualização para grandes dados - dummies
A virtualização separa recursos e serviços do ambiente de entrega física subjacente, permitindo que você crie muitos sistemas virtuais dentro de um único sistema físico. Uma das principais razões pelas quais as empresas implementaram a virtualização é melhorar o desempenho e a eficiência do processamento de uma mistura diversificada de cargas de trabalho O grande hypervisor de dados Em um ideal ...
Middleware para Data Warehousing - dummies
Middleware é um software que conecta componentes de software. Em um ambiente de armazenamento de dados, os serviços de middleware são o conjunto de programas e rotinas que fazem o seguinte: extraia dados da fonte (ou fontes). Certifique-se de que os dados estão corretos. Mova os dados ao redor do ambiente de plataforma para plataforma, conforme necessário. Gerencie qualquer ...
Middleware Serviços: Mapeamento e Transformação de Dados - dummies
Esta figura mostra um ambiente no qual os dados estão sendo extraídos de três fontes de dados diferentes para inclusão em um data warehouse, e cada uma das três fontes está em uma plataforma diferente. Em algum momento do processo de middleware, esses extratos QA'd devem ser reunidos para um processo combinado de mapeamento e transformação. O ...
Middleware Serviços: Movimento de dados e carregamento de dados - manequins
Na maioria das situações, os dois serviços de middleware - seleção e extração e garantia de qualidade - ocorrem na mesma plataforma (sistema) em que reside a fonte de dados. Se o seu data warehouse for hospedado em uma plataforma diferente da fonte de dados, você deve usar um serviço de movimento de dados para efetuar o sistema para o sistema ...
Middleware Services: Seleção de dados e extrações - dummies
O objetivo principal do serviço de seleção e extração de dados é selecionar de (encontrar em) uma fonte de dados os dados que deseja mover para o data warehouse e, em seguida, extrair (retirar) esses dados em um formulário que pode ser preparado para serviços de garantia de qualidade. Você pode usar um dos dois tipos diferentes ...
Mina Big Data with Hive - dummies
Hive é uma camada de armazenamento de dados baseada em lote construída nos elementos do núcleo de Hadoop (HDFS e MapReduce) e é muito útil em dados importantes. Ele fornece aos usuários que conhecem o SQL com uma implementação SQL-lite simples chamada HiveQL sem sacrificar o acesso via mapeadores e redutores. Com o Hive, você pode obter o melhor dos dois mundos: acesso semelhante a SQL ...
Bancos de dados multidimensionais - manequins
Esta não é a primeira vez na história recente que surgiram novos tipos de produtos de banco de dados e superaram as ineficiências do RDBMS . Na década de 1980, identificou-se uma classe de aplicativos em que os produtos RDBMS manuseavam as necessidades de gerenciamento de dados (especialmente a geração de RDBMSs disponíveis naquele momento). Esses aplicativos precisavam de tipos de dados especificados pelo usuário que ...
Middleware Services: Data Quality Assurance - dummies
Você deve estabelecer dois serviços diferentes de garantia de qualidade (QA) no fluxo dos serviços de middleware. Você deve executar as primeiras tarefas de QA contra o extrato da fonte de dados antes de executar mais serviços de middleware. Garantia da qualidade dos dados: parte I Tento capturar (e corrigir) erros e problemas no início do processo ...
Bancos de dados não-racionais em um grande ambiente de dados - dummies
Bancos de dados não-relacionais não dependem da tabela / modelo modelo endêmico para RDBMSs (sistemas de gerenciamento de banco de dados relacional). Em resumo, os dados especiais no mundo dos grandes dados exigem técnicas especiais de persistência e manipulação de dados. Embora esses novos estilos de bancos de dados ofereçam algumas respostas aos seus grandes desafios de dados, eles não são um bilhete expresso para o final ...
Colocar dados grandes a usar - dummies
A análise de texto pode ser usada para ajudar a obter informações sobre os dados. Então, e se os dados forem grandes? Isso significaria que os dados não estruturados que estão sendo analisados são de alto volume, alta velocidade ou ambos. Grandes dados e a voz do cliente Otimizando a experiência do cliente e melhorando a retenção de clientes são drivers dominantes para ...
Nove Sinais de um projeto bem sucedido de armazenamento de dados - manequins
Apenas porque todos se reúnem na cafeteria da empresa para o bolo e rejeita as paredes com banners de congratulações, não significa que o seu projeto de data warehousing tenha sido um sucesso. Este capítulo fornece algumas maneiras de dizer que você realmente teve sucesso. O patrocinador executivo diz: "Isso funciona - ele realmente funciona! "Suponha que um sénior ...
Modificam os produtos de Business Intelligence para lidar com grandes dados - os produtos de inteligência de negócios tradicionais
Não foram realmente projetados para lidar com grandes dados, para que eles possam exigir algumas modificações. Eles foram projetados para trabalhar com dados altamente estruturados e bem compreendidos, muitas vezes armazenados em um repositório de dados relacionais e exibidos em seu computador desktop ou laptop. Esta análise tradicional de inteligência de negócios é tipicamente aplicada a instantâneos de dados, em vez disso ...
Outros tipos de inteligência de negócios - manequins
Ai, o modelo organizado e organizado que possui quatro tipos diferentes de categorias de inteligência de negócios (consulta e relatórios, análise de negócios [OLAP], data mining e painéis e scorecards) podem ser expandidos para aplicações mais complexas. Por exemplo, uma ferramenta OLAP ou painel de controle pode ter recursos do sistema de informações geográficas (GIS) - ou talvez não. Conforme mostrado em ...
Produtos relacionais e armazenamento de dados - manequins
Aqui estão alguns dos principais produtos de banco de dados relacionais que você pode querer usar para seus dados armazém. Quase todos esses fornecedores, nos últimos anos, adquiriram produtos adicionais, incluindo OLAP ou tecnologia orientada multidimensionalmente e outros RDBMSs para suportar plataformas muito diversificadas e integrar suas linhas de produtos e arquiteturas. Você pode querer ...
Prepare-se para semântica em Data Warehousing - dummies
Se você avaliar como as tecnologias associadas ao armazenamento de dados funcionam, muito de metadados é gerenciado de forma exclusiva dentro da ferramenta. Alguns tentaram no passado resolver o problema de integração criando mais uma tecnologia, conhecida como repositórios técnicos de metadados, para integrar todos esses metadados das várias ferramentas. Tais ...
Você deve usar ferramentas ou código personalizado? - Dummies
Nos primeiros dias do armazenamento de dados, a maioria das organizações tratava serviços de middleware por meio de codificação personalizada, e não com as poucas ferramentas disponíveis no momento, como mostrado neste exemplo: Uma organização escreve um programa em uma programação linguagem como COBOL, ou talvez em um ambiente como o SAS, para lidar com os extratos de dados ...
Ferramentas de consulta e relatórios para armazenamento de dados - manequins
Uma ferramenta de consulta e relatórios ajuda você a executar relatórios regulares, criar listas organizadas e realizar relatórios e consultas com tabelas cruzadas. Aqui estão algumas ferramentas de consulta e relatórios para se familiarizarem com você. O papel do SQL SQL é a linguagem de consulta do banco de dados oficial usada para acessar e atualizar os dados contidos em um sistema de gerenciamento de banco de dados relacional, ...
Serviços de replicação para armazenamento de dados - dummies
Serviços de middleware de replicação combinam seleção e extração, movimento e carregamento de um banco de dados para um ou mais outros, geralmente gerenciados por um único produto DBMS. (O banco de dados de origem e todos os destinos são todos Oracle, todos os Sybase ou todos os Microsoft SQL Server, por exemplo.) Embora os recursos do serviço de replicação variem entre os produtos DBMS, tradicionalmente, eles foram ...
RDBMSs em um grande ambiente de dados - dummies
Grandes dados estão se tornando um elemento importante na forma como as organizações estão alavancando alto -volume dados à velocidade certa para resolver problemas de dados específicos. Os sistemas de gerenciamento de banco de dados relacionais são importantes para esse alto volume. Dados grandes não vivem em isolamento. Para ser eficaz, as empresas muitas vezes precisam ser capazes de combinar os resultados de ...
Seis fornecedores com produtos Middleware para armazenamento de dados - manequins
Existem vários fornecedores que oferecem produtos de middleware de armazenagem de dados você pode querer dar uma olhada. Aqui estão sete que vale a pena considerar. O software Composite Software Composite fornece produtos e tecnologia de integração de informações empresariais (EII). Ao usar o Composite, você pode acessar e combinar dados de fontes de dados diferentes, incluindo aplicativos empacotados, como ...
Dados estruturados em um grande ambiente de dados - dummies
O termo dados estruturados geralmente se refere a dados que possuem um definido comprimento e formato para grandes dados. Exemplos de dados estruturados incluem números, datas e grupos de palavras e números chamados de strings. A maioria dos especialistas concorda que este tipo de dados representa cerca de 20% dos dados que estão lá fora. Dados estruturados ...
Bases de dados espaciais em um grande ambiente de dados - dummies
Bases de dados espaciais podem ser uma ferramenta importante em seu grande projeto de dados . O próprio dados espaciais é padronizado através dos esforços do Open Geospatial Consortium (OGC), que estabelece o OpenGIS (Sistema de Informação Geográfica) e uma série de outros padrões de dados espaciais. Se você conhece ou não, você pode interagir com dados espaciais todos os dias. ...
A Nuvem no Contexto de Dados Grandes - dummies
A computação em nuvem é um método de fornecer um conjunto de recursos de computação compartilhada e está se tornando cada vez mais importante para a sua grande iniciativa de dados. A nuvem inclui plataformas de aplicações, computação, armazenamento, redes, desenvolvimento e implantação, bem como processos de negócios. A computação em nuvem transforma recursos de computação siled tradicionais em conjuntos de recursos compartilhados com base em um subjacente ...
Dez Competências obrigatórias para um Consultor de Armazenamento de Dados - manequins
Um bom consultor de armazenagem de dados possui certas habilidades de negociação com pessoas e um conhecimento de vários aspectos do data warehousing. Esta lista permite que você inclua algumas habilidades necessárias que todos os consultores de data warehousing devem possuir. Visão ampla Mesmo um consultor de armazenagem de dados que é um especialista em uma área específica (design de esquema de estrela ...
Dez fontes de informações atualizadas sobre armazenamento de dados - manequins
Você provavelmente não ficará surpreso ao saber que o termo informações atualizadas sobre data warehousing significa "vá procurar na Internet". "Vale a pena conferir os sites da Web neste capítulo. O Instituto de Armazenamento de Dados No site abrangente do Data Warehousing Institute, você pode encontrar esses itens: Informações sobre educação Próximos eventos White ...
A Criação de Grandes Estruturas de Dados Geríveis - dummies
À Medida que a computação se moveu para o mercado comercial, os dados foram armazenados em arquivos planos que não impuseram estrutura. Hoje, grandes dados requer estruturas de dados gerenciáveis. Quando as empresas precisavam chegar a um nível de compreensão detalhada sobre os clientes, eles tiveram que aplicar métodos de força bruta, incluindo modelos de programação muito detalhados para criar algum valor. Mais tarde no ...