Lar Finanças Pessoais Comparando Hadoop Distributions - dummies

Comparando Hadoop Distributions - dummies

Vídeo: Cloudera VS Apache VS MapR VS Hortonworks Which Hadoop Distribution To Use Big Data Tutorial 2024

Vídeo: Cloudera VS Apache VS MapR VS Hortonworks Which Hadoop Distribution To Use Big Data Tutorial 2024
Anonim

Você verá que o ecossistema Hadoop possui muitos componentes, todos os quais existem como seus próprios projetos Apache. Como o Hadoop cresceu consideravelmente e enfrenta mudanças significativas, diferentes versões desses componentes da comunidade de código aberto podem não ser totalmente compatíveis com outros componentes. Isso representa dificuldades consideráveis ​​para as pessoas que procuram um começo independente com o Hadoop, baixando e compilando projetos diretamente do Apache.

O Red Hat é, para muitas pessoas, o modelo de como ganhar dinheiro com sucesso no mercado de software aberto. O que a Red Hat fez é levar o Linux (um sistema operacional de código aberto), agrupar todos os componentes necessários, criar um instalador simples e oferecer suporte pago a qualquer cliente.

Da mesma forma que a Red Hat forneceu uma embalagem útil para o Linux, várias empresas colocaram o Hadoop e algumas tecnologias relacionadas em suas próprias distribuições Hadoop. Esta lista descreve os mais proeminentes:

  • Cloudera : talvez o jogador mais conhecido do campo, a Cloudera pode reivindicar Doug Cutting, co-fundador da Hadoop, como seu principal arquiteto. Cloudera é vista por muitas pessoas como líder de mercado no espaço Hadoop porque lançou a primeira distribuição comercial Hadoop e é um contribuidor altamente ativo de código para o ecossistema Hadoop.

    Cloudera Enterprise, um produto posicionado pela Cloudera no centro do que ele chama de "Enterprise Data Hub", inclui a Distribuição Cloudera para Hadoop (CDH), uma distribuição baseada em fonte aberta do Hadoop e seus projetos relacionados também como seu proprietário Cloudera Manager. Também está incluído uma subscrição de suporte técnico para os componentes principais da CDH.

    O modelo de negócios primário da Cloudera tem sido baseado em sua capacidade de alavancar sua popular distribuição de CDH e fornecer serviços e suporte pagos. No outono de 2013, a Cloudera anunciou formalmente que está se concentrando na adição de componentes proprietários de valor agregado em cima do Hadoop de código aberto para atuar como um diferenciador.

    Além disso, Cloudera tornou uma prática comum acelerar a adoção de código aberto de nível alfabético e beta para os lançamentos Hadoop mais recentes. A abordagem é tomar componentes que julgar maduros e adaptá-los às bibliotecas de código aberto existentes para produção, que estão incluídas em sua distribuição.

  • EMC : Pivotal HD, a distribuição Apache Hadoop da EMC, integra nativamente a tecnologia de banco de dados (MPP) de processamento paralelo (MPP) da EMC (anteriormente conhecida como Greenplum e agora conhecida como HAWQ) com o Apache Hadoop.O resultado é uma distribuição Hadoop de alto desempenho com o verdadeiro processamento de SQL para o Hadoop. As consultas baseadas em SQL e outras ferramentas de inteligência de negócios podem ser usadas para analisar dados armazenados no HDFS.

  • Hortonworks : Outro importante jogador no mercado Hadoop, a Hortonworks possui o maior número de contribuidores e contribuintes de código para os componentes do ecossistema Hadoop. (Os usuários são os guardiões dos projetos do Apache e têm o poder de aprovar as alterações de código.)

    O Hortonworks é um spin-off do Yahoo!, que foi o motorista corporativo original do projeto Hadoop porque precisava de uma plataforma em larga escala para suportar o seu negócio de motores de busca. De todos os fornecedores de distribuição da Hadoop, a Hortonworks é a mais comprometida com o movimento de código aberto, com base no grande volume do trabalho de desenvolvimento que contribui para a comunidade e porque todos os seus esforços de desenvolvimento são (eventualmente) dobrados na base de código aberto.

    O modelo de negócios da Hortonworks baseia-se na sua capacidade de alavancar a sua popular distribuição HDP e fornecer serviços e suporte pagos. No entanto, ele não vende software proprietário. Em vez disso, a empresa apoia com entusiasmo a ideia de trabalhar na comunidade de código aberto para desenvolver soluções que abordem requisitos de recursos empresariais (por exemplo, processamento de consulta mais rápido com o Hive).

    A Hortonworks estabeleceu uma série de relações com empresas estabelecidas no setor de gerenciamento de dados: Teradata, Microsoft, Informatica e SAS, por exemplo. Embora essas empresas não tenham suas próprias ofertas internas Hadoop, elas colaboram com a Hortonworks para oferecer soluções integradas Hadoop com seus próprios conjuntos de produtos.

    A oferta Horton Hadoop é a Hortonworks Data Platform (HDP), que inclui Hadoop, bem como ferramentas e projetos relacionados. Também ao contrário de Cloudera, a Hortonworks lança apenas versões HDP com código de nível de produção da comunidade de código aberto.

  • IBM : o Big Blue oferece uma gama de ofertas da Hadoop, com foco no valor agregado em cima da pilha Hadoop de código aberto.

  • Intel: A Distribuição Intel para o Apache Hadoop (Distribuição Intel) fornece processamento distribuído e gerenciamento de dados para aplicativos corporativos que analisam grandes dados.

    Os principais recursos incluem excelente desempenho com otimizações para processadores Intel Xeon, armazenamento SSD Intel e rede Intel 10GbE; segurança de dados através de criptografia e descriptografia em HDFS e controle de acesso baseado em função com granularidade de nível de célula em HBase; Melhor desempenho da consulta de colmeia; suporte para análise estatística com um conector para R, o pacote estatístico popular de código aberto; e gráficos analíticos através do Intel Graph Builder.

  • MapR : para uma distribuição completa para Apache Hadoop e projetos relacionados que são independentes da Apache Software Foundation, não procure mais do que MapR. Com nenhuma dependência de Java ou dependência do sistema de arquivos Linux, o MapR está sendo promovido como a única distribuição Hadoop que fornece proteção total de dados, nenhum ponto de falha e vantagens significativas de facilidade de uso.

    Três edições MapR estão disponíveis: M3, M5 e M7. A edição M3 é gratuita e está disponível para uso ilimitado de produção; MapR M5 é uma oferta de software de assinatura de nível intermediário; e MapR M7 é uma distribuição completa para Apache Hadoop e HBase que inclui Pig, Hive, Sqoop e muito mais.

Comparando Hadoop Distributions - dummies

Escolha dos editores

ASVAB Paragraph Comprehension Practice - dummies

ASVAB Paragraph Comprehension Practice - dummies

Um dos subtestes que você verá no ASVAB é o teste de compreensão de parágrafos. Esta parte do ASVAB está voltada para ver se você entende o que você lê. Exemplo de perguntas Parágrafo Tempo de compreensão: 13 minutos para 15 perguntas Instruções: A compreensão de parágrafo é o quarto subtesto no ASVAB. As perguntas são projetadas para ...

ASVAB Preparação: Números positivos e negativos - manequins

ASVAB Preparação: Números positivos e negativos - manequins

Certifique-se de que esteja familiarizado com o trabalho positivo e negativo números para o ASVAB. Os números podem ser positivos ou negativos. Um número positivo é qualquer número maior que zero. Então, 4; 3. 2; 793; 3/4; 1/2; e 430, 932, 843, 784 são todos números positivos. Números inferiores a zero são números negativos. Cada número positivo tem um negativo ...

ASVAB Dicas de compreensão de leitura - manequins

ASVAB Dicas de compreensão de leitura - manequins

As abordagens de compreensão de parágrafo no ASVAB geralmente são bastante curtas. Essas dicas podem ajudá-lo a compreender melhor as passagens de leitura ASVAB e as perguntas que as seguem: Compreenda o que a questão quer de você. Solicita o ponto principal, informações específicas ou uma conclusão baseada na informação apresentada? Releia o parágrafo ...

Escolha dos editores

A diferença entre análises analógicas e digitais - manequins

A diferença entre análises analógicas e digitais - manequins

Toda a eletrônica pode ser dividida em duas grandes categorias: analógico e digital. Um dos exemplos mais comuns da diferença entre dispositivos analógicos e digitais é um relógio. No relógio analógico, o tempo é representado por mãos que giram ao redor de um disco e apontam para uma localização no mostrador que representa ...

O papel dos átomos na eletrônica - dummies

O papel dos átomos na eletrônica - dummies

Os átomos são os blocos de construção básicos de tudo no universo, seja natural ou manmade. Eles são tão pequenos que você encontraria milhões deles em uma única partícula de poeira. A corrente elétrica, às vezes conhecida como eletricidade, é o movimento na mesma direção de partículas microscópicamente pequenas e eletricamente carregadas, chamadas elétrons. Cada átomo contém o ...

Roles de prótons e elétrons - dummies

Roles de prótons e elétrons - dummies

É Uma propriedade de certas partículas, como elétrons, prótons , e quarks (sim, quarks) que descreve como eles interagem uns com os outros. Existem dois tipos diferentes de carga elétrica, um pouco arbitrariamente chamada positiva e negativa (bem como as quatro direções cardinais são chamadas norte, sul, leste e oeste). Em geral, partículas que carregam ...

Escolha dos editores

Acesso 2007 All-In-One For Dummies Cheat Sheet - dummies

Acesso 2007 All-In-One For Dummies Cheat Sheet - dummies

Trabalhando no Access 2007 é mais fácil uma vez que você entenda executar a janela do Access 2007 e usar ferramentas para ajudar a gerenciar seus dados e responder suas perguntas.

Arrumando suas mensagens com o Lotus Notes 6 - manequins

Arrumando suas mensagens com o Lotus Notes 6 - manequins

Antes de enviar uma mensagem de e-mail no Lotus Notes 6, você pode definir Opções de entrega, Opções de segurança e Selos de humor. Use essas dicas de notas para informar o destinatário sobre o quão quente é sua mensagem ou qual é o seu humor; ou solicitar confirmação de entrega, definir o tempo de entrega e muito mais. Depois de terminar de compor o corpo ...

10 Ofícios de teclado do Office 2016 - dummies

10 Ofícios de teclado do Office 2016 - dummies

Um tema comum do Office 2016 é que todos os programas se parecem e funcionam. Depois de aprender a usar o Word, você achará que não é muito mais difícil aprender o Excel ou o PowerPoint porque as guias do Ribbon funcionam de maneiras semelhantes. Ainda melhor, os mesmos comandos de teclas funcionam de forma semelhante em todos os programas do Office 2016. Por ...