Lar Finanças Pessoais Mestre Nodes em Hadoop Clusters - dummies

Mestre Nodes em Hadoop Clusters - dummies

Índice:

Vídeo: Hadoop Rack Awareness 2024

Vídeo: Hadoop Rack Awareness 2024
Anonim

Os nós mestres em clusters Hadoop distribuídos hospedam os vários serviços de gerenciamento de armazenamento e processamento, descritos nesta lista, para todo o cluster Hadoop. A redundância é fundamental para evitar pontos únicos de falha, então você vê dois switches e três nós mestres.

  • NomeNode: Gerencia o armazenamento HDFS. Para garantir alta disponibilidade, você tem um Nome de nome ativo e um Nome de nome de espera. Cada um roda por si próprio, nó mestre dedicado.

  • Nó Checkpoint (ou nó de backup): Fornece checkpointing serviços para o NameNode. Isso envolve ler o log de edição do NameNode para mudanças nos arquivos no HDFS (arquivos novos, excluídos e anexados) desde o último ponto de verificação e aplicá-los ao arquivo mestre NameNode que mapeia arquivos para blocos de dados.

    Além disso, o Nó de backup mantém uma cópia do espaço de nomes do sistema de arquivos na memória e mantém sincronizado com o estado do NomeNodo. Para implantações de alta disponibilidade, não use um nó de ponto de verificação ou um nó de backup - use um Nome de nome de espera em vez disso. Além de ser um modo de espera ativo para o NomeNodo, o NomeNodo de Espera mantém os serviços de verificação e mantém uma cópia atualizada do espaço de nomes do sistema de arquivos na memória.

  • JournalNode: Recebe as modificações do log de edição que indicam as alterações nos arquivos no HDFS do NameNode. Pelo menos três serviços do JournalNode (e sempre é um número ímpar) devem ser executados em um cluster e são leves o suficiente para que eles possam ser colocados com outros serviços nos nós mestres.

  • Gerenciador de recursos: Supervisa o agendamento das tarefas de aplicativos e o gerenciamento dos recursos do cluster Hadoop. Este serviço é o coração de YARN.

  • JobTracker: Para servidores Hadoop 1, lida com gerenciamento de recursos de cluster e agendamento. Com o YARN, o JobTracker é obsoleto e não é usado. Um número de implantações Hadoop ainda não migrou para Hadoop 2 e YARN.

  • HMaster: Monitora os servidores da região HBase e lida com todas as alterações de metadados. Para garantir alta disponibilidade, certifique-se de usar uma segunda instância HMaster. O serviço HMaster é leve o suficiente para ser colocado com outros serviços nos nós mestres. No Hadoop 1, as instâncias do serviço HMaster são executadas em nós mestres. Em Hadoop 2, com Hoya (HBase on Yarn), as instâncias HMaster funcionam em recipientes em nós escravos.

  • Zookeeper: Coordena os componentes distribuídos e fornece mecanismos para mantê-los sincronizados. O Zookeeper é usado para detectar a falha do NomeNodo e eleger um novo NomeNodo.Também é usado com HBase para gerenciar os estados do HMaster e RegionServers.

    Tal como acontece com o JournalNode, você precisa de pelo menos três instâncias de nós Zookeeper (e sempre um número ímpar), e eles são leves o suficiente para serem colocados com outros serviços nos nós mestres.

Aqui, você possui três nós mestres (com o mesmo hardware), onde os Nomes de Nome de Ativo, Nome de Espera e Gerenciador de Recursos, cada um possuem seu próprio servidor. Existem serviços de JournalNode e Zookeeper que funcionam em cada servidor também, mas estes são leves e não serão uma fonte de contenção de recursos com os serviços NameNode e Resource Manager.

Os princípios são os mesmos para o Hadoop 1, onde você precisa de um nó mestre dedicado para os serviços NameNode, SecondName NameNode e JobTracker.

Se você planeja usar HBase com Hoya no Hadoop 2, não precisa de nenhum serviço adicional. Para implementações do Hadoop 1 usando HBase, confira a figura a seguir para a implantação de serviços nos nós mestres do cluster Hadoop.

Existem duas diferenças ao comparar esses servidores mestre com os servidores mestre Hadoop 1 sem suporte HBase: aqui você precisa de dois serviços HMaster (um para coordenar o HBase e um para atuar como um modo de espera) e os serviços Zookeeper nos três nós principais para lidar com o failover.

Se você pretende usar o seu cluster Hadoop 1 apenas para HBase, você pode fazer sem o serviço JobTracker, uma vez que o HBase não depende da infraestrutura Hadoop 1 MapReduce.

Quando as pessoas falam sobre hardware para Hadoop, eles geralmente enfatizam o uso de commodity componentes - os de baixo custo. Porque você tem que pagar por apenas alguns nós mestres (tipicamente, três ou quatro), você não é atingido pela multiplicação de custos se, por exemplo, você decidir usar unidades de disco rígido dispendiosas.

Tenha em mente que, sem nós mestres, não existe um cluster Hadoop. Os nós mestres servem uma função de missão crítica e, mesmo que você precise de redundância, você deve projetá-los com alta disponibilidade e resiliência em mente.

armazenamento recomendado

Para os nós mestres do Hadoop, independentemente do número de nós escravos ou usos do cluster, as características de armazenamento são consistentes. Use quatro unidades SAS de 900 GB, juntamente com um controlador RAID HDD configurado para RAID 1 + 0. As unidades SAS são mais caras do que as unidades SATA e possuem menor capacidade de armazenamento, mas são mais rápidas e muito mais confiáveis.

A implantação de suas unidades SAS como uma matriz RAID garante que os serviços de gerenciamento Hadoop possuem uma loja redundante para os seus dados de missão crítica. Isso oferece armazenamento suficiente, rápido e redundante para suportar o gerenciamento do seu cluster Hadoop.

Processadores recomendados

No momento desta redação, a maioria das arquiteturas de referência recomendam o uso de placas-mãe com duas tomadas de CPU, cada uma com seis ou oito núcleos. A arquitetura Intel Ivy Bridge é comumente usada.

Memória recomendada

Os requisitos de memória variam consideravelmente dependendo da escala de um cluster Hadoop.A memória é um fator crítico para os nós mestres do Hadoop porque os servidores de nomes e nomes ativos e de confiança dependem fortemente da RAM para gerenciar o HDFS. Como tal, use memória de correção de erros (ECC) para nós mestres do Hadoop. Normalmente, os nós mestres precisam entre 64 GB e 128 GB de RAM.

O requisito de memória NameNode é uma função direta do número de blocos de arquivos armazenados no HDFS. Como regra geral, o NameNode usa aproximadamente 1GB de RAM por milhão de blocos HDFS. (Lembre-se de que os arquivos são divididos em blocos individuais e replicados para que você tenha três cópias de cada bloco.)

As demandas de memória dos servidores Resource Manager, HMaster, Zookeeper e JournalNode são consideravelmente menores do que para o servidor NameNode. No entanto, é uma boa prática dimensionar os nós mestres de forma consistente para que sejam intercambiáveis ​​em caso de falha de hardware.

Rede recomendada

A comunicação rápida é vital para os serviços nos nós mestres, por isso recomendamos o uso de um par de conexões de 10GbE ligadas. Este par vinculado fornece redundância, mas também duplica o rendimento para 20GbE. Para clusters menores (por exemplo, menos de 50 nós), você pode sair com o uso de conectores de 1 GbE.

Mestre Nodes em Hadoop Clusters - dummies

Escolha dos editores

ASVAB Paragraph Comprehension Practice - dummies

ASVAB Paragraph Comprehension Practice - dummies

Um dos subtestes que você verá no ASVAB é o teste de compreensão de parágrafos. Esta parte do ASVAB está voltada para ver se você entende o que você lê. Exemplo de perguntas Parágrafo Tempo de compreensão: 13 minutos para 15 perguntas Instruções: A compreensão de parágrafo é o quarto subtesto no ASVAB. As perguntas são projetadas para ...

ASVAB Preparação: Números positivos e negativos - manequins

ASVAB Preparação: Números positivos e negativos - manequins

Certifique-se de que esteja familiarizado com o trabalho positivo e negativo números para o ASVAB. Os números podem ser positivos ou negativos. Um número positivo é qualquer número maior que zero. Então, 4; 3. 2; 793; 3/4; 1/2; e 430, 932, 843, 784 são todos números positivos. Números inferiores a zero são números negativos. Cada número positivo tem um negativo ...

ASVAB Dicas de compreensão de leitura - manequins

ASVAB Dicas de compreensão de leitura - manequins

As abordagens de compreensão de parágrafo no ASVAB geralmente são bastante curtas. Essas dicas podem ajudá-lo a compreender melhor as passagens de leitura ASVAB e as perguntas que as seguem: Compreenda o que a questão quer de você. Solicita o ponto principal, informações específicas ou uma conclusão baseada na informação apresentada? Releia o parágrafo ...

Escolha dos editores

A diferença entre análises analógicas e digitais - manequins

A diferença entre análises analógicas e digitais - manequins

Toda a eletrônica pode ser dividida em duas grandes categorias: analógico e digital. Um dos exemplos mais comuns da diferença entre dispositivos analógicos e digitais é um relógio. No relógio analógico, o tempo é representado por mãos que giram ao redor de um disco e apontam para uma localização no mostrador que representa ...

O papel dos átomos na eletrônica - dummies

O papel dos átomos na eletrônica - dummies

Os átomos são os blocos de construção básicos de tudo no universo, seja natural ou manmade. Eles são tão pequenos que você encontraria milhões deles em uma única partícula de poeira. A corrente elétrica, às vezes conhecida como eletricidade, é o movimento na mesma direção de partículas microscópicamente pequenas e eletricamente carregadas, chamadas elétrons. Cada átomo contém o ...

Roles de prótons e elétrons - dummies

Roles de prótons e elétrons - dummies

É Uma propriedade de certas partículas, como elétrons, prótons , e quarks (sim, quarks) que descreve como eles interagem uns com os outros. Existem dois tipos diferentes de carga elétrica, um pouco arbitrariamente chamada positiva e negativa (bem como as quatro direções cardinais são chamadas norte, sul, leste e oeste). Em geral, partículas que carregam ...

Escolha dos editores

Acesso 2007 All-In-One For Dummies Cheat Sheet - dummies

Acesso 2007 All-In-One For Dummies Cheat Sheet - dummies

Trabalhando no Access 2007 é mais fácil uma vez que você entenda executar a janela do Access 2007 e usar ferramentas para ajudar a gerenciar seus dados e responder suas perguntas.

Arrumando suas mensagens com o Lotus Notes 6 - manequins

Arrumando suas mensagens com o Lotus Notes 6 - manequins

Antes de enviar uma mensagem de e-mail no Lotus Notes 6, você pode definir Opções de entrega, Opções de segurança e Selos de humor. Use essas dicas de notas para informar o destinatário sobre o quão quente é sua mensagem ou qual é o seu humor; ou solicitar confirmação de entrega, definir o tempo de entrega e muito mais. Depois de terminar de compor o corpo ...

10 Ofícios de teclado do Office 2016 - dummies

10 Ofícios de teclado do Office 2016 - dummies

Um tema comum do Office 2016 é que todos os programas se parecem e funcionam. Depois de aprender a usar o Word, você achará que não é muito mais difícil aprender o Excel ou o PowerPoint porque as guias do Ribbon funcionam de maneiras semelhantes. Ainda melhor, os mesmos comandos de teclas funcionam de forma semelhante em todos os programas do Office 2016. Por ...