Lar Finanças Pessoais Configure o ambiente Hadoop com o Apache Bigtop - dummies

Configure o ambiente Hadoop com o Apache Bigtop - dummies

Índice:

Vídeo: 03 - Hadoop - Baixando e configurando a máquina Cloudera 2024

Vídeo: 03 - Hadoop - Baixando e configurando a máquina Cloudera 2024
Anonim

Se você estiver confortável trabalhando com máquinas virtuais e Linux, sinta-se livre para instalar o Bigtop em uma VM diferente da recomendada. Se você é realmente ousado e possui o hardware, vá em frente e tente instalar o Bigtop em um conjunto de máquinas no modo totalmente distribuído!

Etapa 1: Carregando uma VM

O Hadoop é executado em todas as distribuições Linux populares, então você precisa de uma VM Linux. Existe uma imagem livre disponível (e legal!) CentOS 6 disponível.

Você precisará de um sistema operacional de 64 bits em seu laptop para executar esta VM. O Hadoop precisa de um ambiente de 64 bits.

Depois de baixar a VM, extraia-a do arquivo Zip baixado para o diretório de destino. Certifique-se de ter cerca de 50 GB de espaço disponível como Hadoop e seus dados de amostra precisarão disso.

Se você ainda não possui um reprodutor de VM, pode baixar um gratuitamente.

Depois de configurar o seu VM player, abra o player, vá para Arquivo → Abrir, então vá para o diretório onde você extraiu sua VM Linux. Procure um arquivo chamado e selecione-o. Você verá informações sobre quantos processadores e a quantidade de memória que ele usará. Descubra a quantidade de memória que seu computador possui e aloca metade da VM para usar. Hadoop precisa de muita memória.

Quando estiver pronto, clique no botão Reproduzir e sua instância Linux será iniciada. Você verá muitas mensagens voarem, pois o Linux está inicializando e você virá para uma tela de login. O nome de usuário já está configurado para "Tom. "Especifique a senha como" tomtom "e faça o login.

Etapa 2: Fazendo o download do Bigtop

Na sua VM Linux, clique com o botão direito do mouse na tela e selecione Abrir no Terminal no menu contextual que aparece. Isso abre um terminal Linux, onde você pode executar comandos. Clique dentro do terminal para que você possa ver o cursor piscar e digitar o seguinte comando: su -

Você será solicitado a sua senha, então digite "tomtom" como fez anteriormente. Este comando altera o usuário para a raiz, que é a conta mestre de um computador Linux - você precisará disso para instalar o Hadoop.

Com seu acesso root (não deixe o poder chegar à sua cabeça), execute o seguinte comando:

wget -O / etc / yum. repos. d / bigtop. repo 

// www. apache. org / dist / bigtop / bigtop-

0. 7. 0 / repos / centos6 / bigtop. repo

O comando é essencialmente uma solicitação na web, que solicita um arquivo específico no URL que você pode ver e escreve para um caminho específico - neste caso, isso é /.

Passo 3: Instalando o Bigtop

Os gênios por trás do Linux tornaram a vida bastante fácil para as pessoas que precisam instalar grandes pacotes de software como o Hadoop.O que você baixou na última etapa não era o pacote Bigtop inteiro e todas as suas dependências. Era apenas um arquivo repositório (com a extensão), que informa ao programa instalador quais pacotes de software são necessários para a instalação do Bigtop.

Como qualquer grande produto de software, o Hadoop possui muitos pré-requisitos, mas você não precisa se preocupar. Um arquivo bem projetado irá apontar para qualquer dependência e o instalador é inteligente o suficiente para ver se eles estão perdidos em seu computador e depois baixá-los e instalá-los.

O instalador que você está usando aqui é chamado de yum, que você vê em ação agora:

yum install hadoop * mahout * oozie * hbase * hive * matiz * porco * zookeeper *

Observe que você está escolhendo e escolhendo os componentes do Hadoop para instalar. Há uma série de outros componentes disponíveis no Bigtop, mas estes são os únicos que você usará aqui. Uma vez que a VM é uma nova instalação do Linux, você precisará de muitas dependências, então você precisará esperar um pouco.

O instalador do yum é bastante detalhado, para que você possa assistir exatamente o que está sendo baixado e instalado para passar o tempo. Quando o processo de instalação estiver pronto, você deve ver uma mensagem que diz "Complete! "

Etapa 4: Iniciando o Hadoop

Antes de começar a executar aplicativos no Hadoop, há algumas configurações básicas e as coisas de configuração que você precisa fazer. Aqui eles estão em ordem:

  1. Baixe e instale o Java:

    yum install java-1. 7. 0-openjdk-devel. x86_64
    
  2. Formate o nomeNode:

    sudo / etc / init. d / hadoop-hdfs-namenode init
    
  3. Inicie os serviços Hadoop para seu cluster pseudodistribuído:

    para i no hadoop-hdfs-namenode hadoop-hdfs-datanode; sudo service $ i start; feito
    
  4. Crie uma estrutura de subdiretório em HDFS:

    sudo / usr / lib / hadoop / libexec / init-hdfs. sh
    
  5. Comece os daemons YARN:

sudo service hadoop-fio-resourcemanager startsudo serviço hadoop-fio-nodemanager começo

E com isso, você terminou. Parabéns! Você instalou uma implantação Hadoop em funcionamento!

Etapa 5: Baixar o conjunto de dados de amostra

Para baixar o conjunto de dados de amostra, abra o navegador Firefox da VM e vá para a página dataexpo.

Você não precisará de todo o conjunto de dados, então comece com um único ano, 1987. Quando você está prestes a baixar, selecione a opção Abrir com Gerenciador de Arquivos.

Depois que seu arquivo foi baixado, extraia o arquivo para o diretório inicial onde você poderá facilmente encontrá-lo. Clique no botão Extrair e, em seguida, selecione o diretório do Desktop.

Etapa 6: Copiando o conjunto de dados de amostra no HDFS

Lembre-se de que seus programas Hadoop só podem funcionar com dados depois de armazenados no HDFS. Então o que você vai fazer agora é copiar o arquivo de dados de vôo para 1987 em HDFS. Digite o seguinte comando:

hdfs dfs -copyFromLocal 1987. csv / user / root
Configure o ambiente Hadoop com o Apache Bigtop - dummies

Escolha dos editores

ASVAB Paragraph Comprehension Practice - dummies

ASVAB Paragraph Comprehension Practice - dummies

Um dos subtestes que você verá no ASVAB é o teste de compreensão de parágrafos. Esta parte do ASVAB está voltada para ver se você entende o que você lê. Exemplo de perguntas Parágrafo Tempo de compreensão: 13 minutos para 15 perguntas Instruções: A compreensão de parágrafo é o quarto subtesto no ASVAB. As perguntas são projetadas para ...

ASVAB Preparação: Números positivos e negativos - manequins

ASVAB Preparação: Números positivos e negativos - manequins

Certifique-se de que esteja familiarizado com o trabalho positivo e negativo números para o ASVAB. Os números podem ser positivos ou negativos. Um número positivo é qualquer número maior que zero. Então, 4; 3. 2; 793; 3/4; 1/2; e 430, 932, 843, 784 são todos números positivos. Números inferiores a zero são números negativos. Cada número positivo tem um negativo ...

ASVAB Dicas de compreensão de leitura - manequins

ASVAB Dicas de compreensão de leitura - manequins

As abordagens de compreensão de parágrafo no ASVAB geralmente são bastante curtas. Essas dicas podem ajudá-lo a compreender melhor as passagens de leitura ASVAB e as perguntas que as seguem: Compreenda o que a questão quer de você. Solicita o ponto principal, informações específicas ou uma conclusão baseada na informação apresentada? Releia o parágrafo ...

Escolha dos editores

A diferença entre análises analógicas e digitais - manequins

A diferença entre análises analógicas e digitais - manequins

Toda a eletrônica pode ser dividida em duas grandes categorias: analógico e digital. Um dos exemplos mais comuns da diferença entre dispositivos analógicos e digitais é um relógio. No relógio analógico, o tempo é representado por mãos que giram ao redor de um disco e apontam para uma localização no mostrador que representa ...

O papel dos átomos na eletrônica - dummies

O papel dos átomos na eletrônica - dummies

Os átomos são os blocos de construção básicos de tudo no universo, seja natural ou manmade. Eles são tão pequenos que você encontraria milhões deles em uma única partícula de poeira. A corrente elétrica, às vezes conhecida como eletricidade, é o movimento na mesma direção de partículas microscópicamente pequenas e eletricamente carregadas, chamadas elétrons. Cada átomo contém o ...

Roles de prótons e elétrons - dummies

Roles de prótons e elétrons - dummies

É Uma propriedade de certas partículas, como elétrons, prótons , e quarks (sim, quarks) que descreve como eles interagem uns com os outros. Existem dois tipos diferentes de carga elétrica, um pouco arbitrariamente chamada positiva e negativa (bem como as quatro direções cardinais são chamadas norte, sul, leste e oeste). Em geral, partículas que carregam ...

Escolha dos editores

Acesso 2007 All-In-One For Dummies Cheat Sheet - dummies

Acesso 2007 All-In-One For Dummies Cheat Sheet - dummies

Trabalhando no Access 2007 é mais fácil uma vez que você entenda executar a janela do Access 2007 e usar ferramentas para ajudar a gerenciar seus dados e responder suas perguntas.

Arrumando suas mensagens com o Lotus Notes 6 - manequins

Arrumando suas mensagens com o Lotus Notes 6 - manequins

Antes de enviar uma mensagem de e-mail no Lotus Notes 6, você pode definir Opções de entrega, Opções de segurança e Selos de humor. Use essas dicas de notas para informar o destinatário sobre o quão quente é sua mensagem ou qual é o seu humor; ou solicitar confirmação de entrega, definir o tempo de entrega e muito mais. Depois de terminar de compor o corpo ...

10 Ofícios de teclado do Office 2016 - dummies

10 Ofícios de teclado do Office 2016 - dummies

Um tema comum do Office 2016 é que todos os programas se parecem e funcionam. Depois de aprender a usar o Word, você achará que não é muito mais difícil aprender o Excel ou o PowerPoint porque as guias do Ribbon funcionam de maneiras semelhantes. Ainda melhor, os mesmos comandos de teclas funcionam de forma semelhante em todos os programas do Office 2016. Por ...