Vídeo: HDInsight: Fast Interactive Queries with Hive on LLAP | Azure Friday 2024
Aqui, você descobre como Faça o download e implante o HBase no modo autônomo. É incrivelmente simples instalar o HBase e começar a usar a tecnologia. Basta ter em mente que o HBase normalmente é implantado em um cluster de servidores de commodities, embora você também possa implantar facilmente o HBase em uma configuração autônoma, para fins de aprendizado ou demonstração.
Como o Apache Hadoop, o HBase suporta o Linux principalmente, mas você pode usar o Windows em ambientes não produtivos se você primeiro fizer o download do Cygwin. O Cygwin oferece aos usuários do Microsoft Windows um shell Unix com todos os seus comandos e utilitários. Então, se você seguir o Guia de Iniciação Rápida, você quer baixar o último lançamento do HBase.
Você consegue escolher onde instalar o HBase. Acontece, no entanto, que se você quer que as coisas sejam executadas em modo autônomo, você precisará editar alguns arquivos antes que você possa realmente iniciar o HBase. O primeiro arquivo é mostrado na lista a seguir. As mudanças que você deseja criar estão em negrito para fazê-los se destacar:
hbase. arquivo rootdir: /// home / biadmin / my-local-hbase / hbase-data hbase. grupo. Distribuiu true hbase. zookeeper. propriedade. ClientPort 2222 Propriedade do zoológico de configuração do ZooKeeper. cfg. A porta na qual os clientes se conectarão. hbase. zookeeper. propriedade. DataDir / home / biadmin / my-local-hbase / zookeeper hbase. zookeeper. quorum bivm
Você especifica um diretório no sistema de arquivos local para armazenar os dados HBase. Em ambientes de produção, esta propriedade indicaria o HDFS para o armazenamento de dados. Por razões de ilustração, o modo pseudo-distribuído fará com que o HBase inicie uma instância do RegionServer, uma instância do MasterServer e um processo Zookeeper.
Além disso, você precisa especificar o diretório onde o Zookeeper armazenará seus dados () e uma lista de servidores nos quais o Zookeeper será executado para formar um quorum (). Para autônomo, você especifica apenas o único servidor Zookeeper.
Começar com o HBase no modo autônomo é muito direto em parte porque a HBase gerencia o Zookeeper para você. Você pode baixar uma versão separada do Zookeeper e apontar o HBase para ele, mas para instalações autônomas, você achará muito mais fácil deixar a HBase gerenciar o Zookeeper para você.
Para cristalizar a decisão de permitir que a HBase gerencie o Zookeeper para você, veja como configurar uma variável de ambiente em outro arquivo HBase. A lista a seguir mostra o que precisa ser adicionado:
# Diga à HBase se deve gerenciar sua própria instância do Zookeeper ou não. Exporte HBASE_MANAGES_ZK = true # A implementação do java para usar.Java 1. 6 necessário. exportar JAVA_HOME = / opt / ibm / biginsights / jdk
Você terá que garantir que você aponte para o JDK escolhido. Finalmente, você precisa especificar o nome do seu sistema Linux em outro arquivo. (Em um ambiente de produção totalmente distribuído, este arquivo teria uma lista linha por linha de todos os servidores nos quais o HBase pode iniciar o processo RegionServer.)
Agora você pode iniciar o HBase e testar sua instalação. Para iniciar o HBase, use o script conforme descrito na lista a seguir.
$ cd $ INSTALL_DIR / hbase-0. 94. 7 / bin $. / start-hbase. sh bivm: iniciar zookeeper, iniciar sessão / home / biadmin / my-local-hbase / hbase-0. 94. 7 / bin / … / logs / hbase-biadmin-zookeeper-bivm. mestre inicial, log para / home / biadmin / my-local-hbase / hbase-0. 94. 7 / bin / … / logs / hbase-biadmin-master-bivm. out localhost: start regionerver, log para / home / biadmin / my-local-hbase / hbase-0. 94. 7 / bin / … / logs / hbase-biadmin-regionerver-bivm.
Observe que a primeira linha possui um comando cd (mudar diretório) que o move para uma variável de ambiente. Você deve configurar essa variável no diretório de instalação real da HBase ou digitar o caminho completo.
Em seguida, use a ferramenta JConsole, fornecida com o Java, para verificar rapidamente quais processos estão sendo executados após a conclusão do script. Você pode iniciar a ferramenta JConsole digitando o seguinte comando: $ JAVA_HOME / bin / jconsole.
JConsole revela que os três processos que o script afirmou iniciar estão realmente sendo executados - o zookeeper, o mestre e os processos RegionServer.
Para colocar o HBase através de seus passos, você interage com os três processos HBase, começando pelo MasterServer. Por padrão, o MasterServer relata o status do sistema por meio de uma interface de usuário do navegador na porta número 60010. No exemplo, você pode confirmar que o MasterServer está sendo executado corretamente digitando o seguinte URL em um navegador da Web: // bivm: 60010 /. Fazendo isso, traz as informações que você vê aqui.