Vídeo: Apache Drill Introduction 2024
Apache Drill é um projeto candidato na incubadora Apache. Apache Drill também não é especialmente doente. As tecnologias candidatas da Fundação Apache Software Foundation (ASF) começam como projetos de incubadoras antes de se tornarem tecnologias oficiais da ASF. Você pode ler sobre a Incubadora Apache. Você pode ler sobre Broca.
Inspirado pela tecnologia Dremel do Google, o objetivo de desempenho estabelecido para Drill é habilitar consultas SQL contra um petabyte ou mais de dados distribuídos em servidores de 10 000 mais. A figura ilustra a arquitetura do Apache Drill.
Você pode ver que a chave para a arquitetura Drill são os servidores DrillBit implantados em cada nó de dados. Observe que cada servidor inclui um analisador de consulta, compilador, otimizador e tempo de execução, mas existe um servidor Master DrillBit nomeado pelos servidores do Zookeeper, que supervisiona a execução das consultas e cuida da tarefa de juntar os conjuntos de resultados intermediários em um único conjunto de resultados.
Como a Dremel, a Broca pode coexistir com, e complementar, MapReduce, mas o MapReduce não é usado para atender consultas, como ocorre com o Apache Hive. Em vez disso, os motores de execução chamados Drillbits foram desenvolvidos por membros da comunidade Drill.
Esta comunidade tem como objetivo fornecer consultas de baixa latência para aplicativos, como painéis eletrônicos de inteligência de negócios em tempo real, detecção de fraude e outros casos de uso sensíveis ao tempo. A broca suporta tipos de dados aninhados, como o Avro, o JSON e os buffers de protocolo do Google. Esses tipos de dados aninhados permitem tabelas desnormalizadas muito grandes.
A equipe de desenvolvimento da Broca também está trabalhando no fornecimento de suporte SQL extensivo, visando a conformidade com SQL2003. Finalmente, note que a equipe do Drill está fornecendo suporte para HBase para que os usuários possam consultar as tabelas do HBase com o SQL.