Índice:
- Sistema nervoso central: Apache. org
- Tweet this
- Universidade Hortonworks
- Universidade de Cloudera
- BigDataUniversity. Com
- planeta Big Data Blog Aggregator
- Fórum Apache Hadoop do Quora
- IBM Big Data Hub
- Conferências a não perder
- Os artigos do Google que iniciaram tudo
Vídeo: Como instalar Hadoop en Windows10 2024
Os seguintes são dez fantásticos recursos Hadoop que merecem criar um marcador em seu navegador. Esses recursos ajudam você a criar um plano de aprendizagem ao longo da vida para o Hadoop.
Sistema nervoso central: Apache. org
A Apache Software Foundation (ASF) é a comunidade central para projetos de software de código aberto. Não apenas qualquer projeto pode ser um projeto Apache - muitos processos orientados por consenso convertem um pedaço de software de seus projetos iniciais e código beta (seu incubadora ) para o software completo e geralmente disponível.
O ASF não é apenas onde projetos como Hadoop são gerenciados - é onde eles "vivem e respiram". "Hoje, existem centenas de projetos Apache. Com isso em mente, você deve marcar a página Apache Hadoop como um dos seus principais recursos de aprendizagem. Este site é importante porque você pode acessar o código-fonte lá.
Tweet this
O Twitter não é o lugar para aprender Hadoop per se - afinal, você não pode facilmente mapear a programação MapReduce em aulas que abrangem apenas 140 caracteres. Seja como for, uma série de grandes gurus de dados estão no Twitter e expressam opiniões e apontam para recursos que podem fazer você um usuário Hadoop mais inteligente.
Uma série de listas de maiores influenciadores na paisagem do Twitter cobre Hadoop e dados importantes, e essa é a melhor maneira de encontrar essas personalidades do Hadoop e adicioná-las às suas listas do Twitter.
Universidade Hortonworks
A Universidade Hortonworks fornece treinamentos e certificações Hadoop. O site oferece cursos Hadoop criados para administradores ou desenvolvedores com a opção de um rigoroso programa de certificação. Hortonworks emprega alguns dos especialistas Hadoop mais profundos e mais conhecidos do mundo, de modo que você tenha certeza de uma experiência de qualidade por trás do material didático.
Universidade de Cloudera
A Universidade de Cloudera é similar em seu modelo de negócios e charter para a Universidade Hortonworks, fornecendo uma série de avenidas de aprendizado que correm a partir do texto tradicional para o vídeo. Cloudera é um elemento proeminente no mundo Hadoop. (Doug Cutting, o "pai" do Hadoop é seu principal arquiteto.) O site oferece um extenso conjunto de cursos, e mais, baseados na Distribuição Cloudera para Hadoop (CDH).
BigDataUniversity. Com
BigDataUniversity. com (o caso não importa quando você inseriu o URL em seu navegador) é um recurso fantástico para aprender sobre - você adivinhou - dados importantes. Claro, grandes dados não são apenas Hadoop, então você encontrará mais recursos do Hadoop neste site.Esta universidade tem mais de 100 mil alunos matriculados e aprendendo sobre Hadoop e grandes dados todos os dias.
planeta Big Data Blog Aggregator
É ótimo quando o nome de um site lhe diz exatamente o que faz - como o planeta Big Data Blog Aggregator: é um agregador de blogs sobre grandes dados, Hadoop e outros tópicos relacionados no planeta (bem, no planeta Terra de qualquer maneira).
Tanto os grandes nomes como os não-nomes aparecem no site, mas isso é útil: embora haja um compromisso indubitável com o Hadoop por Cloudera, Hortonworks, IBM e outros, muitas vezes é refrescante e valioso para se expor aos pensamentos e opiniões de profissionais de base, não afiliados por comunidades não ligadas a um fornecedor específico em seu roteiro de aprendizagem.
Fórum Apache Hadoop do Quora
O fórum Quora Apache Hadoop é a pedra angular para quem procura descobrir mais sobre Hadoop, ou sobre grandes dados em geral, para esse assunto.
Como em qualquer fórum, a gama de perguntas e respostas que você pode encontrar neste site é vertiginosa, mas todos os conduzem ao que você está procurando: o conhecimento. O site tem vínculos com o Hadoop e seus componentes individuais - por exemplo, tem fóruns específicos para MapReduce, HDFS, Pig, HBase e muito mais.
O site também tem fóruns Hadoop associados; por exemplo, Cloudera e Hortonworks têm grupos de discussão específicos para suas distribuições - um testemunho da popularidade desse fórum.
IBM Big Data Hub
O IBM Big Data Hub é um excelente local para aprender sobre Hadoop e seu ecossistema. Apesar de ser de propriedade e operada pela IBM, o conteúdo deste site nem sempre está vinculado aos produtos da IBM.
O IBM Big Data Hub fornece a qualquer visitante conhecimento suficiente para provocar a sede de dados grandes. Você encontrará todos os tipos de blogs, vídeos, artigos de analistas, casos de uso, infografia, apresentações e muito mais. É verdadeiramente um tesouro de grandes recursos de dados.
Conferências a não perder
Existem muitas conferências Hadoop e conferências de dados ainda mais importantes - a Cúpula Hadoop e o Strata Hadoop World como as conferências por excelência a serem perdidas. Normalmente, um fornecedor de distribuição co-patrocina essas conferências. Por exemplo, Yahoo! e Hortonworks patrocina a Cúpula Hadoop, e Cloudera é o co-patrocinador da Strata Hadoop World.
Tanto o Strata Hadoop World como a Cúpula Hadoop são os lugares de encontro das mentes mais bem-vinda do Hadoop no negócio; Essas conferências atraem uma grande variedade de profissionais interessados em Hadoop, incluindo decisores, arquitetos, desenvolvedores, analistas e muito mais.
Os artigos do Google que iniciaram tudo
O que agora é conhecido como Hadoop tem sua gênese em vários artigos escritos pelos funcionários do Google que estavam focados no problema da indexação da Web.
Enquanto o projeto Apache Nutch (uma tecnologia de código aberto para rastrear a Web) estava girando seu foco na escala para fora, a fim de indexar volumes maiores de dados da web, o Google publicou um artigo, "The Google File System" (outubro de 2003), o que influenciou fortemente Doug Cutting e seu co-fundador da Nutch, Mike Cafarella.Pouco depois, o Google lançou o seu documento "MapReduce: processamento simplificado de dados em grandes clusters" (dezembro de 2004).
Juntos, o conceito de um sistema de arquivos distribuídos e uma estrutura de processamento paralelo em larga escala foram tirados pela Cutting e Cafarella para desenvolver o Apache Hadoop. Claro, a Cutting comercializou este trabalho em Yahoo!, E o resto, como eles falam, é história.