10 Recursos hadoop Digno de um marcador - dummies

Os seguintes são dez fantásticos recursos Hadoop que merecem criar um marcador em seu navegador. Esses recursos ajudam você a criar um plano de aprendizagem ao longo da vida para o Hadoop.

Sistema nervoso central: Apache. org

A Apache Software Foundation (ASF) é a comunidade central para projetos de software de código aberto. Não apenas qualquer projeto pode ser um projeto Apache - muitos processos orientados por consenso convertem um pedaço de software de seus projetos iniciais e código beta (seu incubadora ) para o software completo e geralmente disponível.

O ASF não é apenas onde projetos como Hadoop são gerenciados - é onde eles "vivem e respiram". "Hoje, existem centenas de projetos Apache. Com isso em mente, você deve marcar a página Apache Hadoop como um dos seus principais recursos de aprendizagem. Este site é importante porque você pode acessar o código-fonte lá.

Tweet this

O Twitter não é o lugar para aprender Hadoop per se - afinal, você não pode facilmente mapear a programação MapReduce em aulas que abrangem apenas 140 caracteres. Seja como for, uma série de grandes gurus de dados estão no Twitter e expressam opiniões e apontam para recursos que podem fazer você um usuário Hadoop mais inteligente.

Uma série de listas de maiores influenciadores na paisagem do Twitter cobre Hadoop e dados importantes, e essa é a melhor maneira de encontrar essas personalidades do Hadoop e adicioná-las às suas listas do Twitter.

Universidade Hortonworks

A Universidade Hortonworks fornece treinamentos e certificações Hadoop. O site oferece cursos Hadoop criados para administradores ou desenvolvedores com a opção de um rigoroso programa de certificação. Hortonworks emprega alguns dos especialistas Hadoop mais profundos e mais conhecidos do mundo, de modo que você tenha certeza de uma experiência de qualidade por trás do material didático.

Universidade de Cloudera

A Universidade de Cloudera é similar em seu modelo de negócios e charter para a Universidade Hortonworks, fornecendo uma série de avenidas de aprendizado que correm a partir do texto tradicional para o vídeo. Cloudera é um elemento proeminente no mundo Hadoop. (Doug Cutting, o "pai" do Hadoop é seu principal arquiteto.) O site oferece um extenso conjunto de cursos, e mais, baseados na Distribuição Cloudera para Hadoop (CDH).

BigDataUniversity. Com

BigDataUniversity. com (o caso não importa quando você inseriu o URL em seu navegador) é um recurso fantástico para aprender sobre - você adivinhou - dados importantes. Claro, grandes dados não são apenas Hadoop, então você encontrará mais recursos do Hadoop neste site.Esta universidade tem mais de 100 mil alunos matriculados e aprendendo sobre Hadoop e grandes dados todos os dias.

planeta Big Data Blog Aggregator

É ótimo quando o nome de um site lhe diz exatamente o que faz - como o planeta Big Data Blog Aggregator: é um agregador de blogs sobre grandes dados, Hadoop e outros tópicos relacionados no planeta (bem, no planeta Terra de qualquer maneira).

Tanto os grandes nomes como os não-nomes aparecem no site, mas isso é útil: embora haja um compromisso indubitável com o Hadoop por Cloudera, Hortonworks, IBM e outros, muitas vezes é refrescante e valioso para se expor aos pensamentos e opiniões de profissionais de base, não afiliados por comunidades não ligadas a um fornecedor específico em seu roteiro de aprendizagem.

Fórum Apache Hadoop do Quora

O fórum Quora Apache Hadoop é a pedra angular para quem procura descobrir mais sobre Hadoop, ou sobre grandes dados em geral, para esse assunto.

Como em qualquer fórum, a gama de perguntas e respostas que você pode encontrar neste site é vertiginosa, mas todos os conduzem ao que você está procurando: o conhecimento. O site tem vínculos com o Hadoop e seus componentes individuais - por exemplo, tem fóruns específicos para MapReduce, HDFS, Pig, HBase e muito mais.

O site também tem fóruns Hadoop associados; por exemplo, Cloudera e Hortonworks têm grupos de discussão específicos para suas distribuições - um testemunho da popularidade desse fórum.

IBM Big Data Hub

O IBM Big Data Hub é um excelente local para aprender sobre Hadoop e seu ecossistema. Apesar de ser de propriedade e operada pela IBM, o conteúdo deste site nem sempre está vinculado aos produtos da IBM.

O IBM Big Data Hub fornece a qualquer visitante conhecimento suficiente para provocar a sede de dados grandes. Você encontrará todos os tipos de blogs, vídeos, artigos de analistas, casos de uso, infografia, apresentações e muito mais. É verdadeiramente um tesouro de grandes recursos de dados.

Conferências a não perder

Existem muitas conferências Hadoop e conferências de dados ainda mais importantes - a Cúpula Hadoop e o Strata Hadoop World como as conferências por excelência a serem perdidas. Normalmente, um fornecedor de distribuição co-patrocina essas conferências. Por exemplo, Yahoo! e Hortonworks patrocina a Cúpula Hadoop, e Cloudera é o co-patrocinador da Strata Hadoop World.

Tanto o Strata Hadoop World como a Cúpula Hadoop são os lugares de encontro das mentes mais bem-vinda do Hadoop no negócio; Essas conferências atraem uma grande variedade de profissionais interessados em Hadoop, incluindo decisores, arquitetos, desenvolvedores, analistas e muito mais.

Os artigos do Google que iniciaram tudo

O que agora é conhecido como Hadoop tem sua gênese em vários artigos escritos pelos funcionários do Google que estavam focados no problema da indexação da Web.

Enquanto o projeto Apache Nutch (uma tecnologia de código aberto para rastrear a Web) estava girando seu foco na escala para fora, a fim de indexar volumes maiores de dados da web, o Google publicou um artigo, "The Google File System" (outubro de 2003), o que influenciou fortemente Doug Cutting e seu co-fundador da Nutch, Mike Cafarella.Pouco depois, o Google lançou o seu documento "MapReduce: processamento simplificado de dados em grandes clusters" (dezembro de 2004).

Juntos, o conceito de um sistema de arquivos distribuídos e uma estrutura de processamento paralelo em larga escala foram tirados pela Cutting e Cafarella para desenvolver o Apache Hadoop. Claro, a Cutting comercializou este trabalho em Yahoo!, E o resto, como eles falam, é história.