Lar Finanças Pessoais 10 Recursos hadoop Digno de um marcador - dummies

10 Recursos hadoop Digno de um marcador - dummies

Índice:

Vídeo: Como instalar Hadoop en Windows10 2025

Vídeo: Como instalar Hadoop en Windows10 2025
Anonim

Os seguintes são dez fantásticos recursos Hadoop que merecem criar um marcador em seu navegador. Esses recursos ajudam você a criar um plano de aprendizagem ao longo da vida para o Hadoop.

Sistema nervoso central: Apache. org

A Apache Software Foundation (ASF) é a comunidade central para projetos de software de código aberto. Não apenas qualquer projeto pode ser um projeto Apache - muitos processos orientados por consenso convertem um pedaço de software de seus projetos iniciais e código beta (seu incubadora ) para o software completo e geralmente disponível.

O ASF não é apenas onde projetos como Hadoop são gerenciados - é onde eles "vivem e respiram". "Hoje, existem centenas de projetos Apache. Com isso em mente, você deve marcar a página Apache Hadoop como um dos seus principais recursos de aprendizagem. Este site é importante porque você pode acessar o código-fonte lá.

Tweet this

O Twitter não é o lugar para aprender Hadoop per se - afinal, você não pode facilmente mapear a programação MapReduce em aulas que abrangem apenas 140 caracteres. Seja como for, uma série de grandes gurus de dados estão no Twitter e expressam opiniões e apontam para recursos que podem fazer você um usuário Hadoop mais inteligente.

Uma série de listas de maiores influenciadores na paisagem do Twitter cobre Hadoop e dados importantes, e essa é a melhor maneira de encontrar essas personalidades do Hadoop e adicioná-las às suas listas do Twitter.

Universidade Hortonworks

A Universidade Hortonworks fornece treinamentos e certificações Hadoop. O site oferece cursos Hadoop criados para administradores ou desenvolvedores com a opção de um rigoroso programa de certificação. Hortonworks emprega alguns dos especialistas Hadoop mais profundos e mais conhecidos do mundo, de modo que você tenha certeza de uma experiência de qualidade por trás do material didático.

Universidade de Cloudera

A Universidade de Cloudera é similar em seu modelo de negócios e charter para a Universidade Hortonworks, fornecendo uma série de avenidas de aprendizado que correm a partir do texto tradicional para o vídeo. Cloudera é um elemento proeminente no mundo Hadoop. (Doug Cutting, o "pai" do Hadoop é seu principal arquiteto.) O site oferece um extenso conjunto de cursos, e mais, baseados na Distribuição Cloudera para Hadoop (CDH).

BigDataUniversity. Com

BigDataUniversity. com (o caso não importa quando você inseriu o URL em seu navegador) é um recurso fantástico para aprender sobre - você adivinhou - dados importantes. Claro, grandes dados não são apenas Hadoop, então você encontrará mais recursos do Hadoop neste site.Esta universidade tem mais de 100 mil alunos matriculados e aprendendo sobre Hadoop e grandes dados todos os dias.

planeta Big Data Blog Aggregator

É ótimo quando o nome de um site lhe diz exatamente o que faz - como o planeta Big Data Blog Aggregator: é um agregador de blogs sobre grandes dados, Hadoop e outros tópicos relacionados no planeta (bem, no planeta Terra de qualquer maneira).

Tanto os grandes nomes como os não-nomes aparecem no site, mas isso é útil: embora haja um compromisso indubitável com o Hadoop por Cloudera, Hortonworks, IBM e outros, muitas vezes é refrescante e valioso para se expor aos pensamentos e opiniões de profissionais de base, não afiliados por comunidades não ligadas a um fornecedor específico em seu roteiro de aprendizagem.

Fórum Apache Hadoop do Quora

O fórum Quora Apache Hadoop é a pedra angular para quem procura descobrir mais sobre Hadoop, ou sobre grandes dados em geral, para esse assunto.

Como em qualquer fórum, a gama de perguntas e respostas que você pode encontrar neste site é vertiginosa, mas todos os conduzem ao que você está procurando: o conhecimento. O site tem vínculos com o Hadoop e seus componentes individuais - por exemplo, tem fóruns específicos para MapReduce, HDFS, Pig, HBase e muito mais.

O site também tem fóruns Hadoop associados; por exemplo, Cloudera e Hortonworks têm grupos de discussão específicos para suas distribuições - um testemunho da popularidade desse fórum.

IBM Big Data Hub

O IBM Big Data Hub é um excelente local para aprender sobre Hadoop e seu ecossistema. Apesar de ser de propriedade e operada pela IBM, o conteúdo deste site nem sempre está vinculado aos produtos da IBM.

O IBM Big Data Hub fornece a qualquer visitante conhecimento suficiente para provocar a sede de dados grandes. Você encontrará todos os tipos de blogs, vídeos, artigos de analistas, casos de uso, infografia, apresentações e muito mais. É verdadeiramente um tesouro de grandes recursos de dados.

Conferências a não perder

Existem muitas conferências Hadoop e conferências de dados ainda mais importantes - a Cúpula Hadoop e o Strata Hadoop World como as conferências por excelência a serem perdidas. Normalmente, um fornecedor de distribuição co-patrocina essas conferências. Por exemplo, Yahoo! e Hortonworks patrocina a Cúpula Hadoop, e Cloudera é o co-patrocinador da Strata Hadoop World.

Tanto o Strata Hadoop World como a Cúpula Hadoop são os lugares de encontro das mentes mais bem-vinda do Hadoop no negócio; Essas conferências atraem uma grande variedade de profissionais interessados ​​em Hadoop, incluindo decisores, arquitetos, desenvolvedores, analistas e muito mais.

Os artigos do Google que iniciaram tudo

O que agora é conhecido como Hadoop tem sua gênese em vários artigos escritos pelos funcionários do Google que estavam focados no problema da indexação da Web.

Enquanto o projeto Apache Nutch (uma tecnologia de código aberto para rastrear a Web) estava girando seu foco na escala para fora, a fim de indexar volumes maiores de dados da web, o Google publicou um artigo, "The Google File System" (outubro de 2003), o que influenciou fortemente Doug Cutting e seu co-fundador da Nutch, Mike Cafarella.Pouco depois, o Google lançou o seu documento "MapReduce: processamento simplificado de dados em grandes clusters" (dezembro de 2004).

Juntos, o conceito de um sistema de arquivos distribuídos e uma estrutura de processamento paralelo em larga escala foram tirados pela Cutting e Cafarella para desenvolver o Apache Hadoop. Claro, a Cutting comercializou este trabalho em Yahoo!, E o resto, como eles falam, é história.

10 Recursos hadoop Digno de um marcador - dummies

Escolha dos editores

Noções básicas do arquivo de dados Flashback da Oracle 12c - dummies

Noções básicas do arquivo de dados Flashback da Oracle 12c - dummies

O Flashback Data Archive do oracle 12c é um mecanismo de banco de dados que permite que você para armazenar periodicamente ou indefinidamente todas as versões de linha em uma tabela ao longo da sua vida útil. Você pode então escolher uma hora para ver os dados como existia em um ponto específico. Esteja ciente de que o Flashback Data Archive é um recurso licenciado. ...

Noções básicas de clusters de aplicativos reais do Oracle 12c - manequins

Noções básicas de clusters de aplicativos reais do Oracle 12c - manequins

Se você visitou os sites da Oracle nos últimos 12 anos , você viu o byline de marketing: "Inquebrável. "Essa linha de tag refere-se ao recurso Real Application Clusters (RAC). Claro, muitos elementos estão envolvidos, mas o RAC tem o destaque. O RAC é a solução de clustering de banco de dados Oracle. Em certo sentido, funciona na teoria de que ...

Noções básicas de Redo Log Files no Oracle 12c - dummies

Noções básicas de Redo Log Files no Oracle 12c - dummies

Redo os arquivos de log armazenam as informações do buffer de log no banco de dados Oracle 12c. Eles são escritos pelo Log Writer (LGWR). Mais uma vez, você não pode ler esses arquivos binários sem a ajuda do software de banco de dados. Normalmente, os arquivos de reto de log são nomeados com a extensão. LOG ou. RDO. Pode ser qualquer coisa que você queira, ...

Escolha dos editores

São orgasmos ok durante a gravidez? - Dummies

São orgasmos ok durante a gravidez? - Dummies

As mulheres grávidas não só têm permissão para fazer sexo, mas muitas vezes o desejam. Mas é bom aproveitar a relação sexual com o ponto do orgasmo? Afinal, os orgasmos são nada mais do que contrações - e as pessoas sugeriram que isso poderia desencadear mão-de-obra. Isso é apenas um mito. De fato, grávida ...

Alimentando a Multidão em uma Reunião Familiar - manequins

Alimentando a Multidão em uma Reunião Familiar - manequins

Cozinhando uma refeição para um grande grupo (reunião familiar ou de outra forma ) requer planejamento e resistência. Aqui está um guia útil para quantidades de alimentos e segurança alimentar, e conselhos sobre a organização de uma festa de potluck. Planejando para potlucks A forma mais comum de comestibles de grupo é uma festa de potluck - qual é a maneira mais barata e fácil de ...

Anatomia do Penis humano - dummies

Anatomia do Penis humano - dummies

Sabendo como as funções de um pénis podem fornecer uma visão útil do sexo e do corpo humano - se você quer entender o pénis e a anatomia masculina melhor ou aprender sobre isso pela primeira vez. Basicamente, um pênis é composto de três estruturas, que são feitas de um material esponjoso que pode preencher com sangue: ...

Escolha dos editores

Como lidar com outliers causados ​​por Forças externas - manequins

Como lidar com outliers causados ​​por Forças externas - manequins

Certifique-se de verificar atentamente os outliers antes eles influenciam sua análise preditiva. Os outliers podem distorcer a análise de dados e dados. Por exemplo, qualquer análise estatística feita com dados que deixa outliers no lugar acaba por desviar os meios e variâncias. Os outliers não controlados ou mal interpretados podem levar a conclusões falsas. Diga os seus dados que ...

Como criar um modelo de análise preditiva com regressão R - manequins

Como criar um modelo de análise preditiva com regressão R - manequins

Você deseja criar um preditivo modelo de análise que você pode avaliar usando resultados conhecidos. Para fazer isso, vamos dividir nosso conjunto de dados em dois conjuntos: um para treinar o modelo e outro para testar o modelo. Uma divisão 70/30 entre treinamento e testes de conjuntos de dados será suficiente. As próximas duas linhas de código ...

Como definir objetivos de negócios para um modelo de análise preditiva - dummies

Como definir objetivos de negócios para um modelo de análise preditiva - dummies

Um modelo de análise preditiva visa resolvendo um problema comercial ou realizando um resultado comercial desejado. Esses objetivos comerciais se tornam os objetivos do modelo. Conhecer aqueles garante o valor comercial do modelo que você constrói - o que não deve ser confundido com a precisão do modelo. Hipotéticamente, você pode construir um modelo preciso para ...