Vídeo: Overview: Tour of Enterprise Data Management Cloud 2024
Existem inúmeras combinações de modelos de implantação e entrega para grandes dados na nuvem. Por exemplo, você pode utilizar uma nuvem pública IaaS ou uma nuvem privada IaaS. Então, o que isso significa para grandes dados e por que a nuvem é uma boa opção para isso? Bem, grandes dados requerem agrupamentos distribuídos de poder de computação, que é como a nuvem está arquitetada.
Na verdade, uma série de características da nuvem tornam uma parte importante do grande ecossistema de dados:
-
Escalabilidade: A escalabilidade em relação ao hardware refere-se à capacidade de passar de pequenas e grandes quantidades de poder de processamento com a mesma arquitetura. No que diz respeito ao software, ele se refere à consistência do desempenho por unidade de energia à medida que os recursos de hardware aumentam. A nuvem pode escalar para grandes volumes de dados.
A computação distribuída, uma parte integrante do modelo de nuvem, realmente funciona em um plano "dividir e conquistar". Então, se você tiver enormes volumes de dados, eles podem ser divididos em servidores da nuvem. Uma característica importante do IaaS é que ele pode escalar dinamicamente. Isso significa que, se você acabar por precisar de mais recursos do que o esperado, você pode obtê-los. Isso vincula o conceito de elasticidade.
-
Elasticidade: A elasticidade refere-se à capacidade de expandir ou diminuir a demanda de recursos de computação em tempo real, com base na necessidade. Um dos benefícios da nuvem é que os clientes têm o potencial de acessar o máximo de um serviço que eles precisam. Isso pode ser útil para grandes projetos de dados onde você pode precisar expandir a quantidade de recursos de computação que você precisa para lidar com os dados.
-
Compartilhamento de recursos: As arquiteturas em nuvem permitem a criação eficiente de grupos de recursos compartilhados que tornam a nuvem economicamente viável.
-
Autoatendimento: Com o autoatendimento, o usuário de um recurso em nuvem pode usar um navegador ou uma interface de portal para adquirir os recursos necessários, digamos, para executar um enorme previsão modelo. Isso é dramaticamente diferente de como você pode obter recursos de um data center, onde você teria que solicitar os recursos das operações de TI.
-
Custos frontalmente baixos: Se você usa um provedor de nuvem, os custos iniciais geralmente podem ser reduzidos porque você não está comprando grandes quantidades de hardware ou arrendando novos espaços para lidar com seus dados importantes. Ao aproveitar as economias de escala associadas aos ambientes em nuvem, a nuvem pode parecer atraente.
-
Pay as you go: Uma opção de cobrança típica para um provedor da nuvem é Pay as You Go, o que significa que você é cobrado pelos recursos usados com base no preço da instância.Isso pode ser útil se você não tiver certeza de quais recursos você precisa para o seu grande projeto de dados.
-
Tolerância a falhas: Os provedores de serviços em nuvem devem ter tolerância a falhas incorporada em sua arquitetura, fornecendo serviços ininterruptos apesar da falha de um ou mais componentes do sistema.
Claramente, a própria natureza da nuvem torna um ambiente de computação ideal para grandes dados. Então, como você pode usar grandes dados em conjunto com a nuvem? Aqui estão alguns exemplos:
-
IaaS em uma nuvem pública: Neste cenário, você usaria a infra-estrutura de um provedor de nuvem pública para seus grandes serviços de dados porque você não quer usar sua própria infra-estrutura física. IaaS pode fornecer a criação de máquinas virtuais com armazenamento quase ilimitado e poder de computação. Você pode escolher o sistema operacional que deseja, e você tem a flexibilidade de dimensionar dinamicamente o ambiente para atender às suas necessidades.
-
PaaS em uma nuvem privada: O PaaS é uma infraestrutura completa, que pode ser usada para projetar, implementar e implantar aplicativos e serviços em um ambiente de nuvem público ou privado. O PaaS permite que uma organização aproveite os serviços de middleware de chave sem ter que lidar com as complexidades do gerenciamento de hardware e elementos de software individuais.
Os fornecedores da PaaS estão começando a incorporar grandes tecnologias de dados como Hadoop e MapReduce em suas ofertas PaaS. Por exemplo, você pode querer criar uma aplicação especializada para analisar grandes quantidades de dados médicos. O aplicativo usaria dados em tempo real e não em tempo real. Isso exigirá o Hadoop e MapReduce para armazenamento e processamento.
-
SaaS em uma nuvem híbrida: Aqui você pode querer analisar dados de "voz do cliente" de vários canais. Muitas empresas perceberam que uma das fontes de dados mais importantes é o que o cliente pensa e diz sobre sua empresa. Obter acesso à voz dos dados do cliente pode fornecer insights inestimáveis sobre comportamentos e ações. Cada vez mais, os clientes estão "vocalizando" em sites públicos.
O valor da entrada dos clientes pode ser grandemente aprimorado ao incorporar esses dados públicos na sua análise.