Vídeo: Microsoft Azure OpenDev—June 2017 2024
O termo polígloti é emprestado e redefinido para grandes dados como um conjunto de aplicativos que usam várias tecnologias de banco de dados principais, e este é o resultado mais provável de seu planejamento de implementação. A definição oficial de polyglot é & ldquo; alguém que fala ou escreve várias línguas. & rdquo; Vai ser difícil escolher um estilo de persistência, não importa quão estreita seja sua abordagem de dados maiores.
Um banco de dados de persistência poliglota é usado quando é necessário resolver um problema complexo, quebrando esse problema em segmentos e aplicando diferentes modelos de banco de dados. Em seguida, é necessário agregar os resultados em uma solução híbrida de armazenamento e análise de dados. Uma série de fatores afetam essa decisão:
-
Você já está usando a persistência poliglota em seu local de trabalho existente. Se sua empresa ou organização for grande, você provavelmente está usando vários RDBMSs, data warehouses, data marts, arquivos planos, servidores de gerenciamento de conteúdo e assim por diante.
Este ambiente híbrido é comum e você precisa entender isso para que você possa tomar as decisões certas sobre integração, análise, pontualidade de dados, visibilidade de dados e assim por diante. Você precisa entender tudo isso porque você precisa descobrir como ele vai se encaixar na sua grande implementação de dados.
-
O mais ideal de ambientes, onde você possui apenas uma tecnologia de persistência, provavelmente não é adequado para resolução de problemas de grandes dados. No mínimo, você precisará apresentar outro estilo de banco de dados e outras tecnologias de suporte para sua nova implementação.
-
Dependendo da variedade e da velocidade da sua grande coleta de dados, talvez seja necessário considerar diferentes bancos de dados para suportar uma implementação. Você também deve considerar seus requisitos de integridade transacional. Você precisa apoiar a conformidade ACID ou a conformidade BASE será suficiente?
Suponha que você precise identificar todos os clientes do seu produto que comprou nos últimos 12 meses e comentou em sites sociais sobre sua experiência - E se eles tiveram algum caso de suporte, onde eles adquiriram o produto, como ele foi entregue, o que eles pagaram, como eles pagaram, se eles foram no site da empresa, quantas vezes, o que eles fizeram, e assim por diante.
Então suponha que você deseja oferecer-lhes um desconto promocional para o seu smartphone quando estiverem entrando em uma das suas lojas de varejo (ou em um dos seus parceiros).
Este é um grande desafio de dados no seu melhor.Várias fontes de dados com estruturas muito diferentes precisam ser coletadas e analisadas para que você possa obter as respostas a essas perguntas. Então você precisa determinar se os clientes se qualificam para a promoção e, em tempo real, empurrá-los para um cupom oferecendo-lhes algo novo e interessante.
Este tipo de problema não pode ser resolvido de forma fácil ou econômica com um tipo de tecnologia de banco de dados. Embora algumas das informações básicas sejam transacionais e provavelmente em um RDBMS, as outras informações não são racionais e exigirão pelo menos dois tipos de mecanismos de persistência (espacial e gráfico). Agora você tem persistência poliglota.