Vídeo: HPE Cloud Bank Storage 2024
Enquanto os mundos dos grandes dados e o data warehouse tradicional se cruzarão, é improvável que eles se fundam em breve. Pense em um data warehouse como um sistema de registro para business intelligence, bem como um gerenciamento de relacionamento com clientes (CRM) ou sistema de contabilidade. Estes sistemas são altamente estruturados e otimizados para fins específicos. Além disso, esses sistemas de registro tendem a ser altamente centralizados.
O diagrama mostra uma abordagem típica dos fluxos de dados com armazéns e marts:
As organizações continuarão inevitavelmente a utilizar armazéns de dados para gerenciar o tipo de dados estruturados e operacionais que caracterizam os sistemas de registro. Esses data warehouses ainda fornecerão aos analistas de negócios a capacidade de analisar dados, tendências, e assim por diante. No entanto, o advento de grandes dados é desafiar o papel do data warehouse e fornecer uma abordagem complementar.
Pense no relacionamento entre o data warehouse e os grandes dados como fusão para se tornar uma estrutura híbrida. Neste modelo híbrido, os dados operacionais otimizados altamente estruturados permanecem no data warehouse bem controlado, enquanto os dados que são altamente distribuídos e sujeitos a mudanças em tempo real são controlados por uma infraestrutura baseada em Hadoop (ou similar noSQL).
É inevitável que os dados operacionais e estruturados tenham que interagir no mundo dos grandes dados, onde as fontes de informação não foram (necessariamente) limpas ou perfiladas. Cada vez mais, as organizações estão entendendo que eles têm um requisito de negócios para poder combinar armazéns de dados tradicionais com suas fontes históricas de dados de negócios com fontes de dados grandes, menos estruturadas e vetadas. Uma abordagem híbrida que suporta fontes de dados tradicionais e grandes pode ajudar a atingir esses objetivos comerciais.