Vídeo: Data lake x Data Warehouse 2024
Um data warehouse é, por sua própria natureza, um armazenamento de dados físico distribuído. A distribuição de seus ativos de informações auxilia no desempenho e na usabilidade em todos os sistemas e em toda a empresa. Faça deste nível de usabilidade a pedra angular da sua missão e objetivo de armazenagem de dados.
Esta figura mostra como os armazenamentos de dados importantes de uma arquitetura de data warehousing incorporam fontes de dados, data warehouse, uma loja de dados operacional, data marts e dados mestres.
Os feeds de dados de origem são as entradas que alimentam o data warehouse - normalmente, seus bancos de dados de aplicativos de corrida, bem como fontes de dados externas, como dados de classificação de crédito ou informações de segmentos de mercado. Embora a equipe de armazenamento de dados não gerencie os dados e a arquitetura associados a essas lojas de dados, a equipe precisa entender os feeds de dados.
Assim como um cavalo sem cascos não pode funcionar corretamente, um data warehouse sem fontes não pode fazer o trabalho. A tarefa mais difícil que você enfrenta no data warehousing é escolher a fonte certa, ou o sistema de registro, para os dados que se movem para o data warehouse. Se os dados forem de baixa qualidade ou não estiverem disponíveis, você tem dificuldade em suportar um data warehouse de alta qualidade.