Vídeo: DATA LAKE x DATA WAREHOUSE x DATA MART - O Que É e Suas Diferenças 2024
A idéia de um data mart dificilmente é revolucionária, apesar do que você pode ler nos blogs e na imprensa de comércio de computadores e o que você pode Ouça em conferências ou seminários. Um data mart é simplesmente um data warehouse reduzido - isso é tudo.
Os fornecedores fazem o seu melhor para definir dados marts no contexto de seus produtos; consultores e analistas geralmente definem os mercados de dados de uma maneira que é vantajosa para suas ofertas e especialidades específicas. Essa é a maneira como esse negócio se passa; esteja preparado para fazer as perguntas difíceis.
Se você começar um projeto desde o início com qualquer uma das seguintes instalações, você já possui duas greves contra você:
-
"Estamos construindo um data warehouse real, não um pouco de dados insignificantes mart. "
-
" Estamos construindo um data mart, não um data warehouse. "
Ao rotular seu projeto como um ou outro desses termos, você já possui algumas noções preconcebidas sobre o trabalho que você fará, antes mesmo de começar a explorar o problema comercial. Até que você compreenda os seguintes três problemas, você não tem fundamento para classificar seu projeto iminente como um data mart ou um data warehouse:
-
Os volumes e características dos dados que você precisa
-
Os problemas de negócios que você está tentando resolver e as perguntas que você está tentando responder
-
O valor comercial que você espera obter quando seu O sistema foi construído com sucesso
Se você estiver extraindo e reabastecendo um subconjunto de dados de um aplicativo existente em outro ambiente, você pode chamar com precisão o que você está criando um mercado de dados.
Mas se você está começando do zero, extraindo dados de um ou mais sistemas de origem, lidando com a garantia e transformação de qualidade e copiando esses dados para um ambiente separado, o que determina se você está construindo um data warehouse ou um data mart?
Embora existam algumas diretrizes, como número de áreas temáticas e volumes de dados, tudo se resume a esta afirmação: assim que você começar a rotular seu ambiente como um ou outro, você está adicionando noções e crenças preconcebidas sobre suas características que podem não corresponder às suas necessidades comerciais.
Aqui está a resposta: Esqueça os termos data warehouse e data mart. Concentre-se em seu problema comercial e sua possível solução. Que dados você precisa para executar determinadas funções informativas e analíticas; Onde é que os dados agora e em que forma; e o que você tem que fazer para torná-lo disponível para seus usuários?
Deixe as guerras terminológicas aos fornecedores e analistas. Não fique preso no exagero.