Vídeo: Blitzscaling 18: Brian Chesky on Launching Airbnb and the Challenges of Scale 2024
Você não terá a sorte de encontrar qualquer ambiente de fonte única quando estiver criando um data warehouse de luxo. Agora, você tem um novo conjunto de problemas com os quais você deve lidar, incluindo os que estão nesta lista:
-
Codificações diferentes para informações semelhantes: Diferentes conjuntos de números de clientes provêm de fontes diferentes, por exemplo.
-
Problemas de integridade de dados em várias fontes: As informações em uma fonte são diferentes das informações em outra quando elas deveriam ser iguais.
-
Diferentes plataformas de origem: Por exemplo, um mainframe IBM que possui bancos de dados DB2 / MVS pode conter os dados em uma das fontes; outro IBM mainframe que possui arquivos VSAM pode ter outro conjunto de dados de origem, um conjunto de servidores pode conter dados nos bancos de dados Oracle e o resto dos dados de origem podem ser armazenados em bancos de dados do SQL Server em servidores Windows.
Embora o número exato de fontes de dados dependa das especificidades de sua implementação, os deluxes do data warehouse tendem a ter uma média de oito a dez aplicativos e bancos de dados externos que fornecem dados ao armazém.
A ampla gama de áreas temáticas e a riqueza de dados em um armazém de dados de luxo significa que você geralmente possui diversas maneiras de ver o conteúdo desse armazém. Esta lista mostra as diferentes maneiras que você pode usar um data warehouse:
-
Relatórios e consultas simples: Como com data warehouse lite, o propósito do warehouse deluxe é "Me dizer o que aconteceu". "
-
Análise de negócios: Você usa o armazém para" Conte-me o que aconteceu "e por quê. "
-
Painéis e scorecards: Neste modelo, uma variedade de informações é coletada do data warehouse e essas informações são disponibilizadas para usuários que não desejam mexer com o data warehouse - eles querem ver instantâneos de muitas coisas diferentes. Seu objetivo é "Conte-me muitas coisas, mas não me faça trabalhar muito para obter as respostas que eu quero. "
-
Exploração de dados ou análise estatística: Nesta área, a inteligência estatística, artificial e técnicas relacionadas são usadas para extrair grandes volumes de dados e fornecer conhecimento sem que os usuários tenham que fazer perguntas específicas. O objetivo é "Me dizer algo interessante, apesar de não saber quais perguntas fazer e também me dizer o que pode acontecer. "
É provável que você empregue pelo menos três - e talvez todos os quatro - desses tipos de técnicas de acesso ao usuário de data warehouse quando você usa um data warehouse de luxo.Embora os fornecedores de ferramentas tentam cada vez mais fornecer suítes de produtos para lidar com tantas dessas diferentes funções quanto possível, você precisa lidar com produtos diferentes - e também a sua comunidade de usuários.
Não assuma que você pode simplesmente selecionar um único fornecedor cujos produtos satisfazem todos os recursos de inteligência de negócios que seus usuários precisam. Certifique-se de verificar cuidadosamente os produtos dos fornecedores - todos eles - porque você não tem garantia de que uma ferramenta de mineração de dados do fornecedor de OLAP de alto nível seja igualmente boa, por exemplo.
Não tenha medo de misturar e combinar; você não tem motivos para encaminhar os usuários do seu data warehouse simplesmente para evitar ter que lidar com mais um fornecedor.
Ao avaliar as suas necessidades de acesso aos usuários, faça-se as seguintes perguntas:
-
Os meus usuários querem as melhores ferramentas, que talvez não sejam necessariamente integradas, exigindo que desenvolvedores profissionais criem soluções de visualização?
-
Os meus usuários querem uma plataforma bem integrada que permita a integração entre as estratégias de acesso ao usuário para que elas possam desenvolver todas as soluções de visualização?
Responda a estas perguntas (e se você responder "Sim" a uma delas, você responde "Não" para o outro) pode ajudá-lo a avaliar as ferramentas de inteligência de negócios.