Lar Finanças Pessoais Dados Extração, Movimento e Carregamento para Data Warehouse Deluxe - dummies

Dados Extração, Movimento e Carregamento para Data Warehouse Deluxe - dummies

Vídeo: HOME (2009) 2025

Vídeo: HOME (2009) 2025
Anonim

As implementações de armazenamento de data warehouse são grandes - e ficam maiores o tempo todo. As implementações que usam centenas de gigabytes (um gigabyte igual a 1 bilhão de bytes) e até mesmo terabytes (1 trilhão de bytes) são cada vez mais comuns. Para gerenciar esse volume de dados e acesso ao usuário, você precisa de um servidor e banco de dados muito robusto.

Prepare-se para o desafio! Com um data warehouse lite, você geralmente pode manipular o movimento de dados de origem para armazém de maneira direta e de baixa tecnologia - mas com o data warehouse deluxe, você está entrando agora na Zona de dificuldade, onde muitos projetos de data warehousing atendem aos seus Waterloo.

É provável que você tenha dificuldades neste domínio por vários motivos:

  • Você está lidando com muitas fontes de dados diferentes, algumas das quais podem conter dados sobrepostos. Por exemplo, a informação dos fornecedores pode ser proveniente de dois sistemas de compras diferentes e alguns de seus fornecedores têm entradas em ambos os sistemas.

    Você provavelmente entrará em diferentes conjuntos de identificadores que você deve convergir (por exemplo, seis caracteres alfanuméricos identificados como SUPPLIER_ID em um dos sistemas e um inteiro inteiro conhecido como SUP_NUM no outro).

  • Se o seu data warehouse for grande (com mais de 250 gigabytes), é provável que você tenha dificuldades em extrair, mover e carregar suas janelas em lote. Lote de janelas , os intervalos de tempo em que as atualizações são feitas no armazém, são complicados pelo número de fontes de dados que você precisa manipular.

  • As chances de ter um processo de extração, movimento, transformação e carregamento imobilizado estão exponencialmente relacionadas ao número de elementos de dados a serem carregados no data warehouse.

    Se você pudesse atribuir algum fator de dificuldade (um número inteiro, por exemplo) ao processo de obtenção de dados no armazém, as seguintes medidas seriam verdadeiras: você tem n dados elementos que você deseja incluir no data warehouse com um fator de dificuldade de x. Se você tiver agora 2 n elementos de dados, seu fator de dificuldade não é 2 x; em vez disso, é x ao quadrado.

    Para tornar esse fator de dificuldade mais fácil de entender, atribua alguns números a n e x. Diga que seu data warehouse tenha 100 elementos (n) eo fator de dificuldade (x) for 5. Se você duplicar o número de elementos ( n > = 200), seu fator de dificuldade é 25 (5 quadrados), não 10 (5 x 2). O processo de lidar com tantas fontes de dados, todos dirigidos para um lugar (seu data warehouse deluxe), tem todos os elementos de muitos cozinheiros na cozinha, ou o que quer dizer.

  • Para fazer o processo de extração, movimento, transformação e carregamento funcionar sem problemas, você provavelmente terá que lidar com vários proprietários de aplicativos diferentes, detentores oficiais do banco de dados e outras pessoas de várias organizações diferentes, todas as quais têm que cooperar como eles fazem parte de uma orquestra sinfônica profissional.

    A realidade, no entanto, é que eles executam mais como um grupo de estudantes de jardim de infância que cada um escolhe um instrumento musical da caixa de brinquedos e é informado: "Agora jogue algo! "Embora o processo não seja necessariamente condenado a falhas, espere uma série de iterações até que você possa obter o data warehouse deluxe carregado apenas para a direita.

    Um data warehouse deluxe pode ter três níveis (como um data warehouse lite), exceto com mais fontes de dados e talvez mais de um tipo de ferramenta de usuário acessando o armazém. Mas a arquitetura para um data warehouse deluxe provavelmente se parece mais com o que é mostrado nesta figura, com muitos pontos de coleta diferentes de dados.

Além de outras "estações de caminho" necessárias para o seu ambiente particular, seu ambiente pode ter esses elementos:

Data mart:

  • Recebe subconjuntos de informações do data warehouse deluxe e serve como ponto de acesso primário para Comercial. Estação de transformação provisória:

  • Uma área na qual conjuntos de dados extraídos de algumas fontes são submetidos a algum tipo de processo de transformação antes de deslocar o encanamento em direção ao banco de dados do armazém. Estação de garantia de qualidade:

  • Uma área na qual grupos de dados são submetidos a controles intensivos de garantia de qualidade antes de deixá-los entrar no data warehouse.

Dados Extração, Movimento e Carregamento para Data Warehouse Deluxe - dummies

Escolha dos editores

Noções básicas do arquivo de dados Flashback da Oracle 12c - dummies

Noções básicas do arquivo de dados Flashback da Oracle 12c - dummies

O Flashback Data Archive do oracle 12c é um mecanismo de banco de dados que permite que você para armazenar periodicamente ou indefinidamente todas as versões de linha em uma tabela ao longo da sua vida útil. Você pode então escolher uma hora para ver os dados como existia em um ponto específico. Esteja ciente de que o Flashback Data Archive é um recurso licenciado. ...

Noções básicas de clusters de aplicativos reais do Oracle 12c - manequins

Noções básicas de clusters de aplicativos reais do Oracle 12c - manequins

Se você visitou os sites da Oracle nos últimos 12 anos , você viu o byline de marketing: "Inquebrável. "Essa linha de tag refere-se ao recurso Real Application Clusters (RAC). Claro, muitos elementos estão envolvidos, mas o RAC tem o destaque. O RAC é a solução de clustering de banco de dados Oracle. Em certo sentido, funciona na teoria de que ...

Noções básicas de Redo Log Files no Oracle 12c - dummies

Noções básicas de Redo Log Files no Oracle 12c - dummies

Redo os arquivos de log armazenam as informações do buffer de log no banco de dados Oracle 12c. Eles são escritos pelo Log Writer (LGWR). Mais uma vez, você não pode ler esses arquivos binários sem a ajuda do software de banco de dados. Normalmente, os arquivos de reto de log são nomeados com a extensão. LOG ou. RDO. Pode ser qualquer coisa que você queira, ...

Escolha dos editores

São orgasmos ok durante a gravidez? - Dummies

São orgasmos ok durante a gravidez? - Dummies

As mulheres grávidas não só têm permissão para fazer sexo, mas muitas vezes o desejam. Mas é bom aproveitar a relação sexual com o ponto do orgasmo? Afinal, os orgasmos são nada mais do que contrações - e as pessoas sugeriram que isso poderia desencadear mão-de-obra. Isso é apenas um mito. De fato, grávida ...

Alimentando a Multidão em uma Reunião Familiar - manequins

Alimentando a Multidão em uma Reunião Familiar - manequins

Cozinhando uma refeição para um grande grupo (reunião familiar ou de outra forma ) requer planejamento e resistência. Aqui está um guia útil para quantidades de alimentos e segurança alimentar, e conselhos sobre a organização de uma festa de potluck. Planejando para potlucks A forma mais comum de comestibles de grupo é uma festa de potluck - qual é a maneira mais barata e fácil de ...

Anatomia do Penis humano - dummies

Anatomia do Penis humano - dummies

Sabendo como as funções de um pénis podem fornecer uma visão útil do sexo e do corpo humano - se você quer entender o pénis e a anatomia masculina melhor ou aprender sobre isso pela primeira vez. Basicamente, um pênis é composto de três estruturas, que são feitas de um material esponjoso que pode preencher com sangue: ...

Escolha dos editores

Como lidar com outliers causados ​​por Forças externas - manequins

Como lidar com outliers causados ​​por Forças externas - manequins

Certifique-se de verificar atentamente os outliers antes eles influenciam sua análise preditiva. Os outliers podem distorcer a análise de dados e dados. Por exemplo, qualquer análise estatística feita com dados que deixa outliers no lugar acaba por desviar os meios e variâncias. Os outliers não controlados ou mal interpretados podem levar a conclusões falsas. Diga os seus dados que ...

Como criar um modelo de análise preditiva com regressão R - manequins

Como criar um modelo de análise preditiva com regressão R - manequins

Você deseja criar um preditivo modelo de análise que você pode avaliar usando resultados conhecidos. Para fazer isso, vamos dividir nosso conjunto de dados em dois conjuntos: um para treinar o modelo e outro para testar o modelo. Uma divisão 70/30 entre treinamento e testes de conjuntos de dados será suficiente. As próximas duas linhas de código ...

Como definir objetivos de negócios para um modelo de análise preditiva - dummies

Como definir objetivos de negócios para um modelo de análise preditiva - dummies

Um modelo de análise preditiva visa resolvendo um problema comercial ou realizando um resultado comercial desejado. Esses objetivos comerciais se tornam os objetivos do modelo. Conhecer aqueles garante o valor comercial do modelo que você constrói - o que não deve ser confundido com a precisão do modelo. Hipotéticamente, você pode construir um modelo preciso para ...