Índice:
- O que é um arquivo de extrato?
- Por que os arquivos de extrato não são considerados armazéns de dados?
Vídeo: Tipos de Empresas | Papo Express 2024
Sua organização tem chances extremamente favoráveis de ter pelo menos um tipo de data warehouse - um sistema de relatórios que fornece recursos informativos e, às vezes, recursos analíticos para um ou mais grupos de usuários.
O que é um arquivo de extrato?
Seus usuários provavelmente usam o termo extrair o arquivo para descrever este tipo de ambiente porque é preenchido por extratos de dados de sistemas de produção, em vez de serem obrigados a executar suas consultas ou receber seus relatórios a partir do bases de dados ou arquivos de produção operacional. Ainda interessado em jogar as chances? Aqui estão mais alguns exemplos de tipos de ambientes de dados que podem ser descritos como tipos de data warehouses:
-
Embora os dados extraídos estejam quase sempre alojados em um único arquivo ou banco de dados, um processo de mesclagem provavelmente combina dados extraídos de mais de uma fonte de aplicativo.
-
Somente os elementos selecionados, nem todos os elementos de todas as tabelas ou arquivos, de cada fonte de dados, geralmente são extraídos e copiados para o arquivo de extrato.
-
Algum tipo de processo de garantia de qualidade de dados geralmente está acontecendo em cada etapa do caminho, desde o extracto inicial até o carregamento dos dados no arquivo de extrato.
-
Alguns usuários avançados provavelmente podem executar consultas ou criar programas estatísticos (em SAS ou SPSS, por exemplo) contra os dados, mas muitos usuários não são susceptíveis de tocar os dados diretamente. Em vez disso, eles provavelmente recebem regularmente relatórios gerados automaticamente ou em resposta a seus pedidos.
Sure parece um data warehouse, não é? A realidade é que esses tipos de data warehouses normalmente servem uma população muito pequena e não são feitos de forma padrão para suportar as necessidades mais amplas da empresa. Você também pode chamar wanna-be data warehouses.
Aqui está a dicotomia da maioria das organizações acesso aos dados:
-
Análise de dados "não tem": Organizações e indivíduos que têm poucas (e mais prováveis não) capacidades para fazer o tipo de análise que pode provocar a tomada de decisão baseada na informação
-
Análise de dados "haves": Organizações e indivíduos que podem não ter um data warehouse instalado e funcionando, mas estão fazendo algo com os dados de que estão recebendo algum lugar. Em muitos casos, é adequado às suas necessidades comerciais.
Por que os arquivos de extrato não são considerados armazéns de dados?
Eles são, tipo de. Os arquivos de extrato, seja nos anos 1970, 1980, 1990 ou ainda em uso hoje, existem pelos mesmos motivos básicos que um armazenamento de dados de pleno direito ou um data mart faz: fornecer entrega de informações, apesar de uma variedade de barreiras, como dura - para entender as estruturas de dados, "não tocar nas regras do sistema de produção" e a falta de referência cruzada multi-arquivo ou multi-banco de dados.
Alguns proponentes de armazenagem de dados argumentam que combinar e reconfigurar dados simplesmente com a finalidade de gerar relatórios ou realizar análises estatísticas dificilmente é um data warehouse no sentido moderno do termo. Os arquivos de extratos não estão equipados com recursos de análise multidimensional ou de negócios, tais como detalhamento e giro de dados.
Se você separar o lado do data-warehouse (o que é necessário para reunir, mover e reconfigurar dados de uma ou mais fontes) do lado do business-intelligence (o que você faz com os dados depois de tê-lo disponível), o A imagem se torna muito mais clara.
Extrair arquivos, ou o que quer que você queira chamá-los, faz parte da filosofia de bloqueio de um data warehouse. Muitos dos que os usuários se referem como "arquivos extraídos" são sistemas baseados em arquivos (em vez de construídos em bancos de dados), e eles provavelmente não são flexíveis o suficiente para suportar consultas ad hoc e análise dimensional. No sentido real, no entanto, esses ambientes servem para o propósito de armazenar dados para uso posterior.
Para muitos usuários, os recursos de análise de negócios, como o detalhamento e o pivô de dados, têm pouco ou nenhum uso, pelo menos, não no contexto de suas definições de trabalho atuais. Os trabalhos dos usuários exigem a funcionalidade que esses arquivos de extratos podem oferecer, bem como os relatórios estáticos e análises estatísticas realizadas com esses dados.
A moral da história: Não entre em uma organização que efetivamente usa dados através de arquivos de extrato e exponha as maravilhas do armazenamento de dados. Em vez disso, tenha cuidado ao propor qualquer solução de data warehousing que possa ser vista como um passo para trás. Se você fizer esse tipo de proposição, você está em uma viagem longa e acidentada.