Vídeo: Next Generation Data Warehouse Appliance Webinar 2024
Como com jeans com base em botão, os bancos de dados assistidos por hardware estão na trilha de retorno. Microsoft, Oracle e Netezza estão furiosos em seminários de banco de dados em todo o mundo. No meio do final da década de 1980, os vendedores Britton Lee e Teradata (que eventualmente se fundiram) ficaram totalmente furiosos.
Eles forneceram máquinas dedicadas que otimizaram o processamento de banco de dados - as primeiras máquinas usadas por consumidores de dados pesados, incluindo muitas das empresas de bens embalados pelo consumidor.
O objetivo dessas caixas foi dedicar todos os aspectos de um computador para obter dados para usuários mais rápidos. Esta máquina dedicada incluiu um banco de dados centrado na consulta, memória, CPU e operações de disco. Eventualmente, esses produtos se mudaram de moda e os sistemas de gerenciamento de banco de dados foram migrados para uma arquitetura mais aberta e executada em qualquer caixa.
Agora, eles estão de volta!
A dispositivo de armazenamento de dados é um conjunto integrado de servidores, armazenamento, sistema operacional, SGBD e software especificamente pré-instalado e pré-otimizado para data warehousing. Os appliances de data warehouse fornecem soluções para o mercado de data warehouse de médio a grande volume, oferecendo desempenho de baixo custo nos volumes de dados na faixa de terabytes para petabyte (isso é um monte de dados!).
A maioria dos fornecedores de dispositivos de armazenamento de dados usam arquiteturas de processamento massivamente paralelo (MPP) para fornecer alto desempenho de consulta e escalabilidade da plataforma. As arquiteturas MPP consistem em processadores independentes ou servidores que executam em paralelo.
A maioria das arquiteturas MPP implementam uma arquitetura nada compartilhada, em que cada servidor é auto-suficiente e controla sua própria memória e disco. Shared nada arquiteturas têm um registro comprovado para escalabilidade e pouca disputa.
A maioria dos dispositivos de armazenamento de dados distribuem dados em unidades de armazenamento de disco dedicadas conectadas a cada servidor no aparelho. Esta distribuição permite aos aparelhos resolver uma consulta relacional digitalizando dados em cada servidor em paralelo. A abordagem dividir-e-conquistar oferece alto desempenho e escalas linearmente quando você adiciona novos servidores à arquitetura.
E, do ponto de vista dos preços, a maioria dos vendedores nesta arena está tentando uma estratégia de plug-and-play. Por exemplo, a Netezza normalmente vende um novo usuário como produto compatível com o Teradata por um custo de manutenção inferior ao Teradata. Este ponto de preço torna os produtos muito atraentes, dando-lhes uma taxa crescente de adoção.