Índice:
- Ciência dos dados e a engenharia de dados não é a mesma
- Ciência de dados e inteligência de negócios também não são os mesmos
Vídeo: MINHA OPINIÃO: Qual a melhor linguagem para começar a programar? 2024
Parte da Ciência dos Dados para Dummies Cheat Sheet
Tradicionalmente, dados grandes é o termo para dados que tem volume incrível, velocidade e variedade. As tecnologias de banco de dados tradicionais não são capazes de lidar com grandes dados - são necessárias soluções inovadoras de engenharia de dados. Para avaliar o seu projeto se ele se qualifica como um grande projeto de dados, considere os seguintes critérios:
-
Volume: Entre 1 terabytes / ano e 10 petabytes / ano
-
Velocidade: Entre 30 kilobytes / segundo e 30 gigabytes / segundo
-
Variedade: Fontes combinadas de dados não estruturados, semi-estruturados e estruturados
Ciência dos dados e a engenharia de dados não é a mesma
Os gerentes de contratação tendem a confundir as funções de cientista de dados e engenheiro de dados. Embora seja possível encontrar alguém que faça um pouco de ambos, cada campo é incrivelmente complexo. É improvável que você encontre alguém com habilidades e experiência robustas em ambas as áreas. Por esse motivo, é importante identificar o tipo de especialista mais apropriado para ajudá-lo a alcançar seus objetivos específicos. As descrições abaixo devem ajudá-lo a fazer isso.
-
Cientistas de dados: Os cientistas de dados usam codificação, métodos quantitativos (matemática, estatística e máquina de aprendizagem) e conhecimentos altamente especializados em sua área de estudo para obter soluções para problemas comerciais e científicos complexos.
-
Engenheiros de dados: Os engenheiros de dados usam habilidades em ciência da computação e engenharia de software para projetar sistemas e resolver problemas com, manipular e manipular grandes conjuntos de dados.
Ciência de dados e inteligência de negócios também não são os mesmos
Cientistas de dados centrados em negócios e analistas de negócios que fazem inteligência de negócios são como primos. Ambos os tipos de dados de uso especializado para alcançar os mesmos objetivos de negócios, mas suas abordagens, tecnologias e funções são diferentes. As descrições abaixo explicam as diferenças entre as duas funções.
-
Business intelligence (BI): As soluções de BI geralmente são construídas usando conjuntos de dados gerados internamente - de uma organização e não de fora, em outras palavras. Ferramentas e tecnologias comuns incluem processamento analítico on-line, transformação e carga de extratos e data warehousing. Embora o BI às vezes envolva métodos orientados para o futuro, como a previsão, esses métodos são baseados em inferências matemáticas simples de dados históricos ou atuais.
-
Ciência de dados centrada em negócios: As soluções de ciência de dados centradas em negócios são construídas usando conjuntos de dados que são internos e externos a uma organização. Ferramentas, tecnologias e habilidades comuns incluem plataformas de análise baseadas em nuvem, programação estatística e matemática, aprendizado de máquinas, análise de dados usando Python e R e visualização avançada de dados. Cientistas de dados centrados no negócio usam métodos matemáticos ou estatísticos avançados para analisar e gerar previsões a partir de grandes quantidades de dados empresariais.