Índice:
- Dados úteis na ciência dos dados centrada no negócio
- Tecnologias e habilidades úteis na ciência dos dados centrada em negócios
Vídeo: Formação de cientistas de dados no nível de pós-graduação 2024
Na empresa comercial, a ciência dos dados tem o mesmo propósito que a inteligência de negócios - converter dados brutos em informações comerciais que líderes empresariais e gerentes podem usar para tomar decisões informadas.
Se você tiver grandes conjuntos de fontes de dados estruturadas e não estruturadas que podem ou não estar completas e você deseja converter essas fontes em informações valiosas para suporte a decisões em toda a empresa, ligue para um cientista de dados. A ciência dos dados centrada no negócio é multidisciplinar e incorpora os seguintes elementos:
-
Análise quantitativa: Pode ser na forma de modelagem matemática, análise estatística multivariada, previsão e / ou simulações.
O termo multivariante refere-se a mais de uma variável. Uma análise estatística multivariada é uma análise estatística simultânea de mais de uma variável por vez.
-
Habilidades de programação: Você precisa das habilidades de programação necessárias para analisar dados brutos e tornar esses dados acessíveis a usuários empresariais.
-
Conhecimento de negócios: Você precisa de conhecimento do negócio e do seu ambiente para que você possa entender melhor a relevância de suas descobertas.
A ciência dos dados é uma disciplina pioneira. Os cientistas de dados empregam frequentemente o método científico para a exploração de dados, a formação de hipóteses e o teste de hipóteses (através de simulação e modelagem estatística). Cientistas de dados centrados no negócio geram informações valiosas sobre os dados, muitas vezes explorando padrões e anomalias nos dados comerciais. A ciência dos dados em um contexto de negócios é comumente composta de
-
Conjuntos de dados internos e externos: A ciência dos dados é flexível. Você pode criar mash-ups de dados empresariais de fontes internas e externas de dados estruturados e não estruturados com bastante facilidade. (A data mash-up é uma combinação de duas ou mais fontes de dados que são analisadas em conjunto para fornecer aos usuários uma visão mais completa da situação em questão.)
-
Ferramentas, tecnologias e habilidades: Os exemplos aqui podem envolver o uso de plataformas baseadas em nuvem, programação estatística e matemática, aprendizado de máquinas, análise de dados usando Python e R e visualização avançada de dados.
Como analistas de negócios, cientistas de dados centrados em negócios produzem produtos de suporte à decisão para os gerentes de negócios e líderes organizacionais usarem. Esses produtos incluem painéis analíticos e visualizações de dados, mas geralmente não são relatórios e tabelas de dados tabulares.
Dados úteis na ciência dos dados centrada no negócio
Você pode usar a ciência dos dados para obter informações comerciais de conjuntos de dados de negócios estruturados de tamanho padrão (como BI) ou de conjuntos estruturados, semi-estruturados e não estruturados de grandes dados.As soluções de ciência de dados não se limitam a dados transacionais que se enquadram em um banco de dados relacional; você pode usar a ciência dos dados para criar informações valiosas de todas as fontes de dados disponíveis. Estas fontes de dados incluem
-
Dados de negócios transacionais: Uma fonte de dados tentada e verdadeira, os dados comerciais transacionais são o tipo de dados estruturados utilizados no BI tradicional e incluem dados de gerenciamento, dados de serviço ao cliente, dados de vendas e marketing, dados operacionais e dados de desempenho dos funcionários.
-
Dados sociais relacionados à marca ou empresa: Um fenômeno mais recente, os dados abrangidos por esta rubrica incluem os dados não estruturados gerados através de e-mails, mensagens instantâneas e redes sociais como Twitter, Facebook, LinkedIn, Pinterest, e Instagram.
-
Dados da máquina das operações comerciais: As máquinas geram automaticamente esses dados não estruturados, como dados SCADA, dados da máquina ou dados do sensor.
O acrônimo SCADA refere-se a S upervisory C ontrol e D ata A cquisição. Os sistemas SCADA são usados para controlar sistemas e equipamentos mecânicos de operação remota. Eles geram dados que são usados para monitorar as operações de máquinas e equipamentos.
-
Dados de arquivo de áudio, vídeo, imagem e PDF: Estes formatos bem estabelecidos são todas fontes de dados não estruturados.
Tecnologias e habilidades úteis na ciência dos dados centrada em negócios
Como os produtos da ciência dos dados são geralmente gerados a partir de dados grandes, as soluções de plataforma de dados baseadas em nuvem são comuns no campo. Os dados que são usados na ciência dos dados geralmente são derivados de grandes soluções de dados, como Hadoop, MapReduce e Massively Parallel Processing.
Os cientistas de dados são inovadores, pensadores avançados que muitas vezes devem pensar fora da caixa para obter soluções para os problemas que resolvem. Muitos cientistas de dados tendem para soluções open-source quando disponíveis. Do ponto de vista dos custos, esta abordagem beneficia as organizações que empregam esses cientistas.
Os cientistas de dados centrados em negócios podem usar técnicas de aprendizado de máquina para encontrar padrões em (e derivar informações) de conjuntos de dados enormes que estão relacionados a uma linha de negócios ou ao negócio em geral. Eles são especializados em matemática, estatística e programação, e às vezes usam essas habilidades para gerar modelos preditivos.
Eles geralmente sabem como programar em Python ou R. A maioria deles sabe como usar o SQL para consultar dados relevantes de bancos de dados estruturados. Eles geralmente são especializados na comunicação de informações de dados para usuários finais - em ciência de dados centrada em negócios, os usuários finais são gerentes de negócios e líderes organizacionais. Os cientistas de dados devem ser habilidosos no uso de meios verbais, verbais e visuais para comunicar dados valiosos.
Embora os cientistas de dados centrados no negócio atinjam um papel de apoio à decisão na empresa, eles são diferentes do analista de negócios, pois geralmente possuem sólidos antecedentes acadêmicos e profissionais em matemática, ciência, engenharia ou todos os itens acima. Dito isto, os cientistas de dados centrados no negócio também têm um forte conhecimento substantivo de gerenciamento de negócios.