Índice:
- Identificando os tipos de análise
- Identificando desafios comuns em análise
- Wrangling dados brutos para insights acionáveis
Vídeo: Developer Keynote: Get to the Fun Part (Cloud Next '19) 2024
Transformar seus dados brutos em insights acionáveis é o primeiro passo na progressão dos dados que você possui coletado para algo que realmente o beneficia. Os cientistas de dados centrados no negócio usam análise de dados para gerar informações sobre dados brutos.
Identificando os tipos de análise
Listados abaixo, em ordem de crescente complexidade, são os quatro tipos de análise de dados que você provavelmente encontrará:
-
Análise descritiva: Este tipo de análise responde à pergunta: "O que aconteceu? "A análise descritiva baseia-se em dados históricos e atuais. Um analista de negócios ou um cientista de dados centrado no negócio baseia a inteligência empresarial moderna em análises descritivas.
-
Análise de diagnóstico: Você usa esse tipo de análise para encontrar respostas para a pergunta: "por que isso aconteceu algo em particular? "Ou" o que deu errado? "A análise de diagnóstico é útil para deduzir e inferir o sucesso ou o fracasso dos subcomponentes de qualquer iniciativa baseada em dados.
-
Análise preditiva: Embora este tipo de análise se baseie em dados históricos e atuais, a análise preditiva avança um passo além da análise descritiva. Análise preditiva envolvem modelos e análises complexas para prever um futuro evento ou tendência. Em um contexto de negócios, essas análises seriam realizadas pelo cientista de dados centrado no negócio.
-
Análise prescritiva: Este tipo de análise visa otimizar processos, estruturas e sistemas através de ações informadas baseadas em análises preditivas - essencialmente dizendo o que você deve fazer com base em uma estimativa informada sobre o que acontecerá. Tanto os analistas de negócios quanto os cientistas de dados centrados em negócios podem gerar análises prescritivas, mas seus métodos e fontes de dados diferem.
Idealmente, uma empresa deve se envolver em todos os quatro tipos de análise de dados, mas a análise prescritiva é o meio mais direto e efetivo para gerar valor a partir de informações de dados.
Identificando desafios comuns em análise
Os analíticos geralmente representam pelo menos dois desafios na empresa comercial. Em primeiro lugar, as organizações muitas vezes têm dificuldade em encontrar novas contratações com conjuntos de habilidades específicas que incluem análises. Em segundo lugar, até mesmo analistas qualificados muitas vezes têm dificuldade em comunicar informações complexas de uma maneira que é compreensível para os decisores de gerenciamento.
Para superar esses desafios, a organização deve criar e nutrir uma cultura que valorize e aceite produtos analíticos. O negócio deve trabalhar para educar todos os níveis da organização, de modo que a gestão tenha um conceito básico de análise e o sucesso que pode ser alcançado implementando-os.
Por outro lado, os cientistas de dados centrados em negócios devem ter um conhecimento muito sólido sobre as empresas em geral e, em particular, uma sólida compreensão do negócio em questão. Um conhecimento empresarial forte é um dos três principais requisitos de qualquer cientista de dados centrado em negócios - os outros dois são uma forte perspicácia de codificação e fortes habilidades de análise quantitativa através de modelagem matemática e estatística.
Wrangling dados brutos para insights acionáveis
A disputa de dados é outra parte importante do trabalho que é necessário para converter dados em insights. Para criar análises a partir de dados brutos, você quase sempre precisará usar dados wrangling - os processos e procedimentos que você usa para limpar e converter dados de um formato e estrutura para outro, de modo que os dados sejam precisos e no formato, ferramentas e scripts de análise exigem para o consumo.
A lista a seguir destaca algumas das práticas e questões mais relevantes para a disputa de dados:
-
Extração de dados: O cientista de dados centrado no negócio deve primeiro identificar quais conjuntos de dados são relevantes para o problema em questão e, em seguida, extraia quantidades suficientes dos dados necessários para resolver o problema. (Esse processo de extração é comumente referido como mineração de dados.)
-
Dados munging: Dados munging envolve a limpeza dos dados brutos extraídos através da mineração de dados e, em seguida, convertê-lo em um formato que permite um consumo mais conveniente dos dados. (Mung começou a vida como um processo destrutivo, onde você converteria algo reconhecível em algo que era irreconhecível, portanto, a frase Mash Until No Good, ou MUNG.)
-
Governança de dados: Os padrões de governança de dados são padrões que são usados como uma medida de controle de qualidade para garantir que as fontes de dados manuais e automáticas estejam de acordo com os padrões de dados do modelo em mãos. Os padrões de governança de dados devem ser aplicados para que os dados estejam na granularidade certa quando armazenados e preparados para uso.
Granularidade é uma medida do nível de detalhe de um conjunto de dados. A granularidade de dados é determinada pelo tamanho relativo dos subgrupos em que os dados são divididos.
-
Arquitetura de dados: A arquitetura de TI é a chave. Se os seus dados estiverem isolados em depósitos fixos separados - esses infames silos de dados todos reclamam - então está disponível para apenas algumas pessoas dentro de uma determinada linha de negócios. As estruturas de dados suficidas resultam em cenários em que a maioria dos dados de uma organização simplesmente não está disponível para uso pela organização em geral. (Escusado será dizer que as estruturas de dados manchadas são incrivelmente inúteis e ineficientes.)
Se o seu objetivo é obter o maior valor e visão dos dados comerciais da sua organização, você deve garantir que os dados sejam armazenados em um data warehouse central e não em silos separados.