Lar Finanças Pessoais Implementando Analytics e Data Wrangling para converter dados brutos em Perspectivas acionáveis ​​- dummies

Implementando Analytics e Data Wrangling para converter dados brutos em Perspectivas acionáveis ​​- dummies

Índice:

Vídeo: Developer Keynote: Get to the Fun Part (Cloud Next '19) 2024

Vídeo: Developer Keynote: Get to the Fun Part (Cloud Next '19) 2024
Anonim

Transformar seus dados brutos em insights acionáveis ​​é o primeiro passo na progressão dos dados que você possui coletado para algo que realmente o beneficia. Os cientistas de dados centrados no negócio usam análise de dados para gerar informações sobre dados brutos.

Identificando os tipos de análise

Listados abaixo, em ordem de crescente complexidade, são os quatro tipos de análise de dados que você provavelmente encontrará:

  • Análise descritiva: Este tipo de análise responde à pergunta: "O que aconteceu? "A análise descritiva baseia-se em dados históricos e atuais. Um analista de negócios ou um cientista de dados centrado no negócio baseia a inteligência empresarial moderna em análises descritivas.

  • Análise de diagnóstico: Você usa esse tipo de análise para encontrar respostas para a pergunta: "por que isso aconteceu algo em particular? "Ou" o que deu errado? "A análise de diagnóstico é útil para deduzir e inferir o sucesso ou o fracasso dos subcomponentes de qualquer iniciativa baseada em dados.

  • Análise preditiva: Embora este tipo de análise se baseie em dados históricos e atuais, a análise preditiva avança um passo além da análise descritiva. Análise preditiva envolvem modelos e análises complexas para prever um futuro evento ou tendência. Em um contexto de negócios, essas análises seriam realizadas pelo cientista de dados centrado no negócio.

  • Análise prescritiva: Este tipo de análise visa otimizar processos, estruturas e sistemas através de ações informadas baseadas em análises preditivas - essencialmente dizendo o que você deve fazer com base em uma estimativa informada sobre o que acontecerá. Tanto os analistas de negócios quanto os cientistas de dados centrados em negócios podem gerar análises prescritivas, mas seus métodos e fontes de dados diferem.

Idealmente, uma empresa deve se envolver em todos os quatro tipos de análise de dados, mas a análise prescritiva é o meio mais direto e efetivo para gerar valor a partir de informações de dados.

Identificando desafios comuns em análise

Os analíticos geralmente representam pelo menos dois desafios na empresa comercial. Em primeiro lugar, as organizações muitas vezes têm dificuldade em encontrar novas contratações com conjuntos de habilidades específicas que incluem análises. Em segundo lugar, até mesmo analistas qualificados muitas vezes têm dificuldade em comunicar informações complexas de uma maneira que é compreensível para os decisores de gerenciamento.

Para superar esses desafios, a organização deve criar e nutrir uma cultura que valorize e aceite produtos analíticos. O negócio deve trabalhar para educar todos os níveis da organização, de modo que a gestão tenha um conceito básico de análise e o sucesso que pode ser alcançado implementando-os.

Por outro lado, os cientistas de dados centrados em negócios devem ter um conhecimento muito sólido sobre as empresas em geral e, em particular, uma sólida compreensão do negócio em questão. Um conhecimento empresarial forte é um dos três principais requisitos de qualquer cientista de dados centrado em negócios - os outros dois são uma forte perspicácia de codificação e fortes habilidades de análise quantitativa através de modelagem matemática e estatística.

Wrangling dados brutos para insights acionáveis ​​

A disputa de dados é outra parte importante do trabalho que é necessário para converter dados em insights. Para criar análises a partir de dados brutos, você quase sempre precisará usar dados wrangling - os processos e procedimentos que você usa para limpar e converter dados de um formato e estrutura para outro, de modo que os dados sejam precisos e no formato, ferramentas e scripts de análise exigem para o consumo.

A lista a seguir destaca algumas das práticas e questões mais relevantes para a disputa de dados:

  • Extração de dados: O cientista de dados centrado no negócio deve primeiro identificar quais conjuntos de dados são relevantes para o problema em questão e, em seguida, extraia quantidades suficientes dos dados necessários para resolver o problema. (Esse processo de extração é comumente referido como mineração de dados.)

  • Dados munging: Dados munging envolve a limpeza dos dados brutos extraídos através da mineração de dados e, em seguida, convertê-lo em um formato que permite um consumo mais conveniente dos dados. (Mung começou a vida como um processo destrutivo, onde você converteria algo reconhecível em algo que era irreconhecível, portanto, a frase Mash Until No Good, ou MUNG.)

  • Governança de dados: Os padrões de governança de dados são padrões que são usados como uma medida de controle de qualidade para garantir que as fontes de dados manuais e automáticas estejam de acordo com os padrões de dados do modelo em mãos. Os padrões de governança de dados devem ser aplicados para que os dados estejam na granularidade certa quando armazenados e preparados para uso.

    Granularidade é uma medida do nível de detalhe de um conjunto de dados. A granularidade de dados é determinada pelo tamanho relativo dos subgrupos em que os dados são divididos.

  • Arquitetura de dados: A arquitetura de TI é a chave. Se os seus dados estiverem isolados em depósitos fixos separados - esses infames silos de dados todos reclamam - então está disponível para apenas algumas pessoas dentro de uma determinada linha de negócios. As estruturas de dados suficidas resultam em cenários em que a maioria dos dados de uma organização simplesmente não está disponível para uso pela organização em geral. (Escusado será dizer que as estruturas de dados manchadas são incrivelmente inúteis e ineficientes.)

Se o seu objetivo é obter o maior valor e visão dos dados comerciais da sua organização, você deve garantir que os dados sejam armazenados em um data warehouse central e não em silos separados.

Implementando Analytics e Data Wrangling para converter dados brutos em Perspectivas acionáveis ​​- dummies

Escolha dos editores

Origem e Design de Hadoop - dummies

Origem e Design de Hadoop - dummies

Então, o que é exatamente isso com o nome engraçado - Hadoop? No seu núcleo, o Hadoop é uma estrutura para armazenar dados em grandes clusters de hardware de commodities - hardware de computador todos os dias acessível e facilmente disponível - e executando aplicativos contra esses dados. Um cluster é um grupo de computadores interligados (conhecido como ...

A arquitetura do porco em Hadoop - dummies

A arquitetura do porco em Hadoop - dummies

"Simples" geralmente significa "elegante" quando se trata de desenhos arquitetônicos para Essa nova mansão do Vale do Silício que você planejou quando o dinheiro começa a rolar depois de implementar o Hadoop. O mesmo princípio se aplica à arquitetura de software. O porco é composto por dois componentes (count 'em, two): O próprio idioma: como prova de que os programadores ...

MapReduce Application Flow em Hadoop - dummies

MapReduce Application Flow em Hadoop - dummies

No seu núcleo, MapReduce é um modelo de programação para o processamento de conjuntos de dados que são armazenados de forma distribuída nos nós de escravo de um cluster Hadoop. O conceito-chave aqui é dividir e conquistar. Especificamente, você deseja quebrar um grande conjunto de dados em muitas peças menores e processá-las em paralelo com o mesmo algoritmo. ...

Escolha dos editores

Apoiando a sua campanha PPC com análise de palavras-chave - manequins

Apoiando a sua campanha PPC com análise de palavras-chave - manequins

A base de todo o trabalho do mecanismo de pesquisa é uma análise de palavras-chave. Fazer uma análise de palavras-chave realmente não é tão complicado e pode significar a diferença entre sucesso e falha em sua campanha PPC. Comece digitando as palavras-chave óbvias em um editor de texto ou processador de texto - aqueles que você já pensou ou, se você ...

Envie seu site para Yahoo! Search Directory - dummies

Envie seu site para Yahoo! Search Directory - dummies

Envios para o Yahoo! O diretório costumava ser muito difícil. Pesquisas mostraram que as pessoas que conseguiram obter seus sites listados no diretório tiveram que tentar várias vezes em questão de meses. Era grátis, mas era um aborrecimento. A boa notícia: você pode obter seu site listado em Yahoo! Diretório ...

Dicas para criar e otimizar conteúdo para objetos e indústrias difíceis - manequins

Dicas para criar e otimizar conteúdo para objetos e indústrias difíceis - manequins

Em A superfície, a criação de conteúdo não soa tão difícil até você se sentar e tentar escrever. Sua estratégia de SEO depende desse conteúdo. É ainda pior se você estiver escrevendo conteúdo para o que muitas pessoas podem considerar uma indústria chata. A boa notícia é que é possível transformar indivíduos potencialmente chatos em bons ...

Escolha dos editores

Componentes eletrônicos: transistores como um potenciômetro mágico - manequins

Componentes eletrônicos: transistores como um potenciômetro mágico - manequins

Um transistor dentro de um O circuito eletrônico funciona como uma combinação de um diodo e um resistor variável, também chamado de potenciômetro ou pote. Mas isso não é apenas um pote comum; é um pote mágico cujo botão é misteriosamente conectado ao diodo por raios invisíveis, tipo desse tipo: quando a tensão direta é aplicada em ...

Componentes eletrônicos: Resistores - manequins

Componentes eletrônicos: Resistores - manequins

Um resistor é um pequeno componente projetado para fornecer um específico quantidade de resistência em um circuito eletrônico. Como a resistência é um elemento essencial de quase todos os circuitos eletrônicos, você usará resistores em quase todos os circuitos que você constrói. Embora os resistores venham em uma variedade de tamanhos e formas, o tipo mais comum ...