Lar Finanças Pessoais Princípios básicos de Processos de Classificação de Dados Prediciáticos - manequins

Princípios básicos de Processos de Classificação de Dados Prediciáticos - manequins

Vídeo: Português - Aula 02 - Formação de Palavras 2024

Vídeo: Português - Aula 02 - Formação de Palavras 2024
Anonim

A nível de tachas de bronze, a classificação de dados analíticos preditivos consiste em duas etapas: o estágio de aprendizagem e o estágio de previsão.. O estágio de aprendizado implica a formação do modelo de classificação executando um conjunto designado de dados passados ​​através do classificador. O objetivo é ensinar seu modelo a extrair e descobrir relações e regras ocultas - as regras de classificação de dados históricos (treinamento). O modelo faz isso empregando um algoritmo de classificação.

O estágio de previsão que segue o estágio de aprendizagem consiste em ter o modelo de prever novos rótulos de classe ou valores numéricos que classificam dados que não viu antes (ou seja, dados de teste).

Para ilustrar estas etapas, suponha que você seja o proprietário de uma loja online que vende relógios. Você possuiu a loja online há bastante tempo e reuniu muitos dados transacionais e dados pessoais sobre clientes que compraram relógios da sua loja. Suponha que você tenha capturado esses dados através do seu site fornecendo formulários da Web, além dos dados transacionais que você reuniu através das operações.

Você também pode comprar dados de um terceiro que fornece informações sobre seus clientes fora do interesse em relógios. Isso não é tão difícil quanto parece; existem empresas cujo modelo de negócios é acompanhar os clientes on-line e coletar e vender informações valiosas sobre eles.

A maioria dessas empresas terceirizadas coletam dados de sites de redes sociais e aplicam métodos de mineração de dados para descobrir o relacionamento de usuários individuais com produtos. Neste caso, como proprietário de uma loja de relógios, você estaria interessado na relação entre os clientes e seu interesse em comprar relógios.

Você pode inferir esse tipo de informação de analisar, por exemplo, um perfil de rede social de um cliente ou um comentário de microblog do tipo que você encontra no Twitter.

Para medir o nível de interesse de um indivíduo em relógios, você pode aplicar qualquer uma das várias ferramentas de análise de texto que podem descobrir tais correlações no texto escrito de um indivíduo (status de rede social, tweets, postagens de blog e tal) ou atividade on-line (tais como interações sociais on-line, upload de fotos e pesquisas).

Depois de coletar todos esses dados sobre as transações passadas e os interesses atuais de seus clientes - dados de treinamento que mostram o modelo do que procurar - você precisará organizá-lo em uma estrutura que o torne fácil de acessar e usar (como um banco de dados).

Neste ponto, você atingiu a segunda fase de classificação de dados: o estágio de previsão,, que trata de testar seu modelo e a precisão das regras de classificação que gerou. Para isso, você precisará de dados históricos adicionais do cliente, referidos como dados de teste (que é diferente dos dados de treinamento).

Você alimenta esses dados de teste em seu modelo e mede a precisão das previsões resultantes. Você conta os tempos em que o modelo previu corretamente o comportamento futuro dos clientes representados nos dados do teste. Você também conta os tempos em que o modelo fez previsões erradas.

Neste ponto, você tem apenas dois possíveis resultados: Você está satisfeito com a precisão do modelo ou não está:

  • Se estiver satisfeito, então você pode começar a preparar seu modelo para fazer previsões como parte de um sistema de produção.

  • Se você não está feliz com a previsão, então você precisará treinar seu modelo com um novo conjunto de dados de treinamento.

Se seus dados de treinamento originais não fossem representativos o suficiente do grupo de seus clientes - ou continham dados ruidosos que derrubaram os resultados do modelo através da introdução de sinais falsos - então há mais trabalho a fazer para que o seu modelo esteja funcionando. Qualquer resultado é útil no seu caminho.

Princípios básicos de Processos de Classificação de Dados Prediciáticos - manequins

Escolha dos editores

Origem e Design de Hadoop - dummies

Origem e Design de Hadoop - dummies

Então, o que é exatamente isso com o nome engraçado - Hadoop? No seu núcleo, o Hadoop é uma estrutura para armazenar dados em grandes clusters de hardware de commodities - hardware de computador todos os dias acessível e facilmente disponível - e executando aplicativos contra esses dados. Um cluster é um grupo de computadores interligados (conhecido como ...

A arquitetura do porco em Hadoop - dummies

A arquitetura do porco em Hadoop - dummies

"Simples" geralmente significa "elegante" quando se trata de desenhos arquitetônicos para Essa nova mansão do Vale do Silício que você planejou quando o dinheiro começa a rolar depois de implementar o Hadoop. O mesmo princípio se aplica à arquitetura de software. O porco é composto por dois componentes (count 'em, two): O próprio idioma: como prova de que os programadores ...

MapReduce Application Flow em Hadoop - dummies

MapReduce Application Flow em Hadoop - dummies

No seu núcleo, MapReduce é um modelo de programação para o processamento de conjuntos de dados que são armazenados de forma distribuída nos nós de escravo de um cluster Hadoop. O conceito-chave aqui é dividir e conquistar. Especificamente, você deseja quebrar um grande conjunto de dados em muitas peças menores e processá-las em paralelo com o mesmo algoritmo. ...

Escolha dos editores

Apoiando a sua campanha PPC com análise de palavras-chave - manequins

Apoiando a sua campanha PPC com análise de palavras-chave - manequins

A base de todo o trabalho do mecanismo de pesquisa é uma análise de palavras-chave. Fazer uma análise de palavras-chave realmente não é tão complicado e pode significar a diferença entre sucesso e falha em sua campanha PPC. Comece digitando as palavras-chave óbvias em um editor de texto ou processador de texto - aqueles que você já pensou ou, se você ...

Envie seu site para Yahoo! Search Directory - dummies

Envie seu site para Yahoo! Search Directory - dummies

Envios para o Yahoo! O diretório costumava ser muito difícil. Pesquisas mostraram que as pessoas que conseguiram obter seus sites listados no diretório tiveram que tentar várias vezes em questão de meses. Era grátis, mas era um aborrecimento. A boa notícia: você pode obter seu site listado em Yahoo! Diretório ...

Dicas para criar e otimizar conteúdo para objetos e indústrias difíceis - manequins

Dicas para criar e otimizar conteúdo para objetos e indústrias difíceis - manequins

Em A superfície, a criação de conteúdo não soa tão difícil até você se sentar e tentar escrever. Sua estratégia de SEO depende desse conteúdo. É ainda pior se você estiver escrevendo conteúdo para o que muitas pessoas podem considerar uma indústria chata. A boa notícia é que é possível transformar indivíduos potencialmente chatos em bons ...

Escolha dos editores

Componentes eletrônicos: transistores como um potenciômetro mágico - manequins

Componentes eletrônicos: transistores como um potenciômetro mágico - manequins

Um transistor dentro de um O circuito eletrônico funciona como uma combinação de um diodo e um resistor variável, também chamado de potenciômetro ou pote. Mas isso não é apenas um pote comum; é um pote mágico cujo botão é misteriosamente conectado ao diodo por raios invisíveis, tipo desse tipo: quando a tensão direta é aplicada em ...

Componentes eletrônicos: Resistores - manequins

Componentes eletrônicos: Resistores - manequins

Um resistor é um pequeno componente projetado para fornecer um específico quantidade de resistência em um circuito eletrônico. Como a resistência é um elemento essencial de quase todos os circuitos eletrônicos, você usará resistores em quase todos os circuitos que você constrói. Embora os resistores venham em uma variedade de tamanhos e formas, o tipo mais comum ...