Lar Finanças Pessoais Como explicar os resultados de um modelo de análise preditiva de classificação R - dummies

Como explicar os resultados de um modelo de análise preditiva de classificação R - dummies

Vídeo: Machine Learning (Aula 7) - Modelos de Predição 2024

Vídeo: Machine Learning (Aula 7) - Modelos de Predição 2024
Anonim

Outra tarefa em análises preditivas é classificar novos dados ao prever a qual classe pertence um item alvo, dado um conjunto de variáveis ​​independentes. Você pode, por exemplo, classificar um cliente por tipo - digamos, como um cliente de alto valor, um cliente regular ou um cliente pronto para mudar para um concorrente - usando uma árvore de decisão.

Para ver algumas informações úteis sobre o modelo R Classification, digite o seguinte código:

>> resumo (modelo) Modo de classe de comprimento 1 BinaryTree S4
A coluna Classe informa que você criou uma árvore de decisão. Para ver como as divisões estão sendo determinadas, você pode simplesmente digitar o nome da variável na qual você atribuiu o modelo, neste modelo de caso, como este: >> modelo Árvore de inferência condicional com 6 nós de terminal Resposta: entradas de tipo seedType: área, perímetro, compacidade, comprimento, largura, assimetria, comprimento2 Número de observações: 147 1) área <= 16. 2; critério = 1, estatística = 123. 423 2) área <= 13. 37; critério = 1, estatística = 63. 549 3) comprimento2 4. 914 5) * pesos = 45 2) área> 13. 37 6) comprimento2 5. 396 8) * pesos = 8 1) área> 16. 2 9) comprimento2 5. 877 11) * weights = 40

Ainda melhor, você pode visualizar o modelo criando um gráfico da árvore de decisão com este código:> plot (model)


Esta é uma representação gráfica de uma árvore de decisão. Você pode ver que a forma geral imita a de uma árvore real. É feito de

nós

(círculos e retângulos) e links ou bordas (as linhas de conexão). O primeiro nó (começando na parte superior) é chamado de nó de raiz

e os nós na parte inferior da árvore (retângulos) são chamados nós terminais . Existem cinco nós de decisão e seis nós terminais.

Em cada nó, o modelo toma uma decisão com base nos critérios do círculo e nos links, e escolhe um caminho a seguir. Quando o modelo atinge um nó terminal, é alcançado um veredicto ou uma decisão final. Neste caso particular, dois atributos, o e o, são usados ​​para decidir se um determinado tipo de semente está na classe 1, 2 ou 3.

Por exemplo, tome a observação # 2 do conjunto de dados. Tem um de 4. 956 e um de 14. 88. Você pode usar a árvore que você acabou de construir para decidir qual tipo de semente particular a que essa observação pertence. Aqui está a seqüência de etapas:

Comece no nó raiz, que é o nó 1 (o número é mostrado no pequeno quadrado na parte superior do círculo). Decida com base no atributo: A observação # 2 é menor ou igual a (denotada por <=) 16.2? a resposta é sim, então, avance ao longo do caminho para o nó 2.

No nó 2, o modelo pergunta: a área é 13. 37? A resposta é sim, então, avance ao longo do caminho para o nó 6. Neste nó, o modelo pergunta: O comprimento2 <= 5. 396? é, e você se move para o nó terminal 7 e o veredicto é que a observação # 2 é de tipo semente 1. E é, de fato, tipo de semente 1.

  1. O modelo faz esse processo para todas as outras observações para prever seus aulas.

  2. Para descobrir se você treinou um bom modelo, confira os dados de treinamento. Você pode visualizar os resultados em uma tabela com o seguinte código: >> tabela (prever (modelo), trainSet $ ​​seedType) 1 2 3 1 45 4 3 2 3 47 0 3 1 0 44

    Os resultados mostram que o erro (ou taxa de classificação errada) é 11 de 147, ou 7. 48 por cento.

  3. Com os resultados calculados, o próximo passo é ler a tabela.

    As previsões corretas são as que mostram os números de coluna e linha como o mesmo. Esses resultados aparecem como uma linha diagonal da parte superior esquerda para a parte inferior direita; por exemplo, [1, 1], [2, 2], [3, 3] são o número de previsões corretas para essa classe.
    

    Assim, para semente tipo 1, o modelo previu corretamente 45 vezes, enquanto classificamos incorretamente a semente 7 vezes (4 vezes como semente tipo 2 e 3 vezes como tipo 3). Para o tipo de semente 2, o modelo previu corretamente 47 vezes, enquanto a classificação incorreta 3 vezes. Para a semente de tipo 3, o modelo previu corretamente 44 vezes, enquanto a classificação errada apenas uma vez.

  4. Isso mostra que este é um bom modelo. Então, você o avalia com os dados do teste. Aqui está o código que usa os dados do teste para prever e armazená-lo em uma variável (testPrediction) para uso posterior: >> testPrediction <- prever (modelo, newdata = testSet)

    Para avaliar como o modelo foi executado com o testar dados, visualizá-lo em uma tabela e calcular o erro, para o qual o código se parece com isto: >> table (testPrediction, testSet $ ​​seedType) testPrediction 1 2 3 1 23 2 1 2 1 19 0 3 1 0 17

Como explicar os resultados de um modelo de análise preditiva de classificação R - dummies

Escolha dos editores

Origem e Design de Hadoop - dummies

Origem e Design de Hadoop - dummies

Então, o que é exatamente isso com o nome engraçado - Hadoop? No seu núcleo, o Hadoop é uma estrutura para armazenar dados em grandes clusters de hardware de commodities - hardware de computador todos os dias acessível e facilmente disponível - e executando aplicativos contra esses dados. Um cluster é um grupo de computadores interligados (conhecido como ...

A arquitetura do porco em Hadoop - dummies

A arquitetura do porco em Hadoop - dummies

"Simples" geralmente significa "elegante" quando se trata de desenhos arquitetônicos para Essa nova mansão do Vale do Silício que você planejou quando o dinheiro começa a rolar depois de implementar o Hadoop. O mesmo princípio se aplica à arquitetura de software. O porco é composto por dois componentes (count 'em, two): O próprio idioma: como prova de que os programadores ...

MapReduce Application Flow em Hadoop - dummies

MapReduce Application Flow em Hadoop - dummies

No seu núcleo, MapReduce é um modelo de programação para o processamento de conjuntos de dados que são armazenados de forma distribuída nos nós de escravo de um cluster Hadoop. O conceito-chave aqui é dividir e conquistar. Especificamente, você deseja quebrar um grande conjunto de dados em muitas peças menores e processá-las em paralelo com o mesmo algoritmo. ...

Escolha dos editores

Apoiando a sua campanha PPC com análise de palavras-chave - manequins

Apoiando a sua campanha PPC com análise de palavras-chave - manequins

A base de todo o trabalho do mecanismo de pesquisa é uma análise de palavras-chave. Fazer uma análise de palavras-chave realmente não é tão complicado e pode significar a diferença entre sucesso e falha em sua campanha PPC. Comece digitando as palavras-chave óbvias em um editor de texto ou processador de texto - aqueles que você já pensou ou, se você ...

Envie seu site para Yahoo! Search Directory - dummies

Envie seu site para Yahoo! Search Directory - dummies

Envios para o Yahoo! O diretório costumava ser muito difícil. Pesquisas mostraram que as pessoas que conseguiram obter seus sites listados no diretório tiveram que tentar várias vezes em questão de meses. Era grátis, mas era um aborrecimento. A boa notícia: você pode obter seu site listado em Yahoo! Diretório ...

Dicas para criar e otimizar conteúdo para objetos e indústrias difíceis - manequins

Dicas para criar e otimizar conteúdo para objetos e indústrias difíceis - manequins

Em A superfície, a criação de conteúdo não soa tão difícil até você se sentar e tentar escrever. Sua estratégia de SEO depende desse conteúdo. É ainda pior se você estiver escrevendo conteúdo para o que muitas pessoas podem considerar uma indústria chata. A boa notícia é que é possível transformar indivíduos potencialmente chatos em bons ...

Escolha dos editores

Componentes eletrônicos: transistores como um potenciômetro mágico - manequins

Componentes eletrônicos: transistores como um potenciômetro mágico - manequins

Um transistor dentro de um O circuito eletrônico funciona como uma combinação de um diodo e um resistor variável, também chamado de potenciômetro ou pote. Mas isso não é apenas um pote comum; é um pote mágico cujo botão é misteriosamente conectado ao diodo por raios invisíveis, tipo desse tipo: quando a tensão direta é aplicada em ...

Componentes eletrônicos: Resistores - manequins

Componentes eletrônicos: Resistores - manequins

Um resistor é um pequeno componente projetado para fornecer um específico quantidade de resistência em um circuito eletrônico. Como a resistência é um elemento essencial de quase todos os circuitos eletrônicos, você usará resistores em quase todos os circuitos que você constrói. Embora os resistores venham em uma variedade de tamanhos e formas, o tipo mais comum ...