Lar Finanças Pessoais Como usar o modelo de Markov em Analytics Predictive - dummies

Como usar o modelo de Markov em Analytics Predictive - dummies

Vídeo: Data Fundamentals - MSc in Data Science 2024

Vídeo: Data Fundamentals - MSc in Data Science 2024
Anonim

O Modelo Markov é um modelo estatístico que pode ser usado em análises preditivas que dependem fortemente da teoria da probabilidade. (É o nome de um matemático russo cuja principal pesquisa foi na teoria da probabilidade.)

Aqui está um cenário prático que ilustra como funciona: Imagine que você quer prever se o Team X ganhará o jogo de amanhã. A primeira coisa a fazer é coletar estatísticas anteriores sobre o Team X. A questão que pode surgir é o quão longe você deve ir no histórico?

Suponhamos que você conseguiu alcançar os últimos 10 resultados do jogo passado em sequência. Você quer saber a probabilidade de o time X vencer o próximo jogo, dado os resultados dos últimos 10 jogos.

O problema é que, quanto mais atrasado no histórico você quer ir, mais difícil e mais complexo será o cálculo da coleta de dados e da probabilidade.

Acredite ou não, o modelo de Markov simplifica a sua vida, fornecendo-lhe a Assinatura de Markov, , que se parece com isso quando você escreve em palavras:

A probabilidade de um evento acontecer, dado n eventos passados, é aproximadamente igual à probabilidade de que tal evento aconteça apenas no último evento passado.

Escrito como uma fórmula, a Assunção de Markov parece assim:

De qualquer forma, a Assunção de Markov significa que você não precisa ir muito longe no histórico para prever o resultado de amanhã. Você pode usar o evento anterior mais recente. Isso é chamado de previsão de Markov de primeira ordem porque você está considerando apenas o último evento para prever o evento futuro.

A segunda previsão de Markov inclui apenas os dois últimos eventos que acontecem em sequência. A partir da equação dada, a seguinte equação amplamente utilizada também pode ser derivada:

Esta equação visa calcular a probabilidade de que alguns eventos aconteçam em sequência: evento evento 1 após 2 , e assim por diante. Essa probabilidade pode ser calculada multiplicando a probabilidade de cada evento t (dado o evento anterior a ele) pelo próximo evento na seqüência. Por exemplo, suponha que você preveja a probabilidade de o Team X ganhar, depois perde e, em seguida, os laços.

Veja como funcionaria um modelo preditivo típico baseado em um modelo de Markov. Considere o mesmo exemplo: suponha que você queira prever os resultados de um jogo de futebol a ser jogado pelo Team X. Os três resultados possíveis - chamados estados - são vitória, perda ou empate.

Suponha que você tenha coletado dados estatísticos anteriores sobre os resultados dos jogos de futebol da equipe X e que o time X perdeu seu jogo mais recente. Você quer prever o resultado do próximo jogo de futebol. É tudo sobre adivinhar se o Team X vai ganhar, perder ou empatar - dependendo apenas de dados de jogos passados. Então, veja como você usa um modelo de Markov para fazer essa previsão.

  1. Calcule algumas probabilidades com base nos dados passados.

    Por exemplo, quantas vezes o Team X perdeu jogos? Quantas vezes o Team X ganhou jogos? Por exemplo, imagine se Team X ganhou 6 jogos em dez jogos no total. Então, o time X ganhou 60% do tempo. Em outras palavras, a probabilidade de ganhar pelo time X é de 60 por cento.

  2. Calcule a probabilidade de uma perda, e então a probabilidade de uma gravata, da mesma maneira.

  3. Use a equação de probabilidade Naïve Bayes para calcular probabilidades como a seguinte:

    • A probabilidade de que o time X vença, dado que a equipe X perdeu o último jogo.

    • A probabilidade de o Team X perder, uma vez que o Team X ganhou o último jogo.

  4. Calcule as probabilidades para cada estado (ganhar, perder ou amarrar).

  5. Supondo que a equipe joga apenas um jogo por dia, as probabilidades são as seguintes:

    • P (Win | Loss) é a probabilidade de que o Team X vença hoje, já que perdeu ontem.

    • P (Win | Tie) é a probabilidade de que o Team X vença hoje, já que está empatado ontem.

    • P (Win | Win) é a probabilidade de o Team X vencer hoje, dado que ganhou ontem.

  6. Usando as probabilidades calculadas, crie um gráfico.

    Um círculo neste gráfico representa um possível estado que o Team X poderia atingir em qualquer momento (ganho, perda, empate); os números nas setas representam as probabilidades de que o Team X possa se mover de um estado para outro.

Por exemplo, se o Team X acabou de vencer o jogo de hoje (seu estado atual = vitória), a probabilidade de o time vencer novamente é de 60%; a probabilidade de perderem o próximo jogo é de 20% (caso em que eles se movem do estado atual = win para o estado futuro = perda).

Suponha que você queira conhecer as chances de o Team X ganhar dois jogos consecutivos e perder o terceiro. Como você pode imaginar, essa não é uma previsão direta de fazer.

No entanto, usando o gráfico que acabamos de criar e o pressuposto de Markov, você pode facilmente prever as chances de ocorrência desse evento. Você começa com o estado da vitória, percorre o estado da vitória novamente e grava 60%; então você muda para o estado de perda e grava 20%.

As chances de o Team X ganhar duas vezes e perder o terceiro jogo tornam-se simples de calcular: 60 por cento vezes 60 por cento 20 por cento, que é 60 por cento * 60 por cento * 20 por cento, o que equivale a 72 por cento.

Então, quais são as chances de que o Team X vença, depois gravar e depois perder duas vezes depois disso? A resposta é de 20% (passando do estado da vitória para o estado de empate) em 20% (movendo-se do empate para a perda), 35% (movendo-se de perda para perda) 35% (movendo-se de perda para perda). O resultado é de 49%.

Como usar o modelo de Markov em Analytics Predictive - dummies

Escolha dos editores

Origem e Design de Hadoop - dummies

Origem e Design de Hadoop - dummies

Então, o que é exatamente isso com o nome engraçado - Hadoop? No seu núcleo, o Hadoop é uma estrutura para armazenar dados em grandes clusters de hardware de commodities - hardware de computador todos os dias acessível e facilmente disponível - e executando aplicativos contra esses dados. Um cluster é um grupo de computadores interligados (conhecido como ...

A arquitetura do porco em Hadoop - dummies

A arquitetura do porco em Hadoop - dummies

"Simples" geralmente significa "elegante" quando se trata de desenhos arquitetônicos para Essa nova mansão do Vale do Silício que você planejou quando o dinheiro começa a rolar depois de implementar o Hadoop. O mesmo princípio se aplica à arquitetura de software. O porco é composto por dois componentes (count 'em, two): O próprio idioma: como prova de que os programadores ...

MapReduce Application Flow em Hadoop - dummies

MapReduce Application Flow em Hadoop - dummies

No seu núcleo, MapReduce é um modelo de programação para o processamento de conjuntos de dados que são armazenados de forma distribuída nos nós de escravo de um cluster Hadoop. O conceito-chave aqui é dividir e conquistar. Especificamente, você deseja quebrar um grande conjunto de dados em muitas peças menores e processá-las em paralelo com o mesmo algoritmo. ...

Escolha dos editores

Apoiando a sua campanha PPC com análise de palavras-chave - manequins

Apoiando a sua campanha PPC com análise de palavras-chave - manequins

A base de todo o trabalho do mecanismo de pesquisa é uma análise de palavras-chave. Fazer uma análise de palavras-chave realmente não é tão complicado e pode significar a diferença entre sucesso e falha em sua campanha PPC. Comece digitando as palavras-chave óbvias em um editor de texto ou processador de texto - aqueles que você já pensou ou, se você ...

Envie seu site para Yahoo! Search Directory - dummies

Envie seu site para Yahoo! Search Directory - dummies

Envios para o Yahoo! O diretório costumava ser muito difícil. Pesquisas mostraram que as pessoas que conseguiram obter seus sites listados no diretório tiveram que tentar várias vezes em questão de meses. Era grátis, mas era um aborrecimento. A boa notícia: você pode obter seu site listado em Yahoo! Diretório ...

Dicas para criar e otimizar conteúdo para objetos e indústrias difíceis - manequins

Dicas para criar e otimizar conteúdo para objetos e indústrias difíceis - manequins

Em A superfície, a criação de conteúdo não soa tão difícil até você se sentar e tentar escrever. Sua estratégia de SEO depende desse conteúdo. É ainda pior se você estiver escrevendo conteúdo para o que muitas pessoas podem considerar uma indústria chata. A boa notícia é que é possível transformar indivíduos potencialmente chatos em bons ...

Escolha dos editores

Componentes eletrônicos: transistores como um potenciômetro mágico - manequins

Componentes eletrônicos: transistores como um potenciômetro mágico - manequins

Um transistor dentro de um O circuito eletrônico funciona como uma combinação de um diodo e um resistor variável, também chamado de potenciômetro ou pote. Mas isso não é apenas um pote comum; é um pote mágico cujo botão é misteriosamente conectado ao diodo por raios invisíveis, tipo desse tipo: quando a tensão direta é aplicada em ...

Componentes eletrônicos: Resistores - manequins

Componentes eletrônicos: Resistores - manequins

Um resistor é um pequeno componente projetado para fornecer um específico quantidade de resistência em um circuito eletrônico. Como a resistência é um elemento essencial de quase todos os circuitos eletrônicos, você usará resistores em quase todos os circuitos que você constrói. Embora os resistores venham em uma variedade de tamanhos e formas, o tipo mais comum ...