Lar Finanças Pessoais Escolhendo o Algoritmo Direito para Aprendizagem de Máquina - dummies

Escolhendo o Algoritmo Direito para Aprendizagem de Máquina - dummies

Vídeo: As Regras Secretas da Vida Moderna - Algoritmos 2024

Vídeo: As Regras Secretas da Vida Moderna - Algoritmos 2024
Anonim

Parte da Aprendizagem de Máquinas para Dummies Cheat Sheet < O aprendizado da máquina envolve o uso de vários algoritmos diferentes. Esta tabela fornece um resumo rápido dos pontos fortes e fracos de vários algoritmos.

Algoritmo

Melhor em Prós Contras Floresta aleatória
Apt em quase qualquer problema de aprendizado de máquina Bioinformática

Pode funcionar em paralelo

Excessos raros > Manipula automaticamente os valores faltantes

Não é necessário transformar qualquer variável

Não é necessário ajustar parâmetros

Pode ser usado por quase qualquer pessoa com excelentes resultados

Difícil de interpretar

Mais fraco na regressão ao estimar valores em as extremidades da distribuição de valores de resposta

tendenciosa em problemas de multiclass para classes mais frequentes

Gradient Boosting

Apt em quase qualquer problema de aprendizado de máquina

Motores de busca (resolvendo o problema de aprender a classificar) > Pode aproximar a maioria das funções não-lineares Melhor preditor de classe

Manipula automaticamente os valores faltantes

Não é necessário transformar qualquer variável

Pode superar se executado para muitas iterações

Sensível a dados ruidosos e outliers

Não funciona bem sem sintonização de parâmetros

Regressão linear

Previsão de linha de base

Predições econométricas

Modelagem de respostas de marketing Simples de entender e explicar

Pouco ultrapassa

Usar a regularização L1 e L2 é efetivo na seleção de recursos

Rápido para treinar

Fácil de usar Treinar em dados grandes graças à sua versão estocástica

Você precisa trabalhar duro para ajustá-lo às funções não-lineares

Pode sofrer de outliers

Suporte de máquinas vetoriais

Reconhecimento de caracteres

Reconhecimento de imagem

Texto classificação Criação automática de recurso não-linear

Pode aproximar funções não-lineares complexas

Difícil de interpretar ao aplicar os kernels não-lineares

Sufres de muitos exemplos, após 10 000 exemplos, ele começa a demorar muito para treinar

Vizinhos mais próximos

Visão computacional

Etiquetagem Multilabel

Sistemas recomendados Problemas de verificação ortográfica

Treinamento rápido e preguiçoso

Pode lidar com problemas extremos de multiclass (como o texto de marcação)

Lento e pesado na fase de previsão

Pode deixar de prever corr Ectly devido à maldição da dimensionalidade

Adaboost

Detecção de rosto

Manipula automaticamente os valores faltantes

Não é necessário transformar qualquer variável Não se supera facilmente Poucos parâmetros para ajustar > Pode alavancar muitos alunos fracos diferentes

Dados sensíveis a ruidosos e outliers

Nunca as melhores previsões de classe

Naive Bayes

Reconhecimento de rosto

Análise de sentimento

Detecção de spam

Classificação de texto Fácil e rápido de implementar, não requer muita memória e pode ser usado para aprender on-line

Fácil de entender

Toma em consideração conhecimento prévio

Suposições fortes e irrealistas de independência de recursos > Falha na estimativa de ocorrências raras

Sufres de características irrelevantes

Redes Neurais

Reconhecimento de imagem

Reconhecimento e tradução de linguagem

Reconhecimento de voz

Reconhecimento de visão

Pode aproximar qualquer função não linear Robusto para outliers

Funciona apenas com uma porção dos exemplos (o vetor de suporte s

Muito difícil de configurar

Difícil de sintonizar devido a muitos parâmetros e você também tem que decidir a arquitetura da rede

Difícil de interpretar

Fácil de superar

Regressão logística < Ordem de resultados por probabilidade

Modelagem de respostas de marketing

Simples de entender e explicar

Pouco excede

Usar a regularização L1 e L2 é efetivo na seleção de recursos

O melhor algoritmo para prever probabilidades de um Evento Rápido para treinar

Fácil de treinar em dados grandes graças à sua versão estocástica

Você precisa trabalhar arduamente para que ele se encaixe em funções não-lineares

Pode sofrer de outliers

SVD

Recomendador sistemas

Pode reestruturar os dados de forma significativa

Difícil de entender por que os dados foram reestruturados de uma certa maneira

PCA

Removendo colinearidade

Reduzindo as dimensões do conjunto de dados Pode reduzir a dimensionalidade dos dados Implanta suposições lineares fortes (os componentes são uma pontuação ponderada de recursos) K-means Segmentação
Rápido na busca de clusters Pode detectar outliers em múltiplas dimensões

Suffers de multicolinearidade

Os agrupamentos são esféricos, não podem detectar grupos de outras formas Instável soluções, depende da inicialização
Escolhendo o Algoritmo Direito para Aprendizagem de Máquina - dummies

Escolha dos editores

Origem e Design de Hadoop - dummies

Origem e Design de Hadoop - dummies

Então, o que é exatamente isso com o nome engraçado - Hadoop? No seu núcleo, o Hadoop é uma estrutura para armazenar dados em grandes clusters de hardware de commodities - hardware de computador todos os dias acessível e facilmente disponível - e executando aplicativos contra esses dados. Um cluster é um grupo de computadores interligados (conhecido como ...

A arquitetura do porco em Hadoop - dummies

A arquitetura do porco em Hadoop - dummies

"Simples" geralmente significa "elegante" quando se trata de desenhos arquitetônicos para Essa nova mansão do Vale do Silício que você planejou quando o dinheiro começa a rolar depois de implementar o Hadoop. O mesmo princípio se aplica à arquitetura de software. O porco é composto por dois componentes (count 'em, two): O próprio idioma: como prova de que os programadores ...

MapReduce Application Flow em Hadoop - dummies

MapReduce Application Flow em Hadoop - dummies

No seu núcleo, MapReduce é um modelo de programação para o processamento de conjuntos de dados que são armazenados de forma distribuída nos nós de escravo de um cluster Hadoop. O conceito-chave aqui é dividir e conquistar. Especificamente, você deseja quebrar um grande conjunto de dados em muitas peças menores e processá-las em paralelo com o mesmo algoritmo. ...

Escolha dos editores

Apoiando a sua campanha PPC com análise de palavras-chave - manequins

Apoiando a sua campanha PPC com análise de palavras-chave - manequins

A base de todo o trabalho do mecanismo de pesquisa é uma análise de palavras-chave. Fazer uma análise de palavras-chave realmente não é tão complicado e pode significar a diferença entre sucesso e falha em sua campanha PPC. Comece digitando as palavras-chave óbvias em um editor de texto ou processador de texto - aqueles que você já pensou ou, se você ...

Envie seu site para Yahoo! Search Directory - dummies

Envie seu site para Yahoo! Search Directory - dummies

Envios para o Yahoo! O diretório costumava ser muito difícil. Pesquisas mostraram que as pessoas que conseguiram obter seus sites listados no diretório tiveram que tentar várias vezes em questão de meses. Era grátis, mas era um aborrecimento. A boa notícia: você pode obter seu site listado em Yahoo! Diretório ...

Dicas para criar e otimizar conteúdo para objetos e indústrias difíceis - manequins

Dicas para criar e otimizar conteúdo para objetos e indústrias difíceis - manequins

Em A superfície, a criação de conteúdo não soa tão difícil até você se sentar e tentar escrever. Sua estratégia de SEO depende desse conteúdo. É ainda pior se você estiver escrevendo conteúdo para o que muitas pessoas podem considerar uma indústria chata. A boa notícia é que é possível transformar indivíduos potencialmente chatos em bons ...

Escolha dos editores

Componentes eletrônicos: transistores como um potenciômetro mágico - manequins

Componentes eletrônicos: transistores como um potenciômetro mágico - manequins

Um transistor dentro de um O circuito eletrônico funciona como uma combinação de um diodo e um resistor variável, também chamado de potenciômetro ou pote. Mas isso não é apenas um pote comum; é um pote mágico cujo botão é misteriosamente conectado ao diodo por raios invisíveis, tipo desse tipo: quando a tensão direta é aplicada em ...

Componentes eletrônicos: Resistores - manequins

Componentes eletrônicos: Resistores - manequins

Um resistor é um pequeno componente projetado para fornecer um específico quantidade de resistência em um circuito eletrônico. Como a resistência é um elemento essencial de quase todos os circuitos eletrônicos, você usará resistores em quase todos os circuitos que você constrói. Embora os resistores venham em uma variedade de tamanhos e formas, o tipo mais comum ...