Lar Finanças Pessoais Como aplicar qualquer agrupamento de colônias na análise preditiva - manequins

Como aplicar qualquer agrupamento de colônias na análise preditiva - manequins

Vídeo: Utilizando o Microsoft Query para Relacionar tabelas do Excel | Doutores do Excel 2024

Vídeo: Utilizando o Microsoft Query para Relacionar tabelas do Excel | Doutores do Excel 2024
Anonim

Um exemplo natural de grupo auto-organizado que você pode aplicar no comportamento de análise preditiva é uma colônia de formigas que procuram alimentos. As formigas otimizam coletivamente suas trilhas de modo que sempre leva a rota mais curta possível para um alvo alimentar.

Mesmo se você tentar incomodar uma colônia de formigas e impedir que eles cheguem ao alvo da comida, eles voltam rapidamente e (novamente) encontram o caminho mais curto possível para o alvo alimentar, todos eles evitando os mesmos obstáculos enquanto procurava comida. Essa uniformidade de comportamento é possível porque cada formiga deposita uma trilha de feromônios no chão.

Considere um exército de formigas ocioso em seu ninho. Quando eles começam a procurar comida, eles não têm absolutamente nenhuma informação sobre onde encontrá-lo. Eles marcham aleatoriamente até que uma formiga individual encontre comida; Agora, a formiga sortuda (chamar Ant X) tem de comunicar a sua descoberta ao resto das formigas - e para fazer isso, deve encontrar o caminho de volta para o ninho.

Felizmente, Ant X estava produzindo seus próprios feromônios o tempo todo procurando comida; Pode seguir o seu próprio rastro de feromonas de volta ao ninho. No caminho de volta ao ninho, seguindo sua própria trilha de feromonas, Ant X coloca mais feromônios na mesma trilha.

Como resultado, o perfume na trilha de Ant X será o mais forte entre todas as trilhas de outras formigas. A trilha mais forte de feromonas atrairá todas as outras formigas que ainda estão à procura de alimentos. Eles seguirão o aroma mais forte. À medida que mais formigas se juntam ao trilho de Ant X, eles adicionam mais feromônias a ele; o cheiro torna-se mais forte. Em breve, todas as outras formigas têm um cheiro forte a seguir.

Se várias formigas descobriram a mesma fonte de alimento, as formigas que tomaram o caminho mais curto farão mais viagens em comparação com formigas que seguem caminhos mais longos -, portanto, mais feromonas serão produzidas no caminho mais curto. A relação entre comportamento individual e coletivo é um exemplo natural esclarecedor.

Cada ponto representa um documento. Suponha que os pontos negros sejam documentos sobre análises preditivas e os pontos brancos são documentos sobre antropologia. Os pontos que representam os diferentes tipos de documentos são distribuídos aleatoriamente na grade de cinco células.

"Formigas" são implantadas aleatoriamente na grade para procurar documentos semelhantes. Cada célula com um valor nela representa uma instância de "feromônio". "Usando a matriz do documento, o valor de" feromona "de cada célula é calculado a partir do documento correspondente.

Ok, como a inteligência coletiva de uma colônia de formigas produz um modelo para efetivamente agrupar dados? A resposta reside numa simples analogia: as formigas estão procurando por alimentos em seu ambiente, tanto quanto estamos buscando clusters em um conjunto de dados - procurando documentos semelhantes em um grande conjunto de documentos.

Considere um conjunto de dados de documentos que você deseja organizar por tópico. Documentos semelhantes serão agrupados no mesmo cluster. Aqui é onde a colônia de formigas pode fornecer dicas sobre como agrupar documentos semelhantes.

Imagine uma grade bidimensional (2D) onde você pode representar documentos como pontos. A grade 2D é dividida em células. Cada célula possui um "feromônio" (valor) associado a ele. Resumidamente, o valor da "feromona" distingue cada documento em uma determinada célula.

Os pontos são inicialmente distribuídos aleatoriamente - e cada ponto na grade representa um documento exclusivo. O próximo passo é implantar outros pontos de forma aleatória na grade 2D, simulando a busca da colônia de formigas por alimentos em seu ambiente. Esses pontos são inicialmente dispersos na mesma grade 2D com os documentos.

Cada novo ponto adicionado à grade representa uma formiga. Essas "formigas", muitas vezes referidas no algoritmo da colônia de formigas como agentes , estão se movendo na grade 2D. Cada "formiga" irá retirar ou colocar os outros pontos (documentos), dependendo de onde os documentos pertencem melhor. Nesta analogia, o "alimento" assume a forma de documentos suficientemente semelhantes para serem agrupados.

Uma "formiga" caminha aleatoriamente na grade; Se encontrar um documento, ele pode executar uma das duas ações: escolher ou soltar. Cada célula tem uma "intensidade de feromônio" que indica a semelhança do documento com os outros documentos (pontos) que residem perto do documento em questão - aquele e uma "formiga" está prestes a retirar ou soltar.

Observe que a "formiga" na célula 3 irá pegar o documento pontilhado preto porque o valor "feromônio" branco está dominando; e mude para uma célula onde o valor está próximo (similar) ao que está na célula 4 (vários pontos pretos). A pesquisa mantém iteração até formar os clusters.

Com efeito, a "formiga" move documentos de uma célula para outra para formar clusters executando uma das duas únicas ações: retirar um documento ou deixar um documento.

Quando as "formigas" começaram a se mover aleatoriamente na grade, encontrar um ponto (documento) resulta na "formiga" pegando um documento de sua célula atual, movendo-se com ele e deixando-o em uma célula em que tinha semelhança suficiente para caber.

Como uma "formiga" determinaria a melhor célula para soltar um documento? A resposta é que os valores nas células funcionam como "feromonas" - e cada célula na grade 2D contém um valor numérico que pode ser calculado de forma a representar um documento na célula.

Lembre-se de que cada documento é representado como um conjunto de números ou um vetor de valores numéricos. A "intensidade da feromona" (o valor numérico) aumenta quando mais documentos são lançados na célula - e esse valor diminui se os números que representam os documentos são movidos para fora da célula.

Como aplicar qualquer agrupamento de colônias na análise preditiva - manequins

Escolha dos editores

Origem e Design de Hadoop - dummies

Origem e Design de Hadoop - dummies

Então, o que é exatamente isso com o nome engraçado - Hadoop? No seu núcleo, o Hadoop é uma estrutura para armazenar dados em grandes clusters de hardware de commodities - hardware de computador todos os dias acessível e facilmente disponível - e executando aplicativos contra esses dados. Um cluster é um grupo de computadores interligados (conhecido como ...

A arquitetura do porco em Hadoop - dummies

A arquitetura do porco em Hadoop - dummies

"Simples" geralmente significa "elegante" quando se trata de desenhos arquitetônicos para Essa nova mansão do Vale do Silício que você planejou quando o dinheiro começa a rolar depois de implementar o Hadoop. O mesmo princípio se aplica à arquitetura de software. O porco é composto por dois componentes (count 'em, two): O próprio idioma: como prova de que os programadores ...

MapReduce Application Flow em Hadoop - dummies

MapReduce Application Flow em Hadoop - dummies

No seu núcleo, MapReduce é um modelo de programação para o processamento de conjuntos de dados que são armazenados de forma distribuída nos nós de escravo de um cluster Hadoop. O conceito-chave aqui é dividir e conquistar. Especificamente, você deseja quebrar um grande conjunto de dados em muitas peças menores e processá-las em paralelo com o mesmo algoritmo. ...

Escolha dos editores

Apoiando a sua campanha PPC com análise de palavras-chave - manequins

Apoiando a sua campanha PPC com análise de palavras-chave - manequins

A base de todo o trabalho do mecanismo de pesquisa é uma análise de palavras-chave. Fazer uma análise de palavras-chave realmente não é tão complicado e pode significar a diferença entre sucesso e falha em sua campanha PPC. Comece digitando as palavras-chave óbvias em um editor de texto ou processador de texto - aqueles que você já pensou ou, se você ...

Envie seu site para Yahoo! Search Directory - dummies

Envie seu site para Yahoo! Search Directory - dummies

Envios para o Yahoo! O diretório costumava ser muito difícil. Pesquisas mostraram que as pessoas que conseguiram obter seus sites listados no diretório tiveram que tentar várias vezes em questão de meses. Era grátis, mas era um aborrecimento. A boa notícia: você pode obter seu site listado em Yahoo! Diretório ...

Dicas para criar e otimizar conteúdo para objetos e indústrias difíceis - manequins

Dicas para criar e otimizar conteúdo para objetos e indústrias difíceis - manequins

Em A superfície, a criação de conteúdo não soa tão difícil até você se sentar e tentar escrever. Sua estratégia de SEO depende desse conteúdo. É ainda pior se você estiver escrevendo conteúdo para o que muitas pessoas podem considerar uma indústria chata. A boa notícia é que é possível transformar indivíduos potencialmente chatos em bons ...

Escolha dos editores

Componentes eletrônicos: transistores como um potenciômetro mágico - manequins

Componentes eletrônicos: transistores como um potenciômetro mágico - manequins

Um transistor dentro de um O circuito eletrônico funciona como uma combinação de um diodo e um resistor variável, também chamado de potenciômetro ou pote. Mas isso não é apenas um pote comum; é um pote mágico cujo botão é misteriosamente conectado ao diodo por raios invisíveis, tipo desse tipo: quando a tensão direta é aplicada em ...

Componentes eletrônicos: Resistores - manequins

Componentes eletrônicos: Resistores - manequins

Um resistor é um pequeno componente projetado para fornecer um específico quantidade de resistência em um circuito eletrônico. Como a resistência é um elemento essencial de quase todos os circuitos eletrônicos, você usará resistores em quase todos os circuitos que você constrói. Embora os resistores venham em uma variedade de tamanhos e formas, o tipo mais comum ...