Lar Finanças Pessoais Agrupando Redes Sociais em Grupos - manequins

Agrupando Redes Sociais em Grupos - manequins

Vídeo: AGRUPANDO DADOS NO POWER BI USANDO POWER QUERY E DAX 2024

Vídeo: AGRUPANDO DADOS NO POWER BI USANDO POWER QUERY E DAX 2024
Anonim

As pessoas tendem a formar comunidades - grupos de outras pessoas que têm idéias e sentimentos semelhantes. Ao estudar esses clusters, atribuir certos comportamentos ao grupo como um todo torna-se mais fácil (embora atribuir o comportamento a um indivíduo seja perigoso e não confiável).

A idéia por trás do estudo de clusters é que, se existe uma conexão entre as pessoas, muitas vezes eles têm um conjunto comum de idéias e objetivos. Ao encontrar agrupamentos, você pode determinar essas idéias inspecionando a associação do grupo. Por exemplo, é comum tentar encontrar cachos de pessoas na detecção de fraudes de seguro e inspeção fiscal. Grupos inesperados de pessoas podem suscitar suspeitas de que fazem parte de um grupo de fraudadores ou evasores de impostos, porque eles não têm as razões comuns para as pessoas se reunirem em tais circunstâncias.

Os gráficos de amizade podem representar a forma como as pessoas se conectam entre si. Os vértices representam indivíduos e as bordas representam suas conexões, como relações familiares, contatos comerciais ou vínculos de amizade. Normalmente, os gráficos de amizade não são direcionados porque representam relações mútuas, e às vezes são ponderados para representar a força do vínculo entre duas pessoas.

Muitos estudos se concentram em gráficos não direcionados que se concentram exclusivamente em associações. Você também pode usar gráficos direcionados para mostrar que a Pessoa A conhece a Pessoa B, mas a Pessoa B nem sabe que a Pessoa A existe. Neste caso, você realmente tem 16 diferentes tipos de tríades a considerar.

Ao procurar por clusters em um gráfico de amizade, as conexões entre nós desses clusters dependem de tríades - essencialmente, tipos especiais de triângulos. As conexões entre três pessoas podem cair nessas categorias:

  • Fechado: As três pessoas se conhecem. Pense em uma configuração familiar neste caso, em que todos conhecem todos os outros.
  • Abrir: Uma pessoa conhece outras duas pessoas, mas as outras duas pessoas não se conhecem. Pense em uma pessoa que conheça um indivíduo no trabalho e outro indivíduo em casa, mas o indivíduo no trabalho não sabe nada sobre o indivíduo em casa.
  • Par de conexão: Uma pessoa conhece uma das outras pessoas em uma tríade, mas não conhece a terceira pessoa. Esta situação envolve duas pessoas que sabem algo sobre si mesmo que conhecem alguém novo - alguém que potencialmente quer fazer parte do grupo.
  • Desconectado: A tríade forma um grupo, mas ninguém no grupo se conhece. Este último pode parecer um pouco estranho, mas pense em uma convenção ou seminário.As pessoas nesses eventos formam um grupo, mas eles podem não saber nada sobre o outro. No entanto, porque eles têm interesses semelhantes, você pode usar o cluster para entender o comportamento do grupo.

As tríades ocorrem naturalmente nos relacionamentos, e muitas redes sociais da Internet alavancaram essa idéia para acelerar as conexões entre os participantes. A densidade de conexões é importante para qualquer tipo de rede social porque uma rede conectada pode espalhar informações e compartilhar conteúdos com mais facilidade. Por exemplo, quando LinkedIn, a rede social profissional, decidiu aumentar a densidade de conexão de sua rede, começou por procurar tríades abertas e tentando fechá-las convidando as pessoas a se conectar. As tríades de fechamento estão na base do algoritmo Sugestão de conexão do LinkedIn. Você pode descobrir mais sobre como funciona lendo a resposta do Quora.

O exemplo aqui depende do gráfico de amostra do Zachary's Karate Club. É um pequeno gráfico que permite que você veja como as redes funcionam sem gastar muito tempo carregando um grande conjunto de dados. Felizmente, este conjunto de dados aparece como parte do pacote networkx . A rede do clube de karaté de Zachary representa as relações de amizade entre 34 membros de um clube de karatê de 1970 a 1972. O sociólogo Wayne W. Zachary usou isso como tema de estudo. Ele escreveu um artigo intitulado "Um modelo de fluxo de informação para conflitos e fissão em pequenos grupos. "O fato interessante sobre este gráfico e seu artigo é que, nesses anos, surgiu um conflito no clube entre um dos instrutores de karatê (nó número 0) e o presidente do clube (nó número 33). Ao agrupar o gráfico, você pode quase perfeitamente prever a divisão do clube em dois grupos logo após a ocorrência.

Como este exemplo também desenha um gráfico que mostra os grupos (para que você possa visualizá-los mais facilmente), você também precisa usar o pacote matplotlib . O código a seguir mostra como graficar os nós e bordas do conjunto de dados.

importar networkx como nx

importar matplotlib. pyplot como plt

% matplotlib inline

graph = nx. karate_club_graph ()

pos = nx. spring_layout (gráfico)

nx. desenhar (gráfico, pos, with_labels = True)

plt. show ()

Para exibir o gráfico na tela, você também precisa fornecer um layout que determina como posicionar os nós na tela. Este exemplo usa o algoritmo dirigido por força de Fruchterman-Reingold (a chamada para nx. Spring_layout ). A figura mostra o resultado do exemplo. (Sua saída pode parecer um pouco diferente.)

Um gráfico que mostra os clusters de rede de relacionamentos entre amigos.

O algoritmo dirigido por força Fruchterman-Reingold para gerar layouts automáticos de gráficos cria layouts compreensíveis com nós separados e bordas que tendem a não cruzar imitando o que acontece na física entre partículas carregadas eletricamente ou ímãs com o mesmo sinal. Ao olhar para a saída do gráfico, você pode ver que alguns nós têm apenas uma conexão, algumas duas e algumas mais do que duas.As bordas formam tríades, conforme mencionado anteriormente. No entanto, a consideração mais importante é que a figura mostra claramente o agrupamento que ocorre em uma rede social.

Agrupando Redes Sociais em Grupos - manequins

Escolha dos editores

Origem e Design de Hadoop - dummies

Origem e Design de Hadoop - dummies

Então, o que é exatamente isso com o nome engraçado - Hadoop? No seu núcleo, o Hadoop é uma estrutura para armazenar dados em grandes clusters de hardware de commodities - hardware de computador todos os dias acessível e facilmente disponível - e executando aplicativos contra esses dados. Um cluster é um grupo de computadores interligados (conhecido como ...

A arquitetura do porco em Hadoop - dummies

A arquitetura do porco em Hadoop - dummies

"Simples" geralmente significa "elegante" quando se trata de desenhos arquitetônicos para Essa nova mansão do Vale do Silício que você planejou quando o dinheiro começa a rolar depois de implementar o Hadoop. O mesmo princípio se aplica à arquitetura de software. O porco é composto por dois componentes (count 'em, two): O próprio idioma: como prova de que os programadores ...

MapReduce Application Flow em Hadoop - dummies

MapReduce Application Flow em Hadoop - dummies

No seu núcleo, MapReduce é um modelo de programação para o processamento de conjuntos de dados que são armazenados de forma distribuída nos nós de escravo de um cluster Hadoop. O conceito-chave aqui é dividir e conquistar. Especificamente, você deseja quebrar um grande conjunto de dados em muitas peças menores e processá-las em paralelo com o mesmo algoritmo. ...

Escolha dos editores

Apoiando a sua campanha PPC com análise de palavras-chave - manequins

Apoiando a sua campanha PPC com análise de palavras-chave - manequins

A base de todo o trabalho do mecanismo de pesquisa é uma análise de palavras-chave. Fazer uma análise de palavras-chave realmente não é tão complicado e pode significar a diferença entre sucesso e falha em sua campanha PPC. Comece digitando as palavras-chave óbvias em um editor de texto ou processador de texto - aqueles que você já pensou ou, se você ...

Envie seu site para Yahoo! Search Directory - dummies

Envie seu site para Yahoo! Search Directory - dummies

Envios para o Yahoo! O diretório costumava ser muito difícil. Pesquisas mostraram que as pessoas que conseguiram obter seus sites listados no diretório tiveram que tentar várias vezes em questão de meses. Era grátis, mas era um aborrecimento. A boa notícia: você pode obter seu site listado em Yahoo! Diretório ...

Dicas para criar e otimizar conteúdo para objetos e indústrias difíceis - manequins

Dicas para criar e otimizar conteúdo para objetos e indústrias difíceis - manequins

Em A superfície, a criação de conteúdo não soa tão difícil até você se sentar e tentar escrever. Sua estratégia de SEO depende desse conteúdo. É ainda pior se você estiver escrevendo conteúdo para o que muitas pessoas podem considerar uma indústria chata. A boa notícia é que é possível transformar indivíduos potencialmente chatos em bons ...

Escolha dos editores

Componentes eletrônicos: transistores como um potenciômetro mágico - manequins

Componentes eletrônicos: transistores como um potenciômetro mágico - manequins

Um transistor dentro de um O circuito eletrônico funciona como uma combinação de um diodo e um resistor variável, também chamado de potenciômetro ou pote. Mas isso não é apenas um pote comum; é um pote mágico cujo botão é misteriosamente conectado ao diodo por raios invisíveis, tipo desse tipo: quando a tensão direta é aplicada em ...

Componentes eletrônicos: Resistores - manequins

Componentes eletrônicos: Resistores - manequins

Um resistor é um pequeno componente projetado para fornecer um específico quantidade de resistência em um circuito eletrônico. Como a resistência é um elemento essencial de quase todos os circuitos eletrônicos, você usará resistores em quase todos os circuitos que você constrói. Embora os resistores venham em uma variedade de tamanhos e formas, o tipo mais comum ...