Lar Finanças Pessoais Os limites de dados de classificação na aprendizagem de máquinas - dados de classificação

Os limites de dados de classificação na aprendizagem de máquinas - dados de classificação

Vídeo: Seleção de atributos no Weka 2024

Vídeo: Seleção de atributos no Weka 2024
Anonim

Os dados de classificação têm suas limitações na aprendizagem em máquina. Para que os sistemas de recomendação funcionem bem, eles precisam saber sobre você, bem como outras pessoas, como você e diferente de você. A aquisição de dados de classificação permite que um sistema de recomendação seja aprendido com as experiências de vários clientes. Os dados de classificação podem derivar de um julgamento (como classificar um produto usando estrelas ou números) ou um fato (um binário 1/0 que simplesmente afirma que você comprou o produto, viu um filme ou parou de navegar em uma determinada página da web).

Independentemente da fonte ou tipo de dados, os dados de classificação são sempre sobre comportamentos. Para classificar um filme, você deve decidir vê-lo, assisti-lo e avalie-o com base na sua experiência de ver o filme. Os sistemas de recomendação reais aprendem com os dados de classificação de diferentes maneiras:

  • Filtragem colaborativa: Jogos avaliadores com base em semelhanças de filmes ou produtos usados ​​no passado. Você pode obter recomendações com base em itens gostou de pessoas semelhantes a você ou em itens semelhantes aos que você gosta.
  • Filtragem baseada em conteúdo: Vai além do fato de ter assistido a um filme. Ele examina os recursos relativos a você e ao filme para determinar se existe uma correspondência com base nas categorias maiores que os recursos representam. Por exemplo, se você é uma mulher que gosta de filmes de ação, o recomendador procurará sugestões que incluem a interseção dessas duas categorias.
  • Recomendações baseadas no conhecimento: Com base em metadados, como preferências expressadas pelos usuários e descrições de produtos. Baseia-se no aprendizado da máquina e é eficaz quando você não possui dados comportamentais suficientes para determinar as características do usuário ou do produto. Isso é chamado de início a frio e representa uma das tarefas de recomendação mais difíceis porque você não tem acesso a filtragem colaborativa ou a filtragem baseada em conteúdo.

Ao usar a filtragem colaborativa, você precisa calcular a similaridade. Além das distâncias de Euclidean, Manhattan e Chebyshev, o resto desta informação discute a semelhança de coseno. A semelhança do coseno mede a distância do coseno angular entre dois vetores, o que pode parecer um conceito difícil de entender, mas é apenas uma maneira de medir ângulos nos espaços de dados.

Imagine um espaço feito de recursos e com dois pontos. Você pode medir a distância entre os pontos. Por exemplo, você poderia usar a distância euclidiana, que é uma escolha perfeita quando você tem poucas dimensões, mas que falha miseravelmente quando você tem várias dimensões por causa da maldição da dimensionalidade.

A idéia por trás da distância do coseno é usar o ângulo criado pelos dois pontos conectados à origem do espaço (o ponto onde todas as dimensões são zero). Se os pontos estão próximos, o ângulo é estreito, independentemente de quantas dimensões haja. Se eles estão longe, o ângulo é bastante grande.

A semelhança do coseno implementa a distância do coseno como uma porcentagem e é bastante eficaz para dizer se um usuário é semelhante a outro ou se um filme pode ser associado a outro porque os mesmos usuários o favorecem. O exemplo a seguir localiza os filmes que são os filmes mais parecidos ao filme 50, Star Wars.

print (colnames (MovieLense [50]))

[1] "Star Wars (1977)"

similar_movies <- similarity (MovieLense [50],

MovieLense [-50],

method = "cosine",

que = "itens")

colnames (similar_movies) [que (similar_movies> 0. 70)]

[1] "Toy Story (1995)" < "Empire Strikes Back, The (1980)"

[3] "Raiders of the Lost Ark (1981)"

"Return of the Jedi (1983)"

Os limites de dados de classificação na aprendizagem de máquinas - dados de classificação

Escolha dos editores

Acalma suas emoções ao praticar Mindfulness - dummies

Acalma suas emoções ao praticar Mindfulness - dummies

Aqui, você descobre a maneira consciente de gerenciar as emoções - as etapas para tome quando estiver sentindo baixo, excessivamente irritado ou desconfortavelmente ansioso. As emoções positivas podem ser um sentimento maravilhoso. A alegria, a alegria, a emoção e a felicidade são perfeitas. Mas como você pode lidar com as chamadas emoções negativas? Use a atenção para a saúde emocional A atenção plena está se tornando ...

Como começar o seu dia de trabalho com meditação Mindfulness - dummies

Como começar o seu dia de trabalho com meditação Mindfulness - dummies

Você pode encontrar a meditação mindfulness é uma ótima maneira de Comece o seu dia de trabalho. Quando chegar ao trabalho pela manhã, talvez já esteja estressado. Depois de uma agitada hora ou duas preparando as crianças para a escola ou regatear com seu parceiro ou lidar com alguma emergência em casa, seguido de ...

Os melhores sites Mindfulness - dummies

Os melhores sites Mindfulness - dummies

, Independentemente de você morar no Reino Unido ou em outro lugar, se você procurar "mindfulness" 'on-line, você literalmente obterá milhões de resultados. Como você pode dizer o trigo da palha? Aqui estão alguns sites que você achará útil. Atento. Este recurso maravilhoso tem muitos conteúdos de alta qualidade de professores excelentes de atenção plena. O ...

Escolha dos editores

HDR Solução de problemas: Nada está funcionando - manequins

HDR Solução de problemas: Nada está funcionando - manequins

Quando você se depara com uma situação com suas fotografias de alcance dinâmico elevado e parece que nada que você está fazendo está funcionando - as configurações não parecem boas, a imagem parece errada, os efeitos são ruins - relaxe e faça uma pausa. A imagem está lhe dizendo algo. Que algo às vezes é relacionado a forçar ...

HDR Resolução de problemas: falta de imaginação - dummies

HDR Resolução de problemas: falta de imaginação - dummies

A imaginação é uma coisa poderosa ao preparar imagens HDR, fato que é tornou-se mais óbvio quando você vê o resultado de não usá-lo versus usá-lo. A imagem superior desta figura é uma imagem HDR de um diner local durante a "hora dourada" - naquele horário atrasado (ou manhã) quando ...

HDR Solução de problemas: Sharpening - dummies

HDR Solução de problemas: Sharpening - dummies

Se você ficar apanhado na perfeição, você está preparado para aumentar seu HDR imagens. Os fotógrafos às vezes estão obcecados com a nitidez em suas fotos. Eles querem que tudo seja pixelly perfeitamente afiado do nariz da câmera até o infinito, independentemente da lente, abertura, ISO ou velocidade do obturador que eles usem. Esta figura mostra os resultados ...

Escolha dos editores

Cisco Rede: Mostrar comando de versão em um Switch - dummies

Cisco Rede: Mostrar comando de versão em um Switch - dummies

Em qualquer componente de rede da Cisco, o show O comando de versão é aplicável a qualquer hardware usando o Sistema Operacional Cisco IET (Internetwork Operating System), incluindo switches. O comando show version mostra informações ligeiramente diferentes, de acordo com o tipo de dispositivo em que você usa. Veja a saída do comando show version em um switch e ...

Cisco Rede: Modo de operação EXEC privilegiado - manequins

Cisco Rede: Modo de operação EXEC privilegiado - manequins

Você precisa usar o modo EXEC privilegiado se quiser realmente tem acesso de atualização a um sistema de rede Cisco,. Para entrar neste modo no modo EXEC do usuário, emita o comando enable, que solicita uma senha, se configurado. Como o nome do modo sugere, este modo tem privilégios extras para permitir ...

Cisco Rede: Configuração de Senha de Shell Seguro (SSH) - manequins

Cisco Rede: Configuração de Senha de Shell Seguro (SSH) - manequins

Shell seguro (SSH) é um protocolo de rede para seus dispositivos Cisco, que é mais seguro do que o Telenet. Definir uma senha segura é um requisito de configuração para este protocolo. Para configurar o acesso a um switch Cisco para SSH, você precisará ter uma conta de usuário criada em sua opção. O exemplo supõe que você tenha ...