Índice:
Vídeo: Tipos de Aprendizado de Máquina | Peixe Babel 53 2024
Aprendizagem supervisionada
- Aprendizagem sem supervisão
- Aprendizagem de reforço
- Aprendizagem supervisionada
Aprendizagem supervisionada
ocorre quando um algoritmo aprende com o exemplo dados e respostas de alvo associadas que podem consistir em valores numéricos ou rótulos de caracteres, como classes ou tags, para depois prever a resposta correta quando colocados com novos exemplos. A abordagem supervisionada é de fato semelhante à aprendizagem humana sob a supervisão de um professor. O professor fornece bons exemplos para que o aluno memorize, e o aluno deriva as regras gerais desses exemplos específicos.
Aprendizagem sem supervisão
ocorre quando um algoritmo aprende de exemplos simples sem qualquer resposta associada, deixando o algoritmo para determinar os padrões de dados por conta própria. Esse tipo de algoritmo tende a reestruturar os dados em outra coisa, como novos recursos que podem representar uma classe ou uma nova série de valores não correlacionados. Eles são bastante úteis para fornecer aos seres humanos informações sobre o significado de dados e novas entradas úteis para algoritmos de aprendizagem de máquinas supervisionados.
O algoritmo de automação de marketing deriva suas sugestões do que você comprou no passado. As recomendações são baseadas em uma estimativa do grupo de clientes que você se assemelha mais e inferindo suas prováveis preferências com base nesse grupo.
Aprendizagem de reforço
A aprendizagem de reforço
ocorre quando você apresenta o algoritmo com exemplos que não possuem rótulos, como na aprendizagem não supervisionada. No entanto, você pode acompanhar um exemplo com feedback positivo ou negativo de acordo com a solução que o algoritmo propõe.O aprendizado de reforço está conectado a aplicativos para os quais o algoritmo deve tomar decisões (por isso, o produto é prescritivo, não apenas descritivo, como na aprendizagem sem supervisão) e as decisões têm consequências. No mundo humano, é como aprender por tentativa e erro. Os erros ajudam você a aprender porque eles têm uma penalidade adicionada (custo, perda de tempo, arrependimento, dor e assim por diante), ensinando-lhe que um certo curso de ação tem menos chances de ter sucesso do que outros. Um exemplo interessante de aprendizagem de reforço ocorre quando os computadores aprendem a jogar videogames por si só.
Neste caso, um aplicativo apresenta o algoritmo com exemplos de situações específicas, como ter o jogador preso em um labirinto, evitando um inimigo. A aplicação permite que o algoritmo conheça o resultado das ações que leva, e o aprendizado ocorre ao tentar evitar o que descobre ser perigoso e perseguir a sobrevivência. Você pode ver como a empresa Google DeepMind criou um programa de treinamento de reforço que reproduz os antigos videogames da Atari. Ao assistir ao vídeo, observe como o programa é inicialmente desajeitado e não qualificado, mas melhora constantemente com o treinamento até se tornar um campeão.