Lar Finanças Pessoais Medindo semelhança entre vetores para aprendizado de máquina - dummies

Medindo semelhança entre vetores para aprendizado de máquina - dummies

Índice:

Vídeo: PC SCAN3000 FL Aprendizado para troca de Bicos HILUX Diesel 2013 - Sistema i-ART 2025

Vídeo: PC SCAN3000 FL Aprendizado para troca de Bicos HILUX Diesel 2013 - Sistema i-ART 2025
Anonim

Você pode comparar facilmente exemplos de seus dados usando cálculos se você pensa em cada um deles como um vetor. A seguinte informação descreve como medir a semelhança entre vetores para executar tarefas, como calcular a distância entre vetores para fins de aprendizagem.

Compreendendo a semelhança

Em uma forma vetorial, você pode ver cada variável em seus exemplos como uma série de coordenadas, cada uma apontando para uma posição em uma dimensão espacial diferente. Se um vetor tem dois elementos, isto é, ele tem apenas duas variáveis, trabalhar com ele é como verificar a posição de um item em um mapa usando o primeiro número para a posição no eixo Oriente-Oeste e o segundo no Norte- Eixo sul.

Exemplos de valores traçados como pontos em um gráfico.

Por exemplo, os números entre parênteses (1, 2) (3, 2) e (3, 3) são exemplos de pontos. Cada exemplo é uma lista ordenada de valores (chamada uma tupla) que pode ser facilmente localizada e impressa em um mapa usando o primeiro valor da lista para x (o eixo horizontal) e o segundo para y (o eixo vertical). O resultado é um diagrama de dispersão.

Se o seu conjunto de dados, na matriz, possui muitos recursos numéricos (as colunas), idealmente o número dos recursos representa as dimensões do espaço de dados, enquanto as linhas (os exemplos) representam cada um ponto, que matematicamente é um vetor. Quando seu vetor tem mais de dois elementos, a visualização torna-se problemática porque representar dimensões acima do terceiro não é fácil (afinal, vivemos em um mundo tridimensional).

No entanto, você pode se esforçar para transmitir mais dimensões por algum expediente, como usando o tamanho, a forma ou a cor para outras dimensões. Claramente, essa não é uma tarefa fácil, e muitas vezes o resultado está longe de ser intuitivo. No entanto, você pode entender a idéia de onde os pontos estarão em seu espaço de dados, ao imprimir sistematicamente muitos gráficos, considerando as dimensões dois a dois. Essas parcelas são chamadas de matrizes de placas de dispersão.

Não se preocupe com a multidimensionalidade. Você amplia as regras que você aprendeu em duas ou três dimensões para várias dimensões, portanto, se uma regra funciona em um espaço bidimensional, ela também funciona em uma múltipla. Portanto, todos os exemplos primeiro se referem a exemplos bidimensionais.

Distâncias de computação para aprender

Um algoritmo pode aprender usando vetores de números que usam medições de distância. Muitas vezes, o espaço implícito em seus vetores é uma métrica que é um espaço cujas distâncias respeitam certas condições específicas:

  • Não existem distâncias negativas e sua distância é zero somente quando o ponto de partida e o ponto final coincidem (chamado nongatividade).
  • A distância é a mesma que vai de um ponto para outro e vice-versa (chamada simetria).
  • A distância entre um ponto inicial e um final é sempre maior ou, no pior, a mesma distância, a distância que vai do ponto inicial para um terceiro e do final para o final (chamado desigualdade do triângulo < - o que significa que não há atalhos). As distâncias que medem um espaço métrico são a distância euclidiana, a distância de Manhattan e a distância de Chebyshev. Estas são todas as distâncias que podem se aplicar a vetores numéricos.

Distância euclidiana

A mais comum é a distância euclidiana, também descrita como a norma l2 de dois vetores (leia esta discussão sobre as normas l1, l2 e linfinity). Em um plano bidimensional, a distância euclidiana se refira como a linha recta que liga dois pontos, e você calcula como a raiz quadrada da soma da diferença quadrática entre os elementos de dois vetores. No traçado anterior, a distância euclidiana entre os pontos (1, 2) e (3, 3) pode ser calculada em R como sqrt ((1-3) ^ 2 + (2-3) ^ 2), o que resulta em um distância de aproximadamente 2. 236.

distância de Manhattan

Outra medida útil é a distância de Manhattan (também descrita como a norma l1 de dois vetores). Você calcula a distância de Manhattan, somando o valor absoluto da diferença entre os elementos dos vetores. Se a distância euclidiana marca a rota mais curta, a distância de Manhattan marca o percurso mais longo, parecido com as direções de um táxi movendo-se em uma cidade. (A distância também é conhecida como taxicab ou city-block distance.)

Por exemplo, a distância de Manhattan entre os pontos (1, 2) e (3, 3) é abs (1-3) e abs (2-3), o que resulta em 3.

distância Chebyshev

A distância Chebyshev ou a métrica máxima leva o máximo da diferença absoluta entre os elementos dos vetores. É uma medida de distância que pode representar como um rei se move no jogo de xadrez ou, na logística do armazém, as operações exigidas por um guindaste para mover uma caixa de um lugar para outro.

Na aprendizagem mecânica, a distância Chebyshev pode ser útil quando você tem muitas dimensões a considerar e a maioria deles é irrelevante ou redundante (em Chebyshev, você simplesmente escolhe aquele cuja diferença absoluta é a maior). No exemplo usado acima, a distância é simplesmente 2, o máximo entre (1-3) e abs (2-3).

Medindo semelhança entre vetores para aprendizado de máquina - dummies

Escolha dos editores

Como criar um módulo HTML personalizado no Joomla - dummies

Como criar um módulo HTML personalizado no Joomla - dummies

Uma das grandes coisas sobre o Joomla é o quão incrivelmente flexível é. A instalação padrão do CMS inclui 23 módulos diferentes para ajudá-lo a fazer seu site funcionar sem problemas. Às vezes, no entanto, você pode querer adicionar uma função ao seu site que esses 23 módulos simplesmente não vão cobrir. Sob tais circunstâncias, você pode querer considerar ...

Como criar um item de menu no Joomla Content Management - manequins

Como criar um item de menu no Joomla Content Management - manequins

Um item de menu determina o layout dos artigos, que é um dos aspectos do Joomla para o qual você precisa se acostumar. As páginas da Web não existem fisicamente no Joomla - elas são apenas itens no seu banco de dados - até que a página seja acessada. Quando você abre um artigo, o Joomla tira os dados necessários do ...

Como criar um novo item de menu com o Joomla! 1. 6 - dummies

Como criar um novo item de menu com o Joomla! 1. 6 - dummies

Não estresse se você precisa criar um item de menu em sua página da Web interativa - é fácil ao usar o Joomla! Gerenciador de menu. Para adicionar itens de menu a um site existente, basta usar estas etapas: Escolha Menus → Gerenciador de menus para abrir o Gerenciador de menus. Clique no nome do menu que deseja adicionar um novo ...

Escolha dos editores

Obtendo Ajuda do Eclipse - dummies

Obtendo Ajuda do Eclipse - dummies

Com a complexidade do Java e a nuance do Eclipse, você não pode esperar para lembrar de tudo. Às vezes, você precisa de um pouco mais de ajuda do Eclipse para começar sua programação. Felizmente, o Eclipse oferece ajuda geral e sensível ao contexto: para ajuda sensível ao contexto: no Windows, pressione F1. No Linux, pressione Ctrl + F1. Em um Mac, pressione ...

Software gratuito: preenchimento automático de células no OpenOffice. org Calc - dummies

Software gratuito: preenchimento automático de células no OpenOffice. org Calc - dummies

OpenOffice. org - uma alternativa gratuita para o Microsoft Office - inclui Calc, uma planilha eletrônica semelhante ao Excel. O Calc fornece uma maneira fácil de criar automaticamente uma coluna ou linha de números em qualquer sequência que você especificar. Esse recurso de preenchimento automático é útil para criar listas numeradas ou preencher os cabeçalhos de colunas e linhas de tabelas, como ...

Acessos acessíveis no modo de exibição do Prezi - dummies

Acessos acessíveis no modo de exibição do Prezi - dummies

O prezi possui dois modos de operação diferentes: Modo de edição, no qual você crie sua apresentação e Show Mode, no qual você apresenta suas criações. No modo Show, use esses atalhos úteis para tornar sua apresentação ainda mais suave. Use esta como uma lista de verificação de prática antes de começar: Use esta função: Para fazer isso: Completo ...

Escolha dos editores

Elementos HTML básicos - dummies

Elementos HTML básicos - dummies

HyperText Markup Language (HTML) é o idioma da web, onde os elementos ditaram a formatação e o estilo do seu conteúdo. Os elementos HTML compõem a codificação baixada que você vê quando você acessa uma página da Web em seu navegador da Web (como Internet Explorer, Firefox ou Safari). Aqui estão alguns elementos básicos para você ...

Usando AutoCAD DesignCenter - dummies

Usando AutoCAD DesignCenter - dummies

DesignCenter é um nome tolo para uma paleta útil, se um pouco ocupada. A paleta DesignCenter é útil para dados de mineração de todos os tipos de desenhos. Enquanto a paleta Propriedades está preocupada com as propriedades do objeto, a paleta DesignCenter lida principalmente com objetos nomeados: camadas, tipos de linha, definições de bloco (isto é, símbolo), estilos de texto e outros objetos organizacionais ...

Zoom e Panning no AutoCAD - dummies

Zoom e Panning no AutoCAD - dummies

O AutoCAD facilita a panorâmica, oferecendo barras de rolagem e panning em tempo real. Na panorâmica em tempo real (em oposição à panorâmica de finalização), você pode ver objetos movendo-se na tela enquanto você arrasta o mouse para cima e para baixo ou para frente e para trás. Claro, o ponto de vista está em movimento, não os objetos. Tanto a panorâmica quanto o zoom mudam a visualização ...