Vídeo: Machine Learning (Aula 7) - Modelos de Predição 2024
Para executar uma análise preditiva, você deve obter os dados em uma forma que o algoritmo pode usar para construir um modelo. Para fazer isso, você precisa levar algum tempo para entender os dados e conhecer sua estrutura. Digite a função para descobrir a estrutura dos dados. Veja o que parece: >> str (sementes) 'dados. quadro ': 210 obs. de 8 variáveis: $ V1: num 15. 3 14. 9 14. 3 13. 8 16. 1 … $ V2: num 14. 8 14. 6 14. 1 13. 9 15 … $ V3: num 0. 871 0 881 0. 905 0. 895 0. 903 … $ V4: num 5. 76 5. 55 5. 29 5. 32 5. 66 … $ V5: num 3. 31 3. 33 3. 34 3. 38 3. 56 … $ V6: num 2. 22 1. 02 2. 7 2. 26 1. 35 … $ V7: num 5. 22 4. 96 4. 83 4. 8 5. 17 … $ V8: int 1 1 1 1 1 1 1 1 1 1 …
Ao analisar a estrutura, você pode dizer que os dados precisam de um passo de pré-processamento e uma etapa de conveniência:
-
Isso não é estritamente necessário, mas para os propósitos deste exemplo, é mais conveniente usar nomes de colunas que você possa entender e lembrar. Mude o atributo com valores categóricos para um fator.
-
O rótulo possui três categorias possíveis. Para renomear as colunas, digite o seguinte código: >> colnames (seeds) <-
c ("área", "perímetro", "compacidade", "comprimento", "largura", " assimetria "," length2 "," seedType ")
Em seguida, altere o atributo que tem valores categóricos para um fator. O código a seguir altera o tipo de dados para um fator:
>> seeds $ seedType <- factor (seeds $ seedType)
Este comando termina a preparação dos dados para o processo de modelagem. O seguinte é uma visão da estrutura após o processo de preparação de dados: >> str (weeds) 'dados. quadro ': 210 obs. de 8 variáveis: $ área: num 15. 3 14. 9 14. 3 13. 8 16. 1 … $ perímetro: num 14. 8 14. 6 14. 1 13. 9 15 … $ compactação: num 0. 871 0 881 0. 905 0. 895 0. 903 … $ length: num 5. 76 5. 55 5. 29 5. 32 5. 66 … $ width: num 3. 31 3. 33 3. 34 3. 38 3. 56 … $ assimetria: num 2. 22 1. 02 2. 7 2. 26 1. 35 … $ length2: num 5. 22 4. 96 4. 83 4. 8 5. 17 … $ seedType: Factor w / 3 levels "1", "2", "3": 1 1 1 1 1 1 1 1 1 1 …