Vídeo: Aprenda a identificar Dados Faltantes no R 2024
Para análise preditiva, você precisa carregar os dados para seus algoritmos para usar. Carregar o conjunto de dados Iris no scikit é tão simples como emitir um par de linhas de código porque Scikit já criou uma função para carregar o conjunto de dados.
Comprimento Sepal | Largura Sepal | Comprimento da pétala | Largura da pétala | Classe alvo / Etiqueta |
---|---|---|---|---|
5. 1 | 3. 5 | 1. 4 | 0. 2 | Setosa (0) |
7. 0 | 3. 2 | 4. 7 | 1. 4 | Versicolor (1) |
6. 3 | 3. 3 | 6. 0 | 2. 5 | Virginica (2) |
-
Abra uma nova sessão de shell interativa do Python.
Use uma nova sessão de Python para que não haja mais nada na memória e você tenha uma ardósia limpa para trabalhar.
-
Digite o seguinte código no prompt e observe a saída: >>>> da sklearn. datasets import load_iris >>> iris = load_iris ()
Depois de executar essas duas instruções, você não deve ver nenhuma mensagem do intérprete. A íris variável deve conter todos os dados da íris. arquivo csv.
A saída será todo o conteúdo da íris. arquivo csv, juntamente com algumas outras informações sobre o conjunto de dados que a função load_iris carregou na variável. A variável é uma estrutura de dados do dicionário com quatro propriedades principais. As propriedades importantes da íris estão listadas abaixo.
Nome da propriedade
Descriçãodados | Contém todas as medidas das observações. |
---|---|
feature_name | Contém o nome do recurso (nome do atributo). |
target | Contém todos os alvos (rótulos) das observações. |
target_names | Contém os nomes das classes. |
Você pode imprimir os valores no intérprete digitando o nome da variável seguido pelo ponto seguido do nome da propriedade. Um exemplo é usar íris. dados para acessar a propriedade da íris, assim: >>>> íris. dados | Esta é uma maneira padrão de acessar propriedades de um objeto em muitas linguagens de programação. |
Para criar uma instância do classificador SVM, digite o seguinte código na interpretação: >>>> da sklearn. svm import LinearSVC >>> svmClassifier = LinearSVC (random_state = 111)
A primeira linha de código importa a biblioteca SVC linear na sessão. O linear Support Vector Classifier (SVC) é uma implementação do SVM para classificação linear e tem suporte a várias classes.O conjunto de dados é um tanto linearmente separável e tem três classes, então seria uma boa idéia experimentar com o SVC Linear para ver como ele funciona.
A segunda linha cria a instância usando o variável svmClassifier. Esta é uma variável importante a lembrar. O parâmetro random_state permite que você reproduza esses exemplos e obtenha os mesmos resultados. Se você não colocou o parâmetro random_state, seus resultados podem ser diferentes dos mostrados aqui.