Vídeo: Dica Rápida #11 - Como Formatar DVD-RW de Forma Correta 2024
Os seres humanos usam a experiência quando interpretam os dados que vêem, mas os computadores não podem. Seu software de mineração de dados fará o melhor para identificar o tipo de dados em cada coluna, mas os tipos de dados são muitas vezes ambíguos.
Quando você vê uma lista de códigos ZIP, não tenta adicioná-los e subtraí-los. Você sabe que eles representam lugares. Você entende isso porque você tem muita experiência vendo e reconhecendo códigos ZIP. Um computador pode interpretar um CEP como medida inteira ou contínua. No final, depende de você definir o formato adequado.
As funções para a configuração de formatos de dados e funções (como denotar a variável dependente para modelagem) podem ser enterradas em diversos locais em seu aplicativo de mineração de dados. Você pode definir os formatos e o papel das variáveis dentro de um arquivo de dados antes mesmo de abrir um aplicativo de mineração de dados (os formatos de dados nativos para Orange e Weka permitem isso), como parte da importação ou algum tempo depois no processo.
Você pode ter ferramentas criadas para este propósito, como as ferramentas mostradas nas figuras a seguir, ou você pode definir essas propriedades dentro de outros procedimentos.
Cada aplicativo de mineração de dados possui seu próprio conjunto de tipos variáveis e seus próprios limites sobre como cada tipo pode ser usado. Alguns desses limites são baseados na teoria. Por exemplo, você só pode adicionar e subtrair números, não letras. Mas outros podem ser apenas uma questão de como o aplicativo foi projetado.
Assim, por exemplo, você pode achar que uma determinada ferramenta de modelagem em um aplicativo permite que você preveja variáveis categóricas e contínuas, mas uma ferramenta similar em outra aplicação pode permitir a modelagem de apenas uma ou outra.