Vídeo: Tidyverse - Pacotes para ciência de dados no R (Curso R para Machine Learning - Aula 4) 2025
No campo das estatísticas, poder distinguir entre variáveis de diferentes tipos são muito importantes. O tipo de dados muitas vezes determina o tipo de análise que pode ser realizada. Como resultado, R oferece a capacidade de classificar explicitamente os dados da seguinte forma:
-
Dados nominais: Esse tipo de dados, que você representa em fatores de R usando, distingue entre diferentes categorias, mas não existe uma ordem implícita entre categorias. Exemplos de dados nominais são cores (vermelho, verde, azul), gênero (masculino, feminino) e nacionalidade (britânico, francês e japonês).
-
Dados ordinais: Os dados ordinais se distinguem pelo fato de que existe algum tipo de ordem natural entre elementos, mas nenhuma indicação da diferença de tamanho relativa. Qualquer tipo de dados que é possível classificar em ordem, mas não fornecer valores exatos, é ordinal. Por exemplo, baixo << médio << alto descreve dados ordenados com três níveis. Na pesquisa de mercado, é muito comum usar uma escala de cinco pontos para medir percepções: discorda fortemente
vermelhoEste é também um exemplo de dados ordinais.
para indicar o status do projeto. Em R, você usa fatores pedidos para descrever dados ordinais. Dados numéricos: Você tem dados numéricos quando você pode descrever seus dados com números (por exemplo, comprimento, peso ou contagem). Os dados numéricos possuem duas subcategorias.
-
Dados escalonados por intervalos: Você possui dados com escala de intervalo quando o intervalo entre unidades de medida adjacentes é o mesmo, mas o ponto zero é arbitrário. Um exemplo cotidiano de dados escalados por intervalos é o nosso sistema de calendário. Cada ano tem o mesmo comprimento, mas o ponto zero é arbitrário. Em outras palavras, o tempo não começou no ano zero - simplesmente use um ano conveniente para começar a contar. Isso significa que você pode adicionar e subtrair datas (e todos os outros tipos de dados escalados por intervalos), mas você não pode dividir significativamente as datas. Outros exemplos incluem longitude, bem como qualquer outra coisa em que possa haver desacordo sobre o ponto de partida.
-
inteiros
ou objetos numéricos para representar dados escalonados em intervalos. Dados dimensionados de proporção: Este é o dado onde todos os tipos de operações matemáticas são permitidos, em particular a capacidade de se multiplicar e dividir (em outras palavras, tomar as proporções).A maioria dos dados em ciências físicas é dimensionada, por exemplo, comprimento, massa e velocidade. Em R, você usa
-
objetos numéricos para representar dados dimensionados.
-