Vídeo: Validação de Dados no Excel - Aula 01 (Números inteiros e decimais) 2024
Os dados são armazenados de diferentes maneiras em diferentes sistemas. Portanto, não é nenhuma surpresa que ao coletar e consolidar dados de várias fontes, é possível que as duplicatas apareçam. Em particular, o que torna um registro individual único é diferente para diferentes sistemas.
Um resumo da conta de investimento é anexado a um número de conta. Um resumo do portfólio pode ser armazenado em um nível individual ou familiar. E as histórias de negociação de todas essas contas são armazenadas no nível de transação individual.
É importante ter claro sobre o que é suposto diferenciar registros exclusivos em seu arquivo de dados. Por exemplo, se for um arquivo de nível de transação, os números de conta e os IDs de família serão duplicados. Enquanto você entender isso e estiver fazendo uma análise de nível de transação, você estará bem.
Mas se você estiver interessado em usar esses dados para analisar o número de contas detidas por cada família, você terá problemas. As famílias que comercializam com mais freqüência terão mais registros do que aqueles que não trocam muito. Você precisa ter um arquivo no nível da conta.
A remoção de registros duplicados não é particularmente difícil. A maioria dos pacotes estatísticos e sistemas de banco de dados possuem comandos internos que agrupam registros juntos. (Na verdade, na linguagem de banco de dados SQL, este comando é chamado de Grupo por.)