Vídeo: Bancos de Dados - Aula 04 – Modelo Entidade - Relacionamento estendido 2024
Resumindo dados, encontrando totais e calculando médias e outras medidas descritivas provavelmente não são novidades para você. Quando você precisa de seus resumos na forma de novos dados, em vez de relatórios, o processo é chamado de agregação. Os dados agregados podem se tornar a base para cálculos adicionais, combinados com outros conjuntos de dados, usados de qualquer maneira que outros dados sejam usados.
Aqui está um exemplo de um processo de agregação de dados. Um conjunto de dados contém informações gerais sobre mais de 160 000 parcelas de imóveis. Estes dados incluem uma variedade de usos da terra. E se você gostaria de ver o valor médio avaliado para a terra em cada categoria de uso da terra? Veja como você faria isso.
Você encontraria a ferramenta de agregação de dados em seu aplicativo de mineração de dados. Você pode usar a pesquisa para encontrá-lo.
Você adicionaria a ferramenta a um processo e conectá-lo a um conjunto de dados de origem.
Na ferramenta de agregação de dados, você escolheria uma variável de agrupamento. Neste caso, é a variável Land Use, C_A_CLASS.
Então você definiu os resumos que deseja. Para obter o valor médio avaliado da terra, você selecionará a variável com as avaliações para resumir e escolher a função média.
Quando a agregação é executada, o resultado é um novo conjunto de dados, com uma linha para cada tipo de uso do solo e uma nova variável para as médias calculadas.
Mais cedo ou mais tarde, você precisará agregar todo um conjunto de dados. Mas quando você quer total ou médio todos os dados em um conjunto de dados, você pode encontrar um problema: qual a sua variável de agrupamento? O truque é usar uma variável com um valor constante para todo o conjunto de dados. Então, crie uma variável onde cada valor seja o mesmo e use-o como sua variável de agrupamento.