Lar Finanças Pessoais Dados Mining for Big Data - dummies

Dados Mining for Big Data - dummies

Vídeo: Mineração de dados 2025

Vídeo: Mineração de dados 2025
Anonim

A mineração de dados envolve a exploração e análise de grandes quantidades de dados para encontrar padrões para grandes dados. As técnicas surgiram dos campos das estatísticas e da inteligência artificial (AI), com um pouco de gerenciamento de banco de dados jogado na mistura.

Geralmente, o objetivo da mineração de dados é classificação ou previsão. Na classificação, a idéia é classificar os dados em grupos. Por exemplo, um comerciante pode estar interessado nas características daqueles que responderam versus quem não respondeu a uma promoção.

Estas são duas classes. Na predição, a idéia é prever o valor de uma variável contínua. Por exemplo, um comerciante pode estar interessado em prever aqueles que responderão a uma promoção.

Os algoritmos típicos utilizados na mineração de dados incluem o seguinte:

  • Árvores de classificação: Uma técnica de mineração de dados popular que é usada para classificar uma variável categórica dependente com base em medidas de uma ou mais variáveis ​​preditoras. O resultado é uma árvore com nós e links entre os nós que podem ser lidos para formar se - então, regras.

  • Regressão logística: Uma técnica estatística que é uma variante da regressão padrão, mas amplia o conceito para lidar com a classificação. Ele produz uma fórmula que prediz a probabilidade da ocorrência como uma função das variáveis ​​independentes.

  • Redes neurais: Um algoritmo de software que é modelado após a arquitetura paralela dos cérebros dos animais. A rede consiste em nós de entrada, camadas ocultas e nós de saída. Cada unidade recebe um peso. Os dados são dados ao nó de entrada, e por um sistema de teste e erro, o algoritmo ajusta os pesos até encontrar um certo critério de parada. Algumas pessoas compararam isso com uma abordagem de caixa preta.

  • Técnicas de agrupamento como vizinhos K-mais próximos: Uma técnica que identifica grupos de registros similares. A técnica do vizinho mais próximo calcula as distâncias entre o registro e os pontos nos dados históricos (treinamento). Ele então atribui esse registro à classe de seu vizinho mais próximo em um conjunto de dados.

Aqui está um exemplo de árvore de classificação. Considere a situação em que uma companhia de telefone quer determinar quais clientes residenciais podem desconectar seu serviço.

A companhia telefônica possui informações que consistem nos seguintes atributos: quanto tempo a pessoa teve o serviço, quanto ele gasta no serviço, se o serviço tem sido problemático, quer ele tenha o melhor plano de chamada que ele precisa, onde ele vidas, quantos anos ele tem, se ele tem outros serviços agrupados, informações competitivas sobre outros planos de operadoras e se ele ainda tem o serviço.

Claro, você pode encontrar muitos outros atributos do que isso. O último atributo é a variável de resultado; Isto é o que o software usará para classificar os clientes em um dos dois grupos - talvez chamados de stayers e riscos de vôo.

O conjunto de dados é dividido em dados de treinamento e um conjunto de dados de teste. Os dados de treinamento consistem em observações (chamados atributos) e uma variável de resultado (binária no caso de um modelo de classificação) - neste caso, os stayers ou os riscos de vôo.

O algoritmo é executado sobre os dados de treinamento e vem com uma árvore que pode ser lida como uma série de regras. Por exemplo, se os clientes estiveram com a empresa há mais de dez anos e têm mais de 55 anos, é provável que permaneçam como clientes fiéis.

Essas regras são executadas em cima do conjunto de dados de teste para determinar o quão bom este modelo está em "novos dados". "As medidas de precisão são fornecidas para o modelo. Por exemplo, uma técnica popular é a matriz de confusão. Esta matriz é uma tabela que fornece informações sobre quantos casos foram corretamente contra incorretamente classificados.

Se o modelo parece ser bom, ele pode ser implantado em outros dados, pois está disponível (isto é, usá-lo para prever novos casos de risco de vôo). Com base no modelo, a empresa pode decidir, por exemplo, enviar ofertas especiais para aqueles clientes que acha que são riscos de vôo.

Dados Mining for Big Data - dummies

Escolha dos editores

Como criar um módulo HTML personalizado no Joomla - dummies

Como criar um módulo HTML personalizado no Joomla - dummies

Uma das grandes coisas sobre o Joomla é o quão incrivelmente flexível é. A instalação padrão do CMS inclui 23 módulos diferentes para ajudá-lo a fazer seu site funcionar sem problemas. Às vezes, no entanto, você pode querer adicionar uma função ao seu site que esses 23 módulos simplesmente não vão cobrir. Sob tais circunstâncias, você pode querer considerar ...

Como criar um item de menu no Joomla Content Management - manequins

Como criar um item de menu no Joomla Content Management - manequins

Um item de menu determina o layout dos artigos, que é um dos aspectos do Joomla para o qual você precisa se acostumar. As páginas da Web não existem fisicamente no Joomla - elas são apenas itens no seu banco de dados - até que a página seja acessada. Quando você abre um artigo, o Joomla tira os dados necessários do ...

Como criar um novo item de menu com o Joomla! 1. 6 - dummies

Como criar um novo item de menu com o Joomla! 1. 6 - dummies

Não estresse se você precisa criar um item de menu em sua página da Web interativa - é fácil ao usar o Joomla! Gerenciador de menu. Para adicionar itens de menu a um site existente, basta usar estas etapas: Escolha Menus → Gerenciador de menus para abrir o Gerenciador de menus. Clique no nome do menu que deseja adicionar um novo ...

Escolha dos editores

Obtendo Ajuda do Eclipse - dummies

Obtendo Ajuda do Eclipse - dummies

Com a complexidade do Java e a nuance do Eclipse, você não pode esperar para lembrar de tudo. Às vezes, você precisa de um pouco mais de ajuda do Eclipse para começar sua programação. Felizmente, o Eclipse oferece ajuda geral e sensível ao contexto: para ajuda sensível ao contexto: no Windows, pressione F1. No Linux, pressione Ctrl + F1. Em um Mac, pressione ...

Software gratuito: preenchimento automático de células no OpenOffice. org Calc - dummies

Software gratuito: preenchimento automático de células no OpenOffice. org Calc - dummies

OpenOffice. org - uma alternativa gratuita para o Microsoft Office - inclui Calc, uma planilha eletrônica semelhante ao Excel. O Calc fornece uma maneira fácil de criar automaticamente uma coluna ou linha de números em qualquer sequência que você especificar. Esse recurso de preenchimento automático é útil para criar listas numeradas ou preencher os cabeçalhos de colunas e linhas de tabelas, como ...

Acessos acessíveis no modo de exibição do Prezi - dummies

Acessos acessíveis no modo de exibição do Prezi - dummies

O prezi possui dois modos de operação diferentes: Modo de edição, no qual você crie sua apresentação e Show Mode, no qual você apresenta suas criações. No modo Show, use esses atalhos úteis para tornar sua apresentação ainda mais suave. Use esta como uma lista de verificação de prática antes de começar: Use esta função: Para fazer isso: Completo ...

Escolha dos editores

Elementos HTML básicos - dummies

Elementos HTML básicos - dummies

HyperText Markup Language (HTML) é o idioma da web, onde os elementos ditaram a formatação e o estilo do seu conteúdo. Os elementos HTML compõem a codificação baixada que você vê quando você acessa uma página da Web em seu navegador da Web (como Internet Explorer, Firefox ou Safari). Aqui estão alguns elementos básicos para você ...

Usando AutoCAD DesignCenter - dummies

Usando AutoCAD DesignCenter - dummies

DesignCenter é um nome tolo para uma paleta útil, se um pouco ocupada. A paleta DesignCenter é útil para dados de mineração de todos os tipos de desenhos. Enquanto a paleta Propriedades está preocupada com as propriedades do objeto, a paleta DesignCenter lida principalmente com objetos nomeados: camadas, tipos de linha, definições de bloco (isto é, símbolo), estilos de texto e outros objetos organizacionais ...

Zoom e Panning no AutoCAD - dummies

Zoom e Panning no AutoCAD - dummies

O AutoCAD facilita a panorâmica, oferecendo barras de rolagem e panning em tempo real. Na panorâmica em tempo real (em oposição à panorâmica de finalização), você pode ver objetos movendo-se na tela enquanto você arrasta o mouse para cima e para baixo ou para frente e para trás. Claro, o ponto de vista está em movimento, não os objetos. Tanto a panorâmica quanto o zoom mudam a visualização ...