Lar Finanças Pessoais Dados estruturados em um grande ambiente de dados - dummies

Dados estruturados em um grande ambiente de dados - dummies

Índice:

Vídeo: FIA | Origem e Aplicação do Big Data 2025

Vídeo: FIA | Origem e Aplicação do Big Data 2025
Anonim

O termo dados estruturados geralmente se refere a dados que possuem um comprimento definido e um formato para grandes dados. Exemplos de dados estruturados incluem números, datas e grupos de palavras e números chamados strings . A maioria dos especialistas concorda que este tipo de dados representa cerca de 20% dos dados que estão lá fora. Os dados estruturados são os dados que você provavelmente usa para lidar. Geralmente é armazenado em um banco de dados.

Fontes de dados grandes estruturados

Embora isso possa parecer comercial como de costume, na realidade, os dados estruturados estão assumindo um novo papel no mundo dos grandes dados. A evolução da tecnologia fornece fontes mais recentes de dados estruturados que estão sendo produzidos - muitas vezes em tempo real e em grandes volumes. As fontes de dados são divididas em duas categorias:

  • Computador ou gerado por máquina: Os dados gerados por máquina geralmente se referem a dados criados por uma máquina sem intervenção humana.

  • Gerados por humanos: Este é um dado que os seres humanos, em interação com computadores, fornecem.

Alguns especialistas argumentam que existe uma terceira categoria que é um híbrido entre a máquina e o humano. No entanto, estamos preocupados com as duas primeiras categorias.

Os dados estruturados gerados por máquina podem incluir o seguinte:

  • Dados do sensor: Os exemplos incluem tags de ID de radiofrequência, medidores inteligentes, dispositivos médicos e dados do Sistema de Posicionamento Global. As empresas estão interessadas nisso para gerenciamento de cadeia de suprimentos e controle de estoque.

  • dados de log da web: Quando servidores, aplicativos, redes e assim por diante operam, capturam todos os tipos de dados sobre sua atividade. Isso pode representar enormes volumes de dados que podem ser úteis, por exemplo, para lidar com acordos de nível de serviço ou para prever brechas de segurança.

  • Dados do ponto de venda: Quando o caixa roda o código de barras de qualquer produto que você está comprando, todos os dados associados ao produto são gerados.

  • Dados financeiros: Muitos sistemas financeiros são agora programáticos; Eles são operados com base em regras predefinidas que automatizam os processos. Os dados de estoque de negociação são um bom exemplo disso. Contém dados estruturados, como o símbolo da empresa e o valor do dólar. Alguns desses dados são gerados por máquina, e alguns são gerados por humanos.

Exemplos de dados gerados por humanos estruturados podem incluir o seguinte:

  • Dados de entrada: Este é qualquer dado que um ser humano pode inserir em um computador, como nome, idade, renda, não-livre - responde as respostas da pesquisa, e assim por diante. Esses dados podem ser úteis para entender o comportamento básico do cliente.

  • Dados do clique: Os dados são gerados toda vez que você clica em um link em um site. Estes dados podem ser analisados ​​para determinar o comportamento do cliente e os padrões de compra.

  • Dados relacionados ao jogo: Cada movimento que você faz em um jogo pode ser gravado. Isso pode ser útil para entender como os usuários finais se movem através de um portfólio de jogos.

Quando tomado em conjunto com milhões de outros usuários que enviam a mesma informação, o tamanho é astronômico. Além disso, grande parte desses dados tem um componente em tempo real que pode ser útil para entender os padrões que têm o potencial de prever resultados.

A linha inferior é que esse tipo de informação pode ser poderosa e pode ser utilizada para muitas finalidades.

O papel dos bancos de dados relacionais em dados grandes

A persistência de dados refere-se a como um banco de dados retém versões de si mesmo quando modificado. O grande avô de lojas de dados persistentes é o sistema de gerenciamento de banco de dados relacional . Em sua infância, a indústria de computação usou o que agora são considerados técnicas primitivas para a persistência de dados.

O modelo relacional foi inventado por Edgar Codd, um cientista da IBM, na década de 1970 e utilizado pela IBM, Oracle, Microsoft e outros. Ainda está em grande uso hoje e desempenha um papel importante na evolução dos grandes dados. Compreender o banco de dados relacional é importante porque outros tipos de bancos de dados são usados ​​com grandes dados.

Em um modelo relacional, os dados são armazenados em uma tabela. Esta base de dados conteria um esquema - ou seja, uma representação estrutural do que está no banco de dados. Por exemplo, em um banco de dados relacional, o esquema define as tabelas, os campos nas tabelas e as relações entre os dois.

Os dados são armazenados em colunas, um cada para cada atributo específico. Os dados também são armazenados na linha. A primeira tabela armazena informações do produto; o segundo armazena informação demográfica. Cada um tem vários atributos. Cada tabela pode ser atualizada com novos dados, e os dados podem ser excluídos, lidos e atualizados. Isso geralmente é realizado em um modelo relacional usando uma linguagem de consulta estruturada (SQL).

Outro aspecto do modelo relacional usando SQL é que as tabelas podem ser consultadas usando uma chave comum. A chave comum nas tabelas é CustomerID.

Você pode enviar uma consulta, por exemplo, para determinar o gênero dos clientes que compraram um produto específico. Pode parecer algo assim:

Selecione CustomerID, State, Gender, Product from "demographic table", "product table" onde Product = XXYY
Dados estruturados em um grande ambiente de dados - dummies

Escolha dos editores

Noções básicas do arquivo de dados Flashback da Oracle 12c - dummies

Noções básicas do arquivo de dados Flashback da Oracle 12c - dummies

O Flashback Data Archive do oracle 12c é um mecanismo de banco de dados que permite que você para armazenar periodicamente ou indefinidamente todas as versões de linha em uma tabela ao longo da sua vida útil. Você pode então escolher uma hora para ver os dados como existia em um ponto específico. Esteja ciente de que o Flashback Data Archive é um recurso licenciado. ...

Noções básicas de clusters de aplicativos reais do Oracle 12c - manequins

Noções básicas de clusters de aplicativos reais do Oracle 12c - manequins

Se você visitou os sites da Oracle nos últimos 12 anos , você viu o byline de marketing: "Inquebrável. "Essa linha de tag refere-se ao recurso Real Application Clusters (RAC). Claro, muitos elementos estão envolvidos, mas o RAC tem o destaque. O RAC é a solução de clustering de banco de dados Oracle. Em certo sentido, funciona na teoria de que ...

Noções básicas de Redo Log Files no Oracle 12c - dummies

Noções básicas de Redo Log Files no Oracle 12c - dummies

Redo os arquivos de log armazenam as informações do buffer de log no banco de dados Oracle 12c. Eles são escritos pelo Log Writer (LGWR). Mais uma vez, você não pode ler esses arquivos binários sem a ajuda do software de banco de dados. Normalmente, os arquivos de reto de log são nomeados com a extensão. LOG ou. RDO. Pode ser qualquer coisa que você queira, ...

Escolha dos editores

São orgasmos ok durante a gravidez? - Dummies

São orgasmos ok durante a gravidez? - Dummies

As mulheres grávidas não só têm permissão para fazer sexo, mas muitas vezes o desejam. Mas é bom aproveitar a relação sexual com o ponto do orgasmo? Afinal, os orgasmos são nada mais do que contrações - e as pessoas sugeriram que isso poderia desencadear mão-de-obra. Isso é apenas um mito. De fato, grávida ...

Alimentando a Multidão em uma Reunião Familiar - manequins

Alimentando a Multidão em uma Reunião Familiar - manequins

Cozinhando uma refeição para um grande grupo (reunião familiar ou de outra forma ) requer planejamento e resistência. Aqui está um guia útil para quantidades de alimentos e segurança alimentar, e conselhos sobre a organização de uma festa de potluck. Planejando para potlucks A forma mais comum de comestibles de grupo é uma festa de potluck - qual é a maneira mais barata e fácil de ...

Anatomia do Penis humano - dummies

Anatomia do Penis humano - dummies

Sabendo como as funções de um pénis podem fornecer uma visão útil do sexo e do corpo humano - se você quer entender o pénis e a anatomia masculina melhor ou aprender sobre isso pela primeira vez. Basicamente, um pênis é composto de três estruturas, que são feitas de um material esponjoso que pode preencher com sangue: ...

Escolha dos editores

Como lidar com outliers causados ​​por Forças externas - manequins

Como lidar com outliers causados ​​por Forças externas - manequins

Certifique-se de verificar atentamente os outliers antes eles influenciam sua análise preditiva. Os outliers podem distorcer a análise de dados e dados. Por exemplo, qualquer análise estatística feita com dados que deixa outliers no lugar acaba por desviar os meios e variâncias. Os outliers não controlados ou mal interpretados podem levar a conclusões falsas. Diga os seus dados que ...

Como criar um modelo de análise preditiva com regressão R - manequins

Como criar um modelo de análise preditiva com regressão R - manequins

Você deseja criar um preditivo modelo de análise que você pode avaliar usando resultados conhecidos. Para fazer isso, vamos dividir nosso conjunto de dados em dois conjuntos: um para treinar o modelo e outro para testar o modelo. Uma divisão 70/30 entre treinamento e testes de conjuntos de dados será suficiente. As próximas duas linhas de código ...

Como definir objetivos de negócios para um modelo de análise preditiva - dummies

Como definir objetivos de negócios para um modelo de análise preditiva - dummies

Um modelo de análise preditiva visa resolvendo um problema comercial ou realizando um resultado comercial desejado. Esses objetivos comerciais se tornam os objetivos do modelo. Conhecer aqueles garante o valor comercial do modelo que você constrói - o que não deve ser confundido com a precisão do modelo. Hipotéticamente, você pode construir um modelo preciso para ...