Vídeo: Profissão: Banco de Dados #TOTVSGEEKS 2024
Os dados coletados no passado foram estruturados e podem caber em linhas e colunas limpas. Um exemplo disso seria uma planilha de Excel com dados delimitados (dados separados por um caractere específico, como uma vírgula). A maioria dos especialistas em informações internas se contentou em exibir esses dados (como registros de clientes) em planilhas longas. Eles foram encarregados de relatar o que os dados disseram, e todos usaram os mesmos resultados.
Com dados estruturados, não houve oportunidade de visualizar a história que os dados diziam para extrair informações valiosas. Os dados não foram interativos e não permitiram a personalização. Era valioso para um ponto, mas não havia como entender o que o cliente pensava sobre o produto depois de comprá-lo. Você só saberia que o produto tinha sido comprado. E esses dados são apenas uma parte do quebra-cabeça.
Hoje, as empresas enfrentam uma montanha de um novo tipo de dados: dados não estruturados, que nem sempre vem em um pacote limpo. Seguem-se alguns exemplos deste tipo de dados:
-
Opiniões: As opiniões são recolhidas por sites de revisão como a de Yelp, mostrados na figura a seguir. Você pode acessar as avaliações diretamente ou usar uma ferramenta que raspe os dados do site para que você possa colocar esses dados em sua própria ferramenta de dados.
-
Visuals: Os visuais são escolhidos pelos usuários de sites como o Pinterest, mostrado na figura abaixo. No caso da Pinterest, você pode acessar o site para ver quais imagens sobre e por sua empresa foram marcadas pelos clientes que estão procurando o nome da sua empresa. Você pode ter dados sobre quais pinos que sua empresa colocou no Pinterest estão sendo reafirmados por outros, bem como dados sobre pessoas que viram o produto ou a imagem da sua empresa em outros lugares da web e o colocaram diretamente em Pinterest para que outros pudessem encontrar.
-
Dados de smartphone: Os registros de telefone, e-mails e outros dados de pesquisa estão disponíveis no seu telefone.
Este conteúdo não estruturado representa dados incrivelmente valiosos para qualquer negócio on-line. A chave para usar os dados é utilizar programas de software (como SAP) que permitem combinar dados estruturados com dados não estruturados para obter uma maior compreensão do negócio e seus clientes. A partir desta análise, as empresas podem começar a fazer previsões sobre o comportamento do cliente e a geração de receita.
Normalmente, as organizações que usam dados não estruturados usam software de processamento de linguagem natural para analisá-lo.