Índice:
- Attensity for big data
- Clarabridge para grandes dados
- IBM para grandes dados
- OpenText para dados grandes
- SAS para dados grandes
Vídeo: TABELAS E GRÁFICOS - Estatística Descritiva - Vamos analisar as vendas 2024
Aqui está uma visão geral de alguns dos jogadores no mercado de dados de grande análise de texto. Alguns são pequenos, enquanto outros são nomes familiares. Alguns chamam o que eles fazem grande análise de texto de dados , , enquanto alguns apenas se referem a ele como análise de texto.
Attensity for big data
Attensity é uma das empresas de análise de texto originais que começaram a desenvolver e vender produtos há mais de dez anos. Neste momento, tem mais de 150 clientes empresariais e um dos maiores grupos de desenvolvimento de PNL do mundo. A Attensity oferece vários motores para análise de texto. Estes incluem Classificação Automática, Extração de Entidade e Extração Exaustiva. Exhaustive Extraction é a tecnologia principal da Attensity que extrai automaticamente fatos do texto analisado e organiza essa informação.
A empresa está focada em análise e envolvimento social e multicanal, analisando texto para relatórios de fontes internas e externas e, em seguida, roteando para usuários empresariais para o envolvimento. Ele recentemente comprou Biz360, uma empresa de mídia social que agrega enormes fluxos de mídias sociais. Desenvolveu um sistema de computação em grade que fornece recursos de alto desempenho para processar enormes quantidades de texto em tempo real.
Attensity usa um framework Hadoop para armazenar dados. Ele também possui um sistema de enfileiramento de dados que cria um processo de orquestração que reconhece picos em dados de entrada e ajusta processamento em servidores mais / menos, conforme necessário.
Clarabridge para grandes dados
Outro vendedor de análise de texto puro, o Clarabridge é, na verdade, um spin-off de uma empresa de consultoria de inteligência empresarial (chamada Claraview) que percebeu a necessidade de lidar com dados não estruturados. Seu objetivo é ajudar as empresas a gerar valor comercial mensurável, analisando o cliente de forma holística, identificando experiências e problemas chave e ajudando todos em uma organização a tomar ações e colaborar em tempo real.
Isso inclui a determinação em tempo real do sentimento e a classificação dos dados / texto do feedback do cliente e encenação do texto para processamento futuro no sistema Clarabridge.
Neste momento, a Clarabridge está oferecendo a seus clientes algumas características sofisticadas e interessantes, incluindo análise de causa raiz de um clique para identificar o que está causando uma mudança no volume de feeds de texto, sentimento ou satisfação associados a problemas emergentes. Ele também oferece sua solução como Software como Serviço (SaaS).
IBM para grandes dados
O gigante de software IBM oferece várias soluções no espaço de análise de texto sob seu guarda-chuva de Estratégia de Planeta Inteligente.Além do Watson e do IBM SPSS, a IBM também oferece o IBM Content Analytics com Enterprise Search. O IBM Content Analytics foi desenvolvido com base no trabalho realizado na IBM Research.
O IBM Content Analytics é usado para transformar o conteúdo em informações analisadas e está disponível para análises detalhadas, como a forma como os dados estruturados serão analisados em um conjunto de ferramentas de BI. O IBM Content Analytics e Enterprise Search eram dois produtos separados.
A solução convergente visa tanto a busca corporativa aprimorada que usa análise de texto, como também necessidades de análise de conteúdo autônomo. A ICAES possui uma estreita integração com a plataforma IBM InfoSphere BigInsights, permitindo coleções muito amplas de pesquisa e análise de conteúdo.
OpenText para dados grandes
A OpenText, uma empresa com sede em Canadá, é provavelmente mais conhecida por sua liderança em soluções de gerenciamento de informações empresariais. Sua visão gira em torno de gerenciar, garantir e extrair o valor dos dados não estruturados das empresas. Ele fornece o que significa "middleware semântico". "
Segundo a empresa, sua evolução da tecnologia semântica está enraizada em sua capacidade" para permitir análises em tempo real com alta precisão em grandes conjuntos de dados em idiomas, formatos e domínios da indústria. "A idéia por trás do middleware semântico é que a semântica pode ser exposta em diferentes níveis e trabalhar com diferentes tecnologias para resolver problemas de negócios.
Em outras palavras, a análise de texto pode ser ativada e utilizada quando necessário.
SAS para dados grandes
O SAS vem resolvendo complexos problemas de dados grandes há muito tempo. Vários anos atrás, comprou o vendedor de análise de texto Teragram para aprimorar sua estratégia para usar dados estruturados e não estruturados em análise e integrar esses dados para modelagem descritiva e preditiva. Agora, suas capacidades de análise de texto são parte de sua plataforma de análise geral e os dados de texto são vistos como simplesmente outra fonte de dados.
A SAS continua a inovar na área de análises de alto desempenho para garantir que o desempenho atenda às expectativas dos clientes. O objetivo é tomar problemas que costumavam levar semanas para resolver e resolvê-los em dias, ou problemas que costumavam levar dias para resolver e resolvê-los em minutos.
Por exemplo, o SAS High Performance Analytics Server é uma solução na memória que permite desenvolver modelos analíticos usando dados completos, e não apenas um subconjunto de dados agregados. O SAS diz que você pode usar milhares de variáveis e milhões de documentos como parte desta análise. A solução é executada nos appliances EMC Greenplum ou Teradata, bem como no hardware de commodities usando o Hadoop Distributed File System (HDFS).