Vídeo: O uso do Big Data nas empresas 2024
A modelagem de risco é outro caso importante de uso que é ativado pela Hadoop. Você achará que ele combina com o caso de detecção de fraude em que é uma disciplina baseada em modelos. Quanto mais dados você tiver e quanto mais você pode "conectar os pontos", mais frequentemente seus resultados renderão melhores modelos de previsão de risco.
A expressão abrangente risco pode assumir muitos significados. Por exemplo, a previsão do churn do cliente é o risco de um cliente se mudar para um concorrente; o risco de um livro de empréstimo se refere ao risco de inadimplência; O risco nos cuidados de saúde abrange a gama desde a contenção de surtos até a segurança alimentar até a probabilidade de reinfecção e muito mais.
O setor de serviços financeiros (FSS) agora está investindo fortemente na modelagem de risco baseada em Hadoop. Este setor procura aumentar a automação e a precisão de sua avaliação de risco e modelagem de exposição.
A Hadoop oferece aos participantes a oportunidade de ampliar os conjuntos de dados que são usados em seus modelos de risco para incluir fontes subutilizadas (ou fontes que nunca são utilizadas), como e-mail, mensagens instantâneas, mídias sociais e interações com o serviço ao cliente representantes, entre outras fontes de dados.
Os modelos de risco no FSS aparecem em todos os lugares. Eles são usados para prevenção de churn dos clientes, modelagem de manipulação comercial, análise corporativa de risco e exposição, e muito mais.
Quando uma empresa emite uma apólice de seguro contra desastres naturais em casa, um desafio é claramente ver quanto dinheiro está potencialmente em risco. Se a seguradora não reservar dinheiro para possíveis pagamentos, os reguladores irão intervir (a seguradora não quer isso); se a seguradora colocar muito dinheiro em suas reservas para pagar as reivindicações de políticas futuras, eles não podem então investir seu dinheiro premium e obter lucro (a seguradora também não quer isso).
Algumas empresas são "cegas" ao risco que enfrentam porque não conseguiram executar uma quantidade adequada de simulações catastróficas relativas à variação na velocidade do vento ou nas taxas de precipitação (entre outras variáveis) à medida que elas se relacionam para sua exposição.
Simplesmente, essas empresas têm dificuldade em testar o estresse em seus modelos de risco. A capacidade de dobrar mais dados - por exemplo, padrões climáticos ou a distribuição socioeconômica em constante mudança de sua base de clientes - lhes proporciona uma visão e capacidade muito maiores quando se trata de construir melhores modelos de risco.
Modelos de risco de construção e testes de estresse como o que acabamos de descrever é uma tarefa ideal para o Hadoop. Essas operações geralmente são computacionalmente caras e, quando você está construindo um modelo de risco, é provável que não seja executado em um data warehouse, por estas razões:
-
O depósito provavelmente não está otimizado para os tipos de consultas emitidas pelo modelo de risco.(O Hadoop não está vinculado pelos modelos de dados usados nos data warehouses.)
-
Um grande trabalho ad hoc, como um modelo de risco em evolução, adicionaria carga ao armazém, influenciando as aplicações analíticas existentes. (Hadoop pode assumir esta carga de trabalho, liberando o armazém para relatórios de negócios regulares.)
-
Modelos de risco mais avançados podem ter como fator em dados não estruturados, como texto em bruto. (Hadoop pode lidar com essa tarefa de forma eficiente.)