Vídeo: Challenges in data governance: Harnessing big data for a competitive business advantage 2024
A governança de dados é importante para sua empresa, não importa quais são suas principais fontes de dados ou como elas são gerenciadas. No mundo tradicional dos data warehouses ou do gerenciamento de banco de dados relacional, é provável que sua empresa tenha regras bem compreendidas sobre como os dados precisam ser protegidos.
Por exemplo, no mundo da saúde, é fundamental manter os dados dos pacientes privados. Você pode armazenar e analisar dados sobre pacientes, desde que nomes, números da Segurança Social e outros dados pessoais sejam mascarados. Você precisa se certificar de que pessoas não autorizadas não podem acessar dados privados ou restritos.
O que acontece quando você inunda seu ambiente com grandes fontes de dados que vêm de uma variedade de fontes? Algumas dessas fontes provêm de fornecedores comerciais de terceiros que examinaram cuidadosamente os dados e mascararam dados confidenciais.
No entanto, é bastante provável que as grandes fontes de dados possam ser inseguras e desprotegidas e incluir uma grande quantidade de dados pessoais. Durante o processamento inicial desses dados, você provavelmente irá analisar muitos dados que não serão relevantes para sua organização. Portanto, você não quer investir recursos para proteger e governar dados que você não pretende manter.
Se os dados pessoais confidenciais passarem pela sua rede, você pode expor a sua empresa a requisitos de conformidade imprevistos. Para dados que são verdadeiramente exploratórios, com conteúdo desconhecido, pode ser mais seguro realizar a análise inicial em um ambiente "paredes" interno, mas segmentado, ou na nuvem.
Finalmente, depois de decidir que um subconjunto desses dados será analisado mais profundamente para que os resultados possam ser incorporados ao seu processo de negócios, é importante instituir um processo de aplicação cuidadosa dos requisitos de governança para esses dados.
Quais problemas você deve considerar quando incorpora essas fontes não faturadas no seu ambiente? Considere o seguinte:
-
Determine de antemão quem tem permissão para acessar novas fontes de dados inicialmente, bem como depois que os dados foram analisados e entendidos.
-
Compreenda como esses dados serão segregados dos dados de outras empresas.
-
Compreenda qual é a sua responsabilidade de aproveitar os dados. Se os dados são de propriedade privada, você deve garantir que você aderisse a contratos ou regras de uso. Alguns dados podem ser vinculados a um contrato de uso com um fornecedor.
-
Compreenda onde seus dados estarão localizados fisicamente. Você pode incluir dados vinculados a clientes ou prospects em países específicos que possuem requisitos de privacidade rígidos.Você precisa estar ciente dos detalhes dessas fontes para evitar violar os regulamentos.
-
Compreenda como os seus dados precisam ser tratados se ele for movido fisicamente de um local para outro. Você vai armazenar alguns desses dados com um provedor de nuvem? Que tipo de promessas esse provedor oferecerá em termos de onde os dados serão armazenados e quão bem ele será protegido?
Apenas porque você criou um processo de segurança e governança para suas fontes de dados tradicionais não significa que você possa assumir que os funcionários e parceiros expandirão essas regras para novas fontes de dados. Você precisa considerar dois problemas principais: a visibilidade dos dados e a confiança daqueles que trabalham com os dados.
-
Visibilidade: Enquanto os analistas de negócios e os parceiros com quem você trabalha podem estar ansiosos para usar essas novas fontes de dados, talvez você não esteja ciente de como esses dados serão usados e controlados. Em outras palavras, você pode não ter controle sobre sua visibilidade em seus recursos que estão funcionando fora do seu controle.
Esta situação é especialmente problemática se você precisa garantir que seu provedor esteja seguindo regulamentos ou leis de conformidade. Isso também é verdade quando você está usando um provedor de nuvem para gerenciar esses dados porque o armazenamento pode ser muito barato para gerenciar.
-
Empregados sem receita: Embora a sua empresa possa passar por uma extensa verificação de antecedentes em todos os seus funcionários, agora confia que nenhum iniciante malicioso trabalha em várias unidades de negócios fora da TI. Você também deve assumir que seu provedor de nuvem verificou diligentemente seus funcionários.
Esta preocupação é real porque cerca de 50% das violações de segurança são causadas por insiders. Se sua empresa vai usar essas novas fontes de dados de forma altamente distribuída, você precisa ter um plano para lidar com ameaças externas e internas.
Você tem a responsabilidade de certificar-se de que suas novas fontes de dados grandes não abrem sua empresa para ameaças ou riscos de governança imprevistos. É sua responsabilidade ter boa segurança, processos de governança e educação em todo o seu ambiente de gerenciamento de informações.
Tal como acontece com qualquer ciclo de vida tecnológico, você precisa ter um processo para avaliar a capacidade da sua organização para atender a prontidão de todos os constituintes para atender aos requisitos de segurança e governança. Você já pode ter processos para segurança de dados, privacidade e governança em vigor para seus bancos de dados e data warehouses estruturados existentes. Esses processos precisam ser estendidos para sua grande implementação de dados.