A seguir, um trecho do white paper recente da Netskope, “Como projetar uma estratégia de proteção de dados em nuvem”, escrito por James Christiansen e David Fairman.
Etapa 1: saber onde os dados estão armazenados e localizados (também conhecido como Data Discovery)
Este é o processo de descobrir/detecta /localizar todos os dados estruturados e não estruturados que uma organização possui. Esses dados podem ser armazenados em hardware da empresa (endpoints, bancos de dados), BYOD de funcionários ou na nuvem.
Existem muitas ferramentas disponíveis para auxiliar no data discovery (tanto em trânsito quanto em armazenamento) e elas variam entre dados locais e relacionados à nuvem. Este processo visa garantir que nenhum dado fique desconhecido e desprotegido. Este é o ponto essencial da criação de uma abordagem centrada em dados para a proteção de dados, à medida que uma organização cria um inventário de todos os seus dados. Este inventário é um input crítico para uma estratégia e prática mais ampla de governança de dados.
Os ativos de informação mudam constantemente e novos ativos são adicionados, o que tornará qualquer lista estática desatualizada e ineficaz quase imediatamente. Ao estabelecer o processo de data discovery, certifique-se de usar automação. É a única maneira de você manter uma visão ativa das suas informações e ser capaz de gerenciar o risco com eficácia.
Etapa 2: Conheça a sensibilidade dos dados (também conhecida como Data Classification, ou Classificação de Dados)
Depois que os dados são descobertos, eles precisam ser classificados. Classificação de dados é o processo de analisar o conteúdo dos dados, pesquisar PII, PHI e outros dados confidenciais e classificá-los de acordo. Uma abordagem comum é ter 3 ou 4 níveis de classificação, normalmente:
Política de 3 níveis:
- Público
- Privado/Uso Interno
- Confidencial
Política de 4 níveis:
- Público
- Privado/Uso Interno
- Confidencial
- Altamente confidencial/Restrito
Uma vez que uma política é criada, os próprios dados precisam ser marcados nos metadados (esta é a implementação da política de classificação de dados). Tradicionalmente, esse tem sido um processo complexo e frequentemente impreciso. Exemplos de abordagens tradicionais são:
- Baseado em regras
- RegEx, correspondência de palavra-chave, dicionários
- Impressão digital e proteção IP
- Exact Data Match
- Reconhecimento Ótico de Caracteres
- Cobertura de conformidade
- Gerenciamento de exceções
As abordagens para classificação de dados evoluíram e as organizações devem aproveitar novos recursos se quiserem realmente classificar o grande volume de dados que criam e possuem. Alguns exemplos são:
- Classificação e análise de documentos com base em machine learning (ML), incluindo a capacidade de treinar modelos e classificadores usando seus próprios conjuntos de dados usando classificadores predefinidos de ML (tornando isso simples para as organizações criarem classificadores sem a necessidade de habilidades complexas de ciência de dados). (Veja esta análise de Netskope.)
- Processamento de linguagem natural (PLN)
- Análise de Contexto
- Análise e classificação de imagens
- Redação e privacidade
Essas abordagens devem ter a capacidade de oferecer suporte a serviços nativos de nuvem baseados em API para classificação automatizada e integração de processos. Isso permite que a organização construa uma capacidade básica para usar processos e tecnologia juntos, incluindo modelos, para classificar dados que se tornam um data point em inspeção adicional, se necessário. O resultado é fornecer uma capacidade de classificação automatizada em tempo real.
O escalonamento e desescalonamento da classificação é um método comumente usado para classificar todos os dados descobertos. Para cada objeto de dados que não foi classificado, uma classificação padrão deve ser aplicada injetando nos metadados o nível padrão de classificação (por exemplo, se não classificado, padrão para confidencial ou altamente confidencial). Com base em vários testes ou critérios, a classificação do objeto pode ser gradualmente aumentada ou diminuída para o nível apropriado. Isso coincide com muitos princípios do Zero Trust, que está rapidamente se tornando um recurso fundamental para qualquer estratégia de proteção de dados.
(Mais informações sobre Zero Trust podem ser encontradas no artigo da Netskope “O que é Zero Trust Security?“)
Uma nota sobre a determinação das “joias da coroa” e priorização
A classificação de dados ajuda muito uma organização a identificar suas “joias da coroa”. Para o propósito desta conversa, “joias da coroa” são definidas como os ativos que acessam, armazenam, transferem ou apagam os dados mais importantes e relevantes para a organização. Adotando uma abordagem centrada em dados, é fundamental compreender os dados mais importantes, avaliando a sensibilidade e a criticidade. Essa determinação não é conduzida apenas pela classificação de dados.
Um modelo prático para determinar a importância dos dados é levar em consideração três pilares de segurança—Classificação, Integridade e Disponibilidade—com cada um atribuído a um peso (1-4) alinhado às políticas ou padrões relacionados. Uma pontuação total de 12 (4 + 4 + 4) para qualquer objeto de dados indicaria que os dados são altamente confidenciais, têm altos requisitos de integridade e precisam estar altamente disponíveis.
Aqui está um exemplo de sistemas típicos em uso por uma empresa e ponderações típicas.
Classificação: Altamente confidencial = 4 Confidencial = 3 Uso Interno = 2 Público = 1 | Integridade: Alta integridade = 4 Média integridade = 3 Baixa integridade = 2 Nenhum requisito de integridade=1 | Disponibilidade (conduzido a partir dos processos BCP e IT DR): Altamente disponível = 4 RTO 0 - 4 horas = 3 RTO 4 - 12 horas = 2 RTO > 12 horas = 1 |
Classificação: | Integridade: | Disponibilidade | Pontuação Ponderada | |
---|---|---|---|---|
Bancário | 3 | 4 | 3 | 10 |
Compras | 3 | 2 | 2 | 7 |
Banco de dados de relatórios | 3 | 3 | 1 | 7 |
Sistema de RH | 3 | 2 | 2 | 7 |
Bancos de dados de marketing | 2 | 2 | 1 | 5 |
Contabilidade geral | 3 | 3 | 2 | 6 |
Uma organização pode definir, com base no apetite pelo risco, uma pontuação total de 12 para qualquer objeto de dados, o que indicaria que os dados são altamente confidenciais, têm requisitos de alta integridade e precisam estar altamente disponíveis. Uma organização pode definir, com base no apetite pelo risco, qual pontuação determina a classificação das “joias da coroa”. Além disso, isso permite que a organização priorize os controles e, quando necessário, a atividade de remediação, de maneira muito lógica e granular. A pontuação pode então ser aplicada às aplicações, sistemas e terceiros que usam esses dados, criando um agrupamento de ativos (aplicações, sistemas e / ou terceiros) que indicaria o status de “joia da coroa” (ou não).
Fique atento para a Parte 2, onde nos aprofundaremos no conhecimento do fluxo de seus dados, obtendo visibilidade de quem pode acessar seus dados e sabendo o quão bem eles estão protegidos. Se você quiser saber mais sobre como projetar uma estratégia de proteção de dados na nuvem, pode ler uma cópia gratuita do white paper aqui!