Governança de Dados & Data Lake – Dá para ser Feliz?

Pensamos na felicidade como um estado de espírito de alegria e satisfação1. Mas existe também um segundo significado, sendo este mais útil para nossa reflexão: “concurso de circunstâncias que causam ventura”2. Com o aumento na quantidade total de dados que produzimos, na velocidade de sua produção e nos formatos de armazenamento3, poderíamos facilmente afirmar que as circunstâncias para nossa ventura (ou, em outras palavras, êxito) em utilizá-los (para embasar a tomada de decisão dos negócios) não são as melhores. Mesmo considerando as novas tecnologias e ferramentas que são lançadas a todo momento, a complexidade da tarefa pode ser esmagadora.

Porém devemos lembrar que, circunstâncias, apesar de nunca totalmente controláveis, podem ser influenciadas a nosso favor. E é aí que entra a governança de dados.

Para a maioria das empresas, processos de governança não são novidade. Assim como em outros tipos de governança – riscos, ou tecnologia – a governança de dados envolve todas as áreas de uma empresa e muitas vezes as atravessa verticalmente, ou seja, em mais de um nível. Isso acontece porque é possível gerar e coletar dados em qualquer parte de um processo produtivo ou de prestação de um serviço e, em teoria, sua análise poderia ser usada para melhorar cada um deles. Por sua ubiquidade, se faz necessária uma visão clara e bem definida da governança de dados, quais são seus objetivos (que por sua vez devem incorporar os objetivos do negócio) e estratégias. Esta visão deve ser o mais difundida possível dentro da corporação. Esta é a primeira circunstância que conseguimos criar a nosso favor.

A segunda circunstância começa por verificar que existem áreas e processos que se beneficiam mais de uma abordagem orientada a dados, tanto em sua implementação quanto em sua otimização. Uma visão única do cliente (SCV – single customer view)4, a estar disponível para o setor de marketing, é um exemplo clássico. Considerar quais partes do processo produtivo abordar primeiro e como fazê-lo, também faz parte da governança de dados. No caso de Data Lakes esse questionamento é ainda mais necessário, pois o excesso de controle pode acabar por anular a característica que o define: a exploração estatística e a descoberta de trends em dados não estruturados.

Finalizando nossa lista (que não tem nenhuma pretensão de ser exaustiva), podemos citar a definição de papéis e responsabilidades dentro da governança de dados. O menor controle sobre os dados armazenados em Data Lakes não deve resultar em uma ausência de curadoria deles. É preciso definir quem são os responsáveis pelo ciclo de vida dos dados e garantir que esses possuam a autonomia e a autoridade para exercer os papéis que lhe foram atribuídos. Caso não tenhamos estas definições, o resultado pode ser um ambiente de dados caótico e extremamente dispendioso, pela falta de manutenção, perda de informações e consequente aumento na “entropia” do sistema.

É possível sim ser feliz com governança de dados e Data Lakes. Mas a fim de aumentar nossas chances precisamos nos fazer responsáveis e criar as condições para que isso aconteça. Depender da sorte, estatisticamente, não costuma ser uma boa opção.


1 – FELICIDADE. In: MICHAELIS, Dicionário Brasileiro de Português. Melhoramentos, 2022. Disponível em: https://michaelis.uol.com.br/busca?id=wOXv [consultado em 28/02/2022]

2 – FELICIDADE. In: PRIBERAM, Dicionário da Língua Portuguesa. Priberam, 2022. Disponível em: https://dicionario.priberam.org/felicidade [consultado em: 28/02/2022]

3 – LABORDE, Rebeca. The Three V’s of Big Data: Volume, Velocity, and Variety. Oracle Health Sciences Blog, 2020. Disponível em: https://blogs.oracle.com/health-sciences/post/the-three-vx27s-of-big-data-volume-velocity-andvariety

4 – EXPLOITING the Single Customer View to Maximise the Value of Customer Relationships. Experian, 2011. Disponível em: https://www.experian.co.uk/assets/about-us/white-papers/single-customer-view-whitepaper.pdf

Leave a Reply

Your email address will not be published. Required fields are marked *