Um Data Lake é um repositório que armazena diferentes tipos de dados, permitindo uma análise
abrangente e flexível. Em Belo Horizonte, diversos tipos de dados podem ser coletados e
armazenados, abrangendo várias áreas. Resultado de um esforço da Prefeitura de Belo
Horizonte, por meio da Prodabel, o município conta agora com um data lake que está reunindo
diversas bases de dados contribuindo com tomadas de decisões mais assertivas e ágeis,
gerando benefícios para o cidadão e aprimorando o trabalho da gestão..
Exemplos de tipos de dados que podem ser incluídos no Data Lake da PBH
Estatísticas e
dados de saúde.
Exemplos:
Dados de Transporte - Estatísticas de tráfego, horários de ônibus e dados de
movimentação em estações.
Dados Estruturados
Esses dados têm uma organização bem definida, como tabelas em
bancos de dados.
Exemplos:
Bancos de dados relacionais - exemplo clássico de dados estruturados, com tabelas
que seguem esquemas predefinidos.
Planilhas - documentos como planilhas Excel, onde as informações são organizadas em
células dentro de linhas e colunas.
Dados Semiestruturados
Embora não estejam completamente organizados como os dados estruturados, eles ainda
possuem alguma forma de estrutura.
Exemplos:
Logs de Sensores: Dados de temperatura, umidade e qualidade do ar coletados de
sensores espalhados pela cidade.
Dados de notas fiscais que podem ser analisados a procura de inconsistências.
Dados Não Estruturados
Esses dados não possuem uma organização pré definida, tornando sua
análise mais
desafiadora, mas também mais rica.
Exemplos:
Arquivos em formato .PDF que podem ser explorados através de ferramentas
automatizadas à procura de textos e padrões.
Imagens e vídeos que podem ser analisados, interpretados e transcritos para
possibilitar
maior acessibilidade.
Benefícios do Data Lake: Uma Revolução na Gestão de Dados
Armazenamento unificado e flexível
O Datalake consolida
dados de diversas fontes e formatos, eliminando a necessidade de múltiplos sistemas
de armazenamento.
Insights em tempo real
A capacidade de processar grandes volumes de dados rapidamente
permite obter insights valiosos em tempo real, suportando a tomada de decisões mais
ágeis e assertivas.
Acesso democratizado
O Datalake democratiza o acesso aos dados, permitindo que
diferentes áreas da Prefeitura utilizem as informações para tomar decisões mais
informadas.
Cultura de dados
O Datalake promove uma cultura de dados na organização,
incentivando a utilização dos dados para impulsionar o negócio.
Consolidação de sistemas
Ao unificar os dados em um único repositório, é possível
reduzir os custos com infraestrutura e manutenção de múltiplos sistemas.
Otimização de recursos
O Datalake permite otimizar o uso de recursos computacionais,
reduzindo os custos com hardware e software.
Catálogo de Dados Abertos da PBH
Por meio deste catálogo, os cidadãos de Belo Horizonte podem consultar e explorar informações
sobre diversos temas de interesse público, como saúde, educação, mobilidade urbana,
segurança, meio ambiente, entre outros. Cada catálogo de dados é acompanhado por uma
descrição detalhada dos campos, informando seu nome, tipo e tamanho, promovendo maior
transparência.