Saber continuamente a saúde dos seus dados — atualidade, volume, schema e valores — para o problema aparecer antes do usuário.
Revisado por Francisco Ferreira ·
Observabilidade de dados é a prática de sempre saber se seus dados estão saudáveis, em vez de descobrir por um stakeholder irritado. Ela vigia cinco coisas: atualidade (está em dia?), volume (a contagem de linhas se mexeu como devia?), schema (as colunas mudaram?), distribuição (os valores ainda parecem normais?) e linhagem (o que alimenta o quê?).
A ideia vem do monitoramento de software: você não espera o crash, vigia os sinais que avisam antes. Aplicado a dados, é pegar uma carga quebrada ou um pico de nulos na manhã em que acontece — não no fechamento do trimestre, depois que o número errado já saiu.
O Tabkeel torna observabilidade de dados algo que você não precisa de um time de dados para rodar: conecte somente-leitura, deixe aprender os baselines, seja avisado quando um sinal sai do padrão. Serve para times com engenheiro de dados e para times sem.