Uma mudança gradual na distribuição dos valores de uma coluna ao longo do tempo, afastando-se do que era antes.
Revisado por Francisco Ferreira ·
Data drift é quando os valores de uma coluna lentamente deixam de parecer o que eram — a média sobe aos poucos, uma categoria rara fica comum, uma moeda ou unidade muda em silêncio. Diferente de uma quebra seca, o drift é gradual, e é justamente por isso que passa despercebido por tanto tempo.
Ele corrompe em silêncio tudo que é construído em cima: dashboards, modelos de machine learning, métricas de negócio. Quando um gráfico finalmente parece 'estranho', o drift normalmente já está acontecendo há semanas, e o baseline de comparação já se moveu junto.
O Tabkeel compara a distribuição atual de cada coluna ao seu baseline aprendido e expõe o drift enquanto ele ainda é pequeno o bastante para corrigir barato.