Скорее даёт алёрты в случае обнаружения проблем: «With Datafold, changes made by data engineers in their extractions and transformations can be compared for unintentional changes. For instance, maybe a function that formerly returned an integer now returns a text string, an accidental mistake introduced by the engineer. Rather than wait until BI tools flop and a bunch of alerts come in from managers, Datafold will indicate that there is likely some sort of problem, and identify what happened». https://techcrunch.com/2020/08/05/datafold-is-solving-the-chaos-of-data-engineering/
Профилируют данные по разным правилам и следят, чтобы по ходу времени профиль был стабилен. Если, например, в црмке обычно за день обновляются записи по 5000 клиентов, а за вчера было 30000 изменений - почему бы владельцу данных не обратить внимание на это.
Собственно идея, технология и движок там несложные. Основная сложность это пользовательские сценарии и UX.
Прямой кандидат на продажу Informatica, потому что это ещё одно слабо интегрируемое в стэк по управлению данными софтваре. У этого продукта сильно больше шансов заинтересовать клиентов если его грамотно пришьют к существующим платформам.
Не очень понял, что они в итоге делают с данными? Заполняют пропуски средним?)
Скорее даёт алёрты в случае обнаружения проблем:
«With Datafold, changes made by data engineers in their extractions and transformations can be compared for unintentional changes. For instance, maybe a function that formerly returned an integer now returns a text string, an accidental mistake introduced by the engineer. Rather than wait until BI tools flop and a bunch of alerts come in from managers, Datafold will indicate that there is likely some sort of problem, and identify what happened».
https://techcrunch.com/2020/08/05/datafold-is-solving-the-chaos-of-data-engineering/
Это платформа для мониторинга качества данных.
Ведь на основе плохих данных может получиться, что "команда биг дата проанализировала" и привет
Профилируют данные по разным правилам и следят, чтобы по ходу времени профиль был стабилен. Если, например, в црмке обычно за день обновляются записи по 5000 клиентов, а за вчера было 30000 изменений - почему бы владельцу данных не обратить внимание на это.
Заменяют пробелы на тире в строке
И это с командой в 18 человек. Кажется, КПД у этой команды зашкаливает
Собственно идея, технология и движок там несложные. Основная сложность это пользовательские сценарии и UX.
Прямой кандидат на продажу Informatica, потому что это ещё одно слабо интегрируемое в стэк по управлению данными софтваре. У этого продукта сильно больше шансов заинтересовать клиентов если его грамотно пришьют к существующим платформам.