В этом докладе я расскажу о том, как мы использовали NLP решения для расширения возможностей DCAP (data-centric audit and protection) системы компании Makves. Обсудим, почему обработка неструктурированных текстовых данных без нейросетей является сложной задачей, и как мы преодолели эти вызовы. Я поделюсь опытом сбора и подготовки датасета, а также раскрою трюки и методы, которые применяли для оценки качества полученных решений. Также рассмотрим ограничения, с которыми мы столкнулись при продуктивизации моделей, и как их преодолели. Доклад будет полезен – как опыт реального внедрения NLP функционала в работающий продукт.
Идём 👍