Так, Человек или Машина? Что говорят эксперты
«Нам не нужны машины, которые умнее нас, нам нужны машины, которые помогут нам становиться умнее».
Это цитата Константина Воронцова, профессора РАН и руководителя лаборатории машинного интеллекта при МФТИ, который недавно выступал в Москве на отраслевой конференции по теме разговорного машинного интеллекта — «Человек и Машина».
Конференция прошла 24 октября. Мы (Лаборатория Наносемантика) организовывали мероприятие такого формата первый раз. Судя по обратной связи, участники тоже остались довольны. Мы собрали аж 136 человек!
Коротко о том, как прошло мероприятие, инсайты из выступлений спикеров, а также ссылки на их выступления и презентации в этой статье.
Для чего, собственно, мы это затеяли?
В России много разных компаний, у каждой свой подход в решении таких задач: кто-то занимается анализом структурированных данных, кто-то экспертными системами, кто-то использует нейронные сети. Речевая аналитика, классические чат-боты, голосовые роботы для обзвона — те области применения, которые сегодня интересуют бизнес. Кто-то уже внедрил у себя чат-бота, кто-то сомневается — а так ли эта технология эффективна и стоит ли затраченных усилий.
Мы пригласили спикеров поделиться своим опытом и наблюдениями, без лишней воды и маркетинга, и вот что из этого получилось (далее вкратце "пройдемся" по спикерам).
Анна Серебряникова и Сергей Переверзев из компании «МегаФон» рассказали, как они сделали проект для помощи юристам — Nlogic. У системы удобный, простой, кастомизируемый интерфейс. Nlogic способна создавать договора, распознавать юридические документы, автоматически составлять отзывы на потребительские иски, распознавать ключевые термины и т.д. Однако спикеры отметили, что в юридической сфере наблюдается большое недоверие технологиям искусственного интеллекта.
[В юр. сфере] пока никто не пытался создавать что-то подобное, никто не создавал датасеты. По большому счету у нас получился интересный результат, который стоит исследовать глубже, т.к. право, будучи также алгоритмом, начинает проявляться в этих, казалось бы, хаотичных действиях.
Анна отметила, что вся бэкофисная функция – это какой-либо алгоритм (бухгалтерия, финансы, право). Поэтому, задача распознать и понять машиной текст, а потом превратить его в ответ или призыв к действию – это задача, которая масштабируется на любой процесс.
Сейчас тема legal tech находится в ранней стадии развития. Все понимают, что в сферу права нужно внедрять искусственный интеллект, но это сложно в силу консервативности и кастовости продавать такие продукты.
Бизнес может подумать: «Зачем тратить деньги на какой-то продукт, если юрист стоит недорого?» Но бизнес забывает, что машиной и системами легче управлять. Когда у вас большой массив данных (по оценке Константина Воронцова, количество приказов в «МегаФоне» сравнимо по объему с законодательством РФ), им сложно управлять вручную. Поэтому в таких крупных компаниях, как «Мегафон», движутся к тому, чтобы автоматизировать эти процессы и обеспечить исполнение договорённостей между сторонами в гражданских правоотношениях, но никак не заменить юристов.
Видео выступления спикеров (к сожалению, из-за технических неполадок, кроме доклада Константина Воронцова) здесь.
Игорь Пивоваров, главный аналитик Центра по искусственному интеллекту НТИ на базе МФТИ, поделился ключевыми положениями исследования рынка NLP в России, которое было выпущено Центром компетенций НТИ на базе МФТИ в виде аналитического сборника № 2 «Альманах искусственный интеллект: обработка естественного языка, распознавание и синтез речи».
Анализ отрасли привёл к выводу, что сейчас машинам всё еще трудно воспринимать естественную речь. Им недостаточно понимать смысл отдельных слов — необходимо построение языковых моделей и механизмов внимания, которые помогают ИИ определить вероятность следующего слова в предложении и улучшить качество ответов на запросы пользователей. Подводя жирную черту можно сказать, что естественный разговор с роботом остаётся пока далёкой перспективой. Машинам необходимо более глубокое понимание различных логических связей, человеческой эмпатии и поведения собеседника.
Видео выступления Игоря Пивоварова здесь.
Игорь Баско, исполнительный директор компании «Фонемика», рассказал о решениях, которые используются на рынках США и Китая и поделился опытом выхода на эти рынки.
Многим российским компаниям кажется, что эта задача почти не решаемая. Даже если технология «классная», российские компании «не всегда могут сделать продукт, чтобы бизнес услышал и начал им пользоваться».
Игорь привел оценку издания Forbes, по которой рынок «customer experience» — «один из самых ёмких на планете». По его наблюдениям, американский рынок практически перешел на все процессы связанные с режимом реального времени (real-time) — не только в обработке речи, но и документов, платежей и многих других запросов. Из трендов спикер выделил следующие:
Видео выступления Игоря Баско здесь.
Виктор Сафронов, CEO Aithea и сооснователь Лаборатории машинного интеллекта при МФТИ, выступил с прикладным докладом про автоматизацию клиентской поддержки в ритейле на примере чат-ботов Вкусвилл и для лидера американского фастфуда (название компании спикер не раскрыл).
Зачастую заказчик [ритейлер] ставит перед собой задачу удержать клиента. Продуктовый ритейл – это бизнес, в котором клиент должен возвращаться. Если он уходит по какой-то причине, то это потеря наработанной базы – базы, которую, очень сложно восполнить. Поэтому задача увеличивать retention, поддерживать его на должном уровне, достаточно критична.
«Ни один бизнес никогда не будет держать столько людей, чтобы постоянно в онлайне отрабатывать каждое обращение с нулевой задержкой. Это не рентабельно, потому что есть волны активности входящих обращений (в основном люди пишут или звонят днём), и даже если вдвое увеличить штат операторов, большую часть времени они будут сидеть без дела».
Видео выступления Виктора Сафронова здесь.
Алексей Перевозчиков, Regional Manager Eurasia в компании Infobip (вендор WhatsApp (WA) Business API в России, имеют уже около 45 запущенных кейсов), считает, что с WA необходимо работать каждому бизнесу: «WA позволяет находить новых клиентов, а не только коммуницировать с текущими».
Сегодня WA предлагает для бизнеса три продукта: сам мессенджер, Business App (решение для малого бизнеса) и WA Business API (для среднего и крупного бизнеса, с возможностью внедрения чат-ботов и статусом официальной страницы компании).
Видео выступления Алексея Перевозчикова здесь.
Арсений Назаркин, генеральный директор компании Kvint, рассказал о неудачных кейсах: первый — когда из синтеза голоса было очевидно, что говорит робот, и люди не хотели с ним разговаривать, и второй, когда робот нагонял скуку и дискомфорт из-за слишком длинных фраз. В обоих случаях участие робота сильно снижало конверсию.
В сфере голосовых роботов очень важно сделать голос бота максимально естественным, т.к. люди обычно недовольны, когда понимают, что разговаривают не с человеком... Скрипт [бота] не должен быть слишком простым, нужно уделять много внимания на его составление, составлять комплексные ветви диалога, не удлинять фразы, т.д.
Видео выступление Арсения Назаркина здесь.
Антон Бондаренко, менеджер продукта в «Тинькофф Банке», рассказывал об умном помощнике Олеге: чем он живет, чем отличается от конкурентов и как его планируют развивать дальше.
Олег – это не только чат-бот в приложении, но и помощник в повседневной жизни, советник по финансам и экономии денег.
В компании долго спорили, должен ли Олег разговаривать на свободные темы. После многих тестов, решили оставить эту функцию, несмотря на риски. Распространился [Олег] достаточно быстро, т.к. всем были интересны его ответы.
Самый популярный сценарий диалога с Олегом – переводы денег и мониторинг подписок. Ценность у разных сценариев определяется по-разному. Если сценарий связан с проблемой пользователя с продуктами Тинькофф (и он не был отвечен Олегом, а перешёл к оператору) – ценность здесь в экономии на колл-центре. Если это сценарии, несущие добавленную стоимость (они могут продавать что-то пользователю или не продавать) – ценность состоит или в прямой продаже в первом случае, или влиянии на метрики во втором.
Видео выступления Антона Бондаренко здесь.
Станислав Ашманов, руководитель компаний «Лаборатория Наносемантика» и «Нейросети Ашманова», выступил с докладом про open source в мире голосовых ассистентов.
Станислав считает, что минус многих open source платформ для разговорного ИИ в том, что они «игнорируют голос, развивают только текстовые каналы, не представляют рабочих инструментов (конструкторов, GUI) и созданы программистами для программистов».
Open source – это единственный способ выйти на международный рынок и эффективный способ стать отраслевым стандартом.
К вопросу о конкуренции (например, с Амазоном, которые активно интегрируется везде) Станислав отметил, что в том же Амазоне все «сильно завязано на серверах корпораций»: то есть нельзя локально установить Алексу в своем автомобиле. По его мнению, выиграть можно путем разработки приватного решения, которое будет оставлять право на раскрытие персональных данных за пользователем и давать свободу разработчикам в использовании решения.
Видео выступления Станислава Ашманова здесь.