Между бизнесом и наукой: как сотрудники Сбера обучают искусственный интеллект и создают роботов
Попасть в исследовательскую лабораторию может любой инженер — и не нужно писать кандидатскую.
В Сбере есть несколько R&D-лабораторий: они занимаются исследованиями в области искусственного интеллекта, кибербезопасности, нейронаук, блокчейна, робототехники и виртуальной реальности. На их базе создано больше 60 новых продуктов, которыми пользуются Сбер и его партнёры. Компания делится собственными наработками со всеми, кому они могут быть полезны: часть проектов лабораторий — это open-source-решения, открытые для внешних исследователей.
Лаборатории работают с инновациями — проектами, которые формируют тренды и двигают науку вперёд. Поговорили с экспертами Лаборатории ИИ и Центра робототехники о проектах, которыми они гордятся.
Лаборатория искусственного интеллекта
Лаборатория существует уже семь лет, и за это время выросла в целое подразделение внутри Сбера. Сотрудники работают над перспективными направлениями исследований, помогают бизнесу внедрять новые технологии, ведут активную научную деятельность. Результаты исследований лаборатории и продукты находятся в открытом доступе.
Лаборатория состоит из центров, которые сгруппированы по ключевым направлениям исследований:
- Центр искусственного интеллекта в медицине.
- Центр глубокого машинного обучения.
- Центр инструментов машинного обучения.
- Центр фундаментальных исследований.
- Центр прикладных исследований.
- Центр управления проектами и инфраструктурой, который обеспечивает поддержку исследовательских команд в части процессов и ресурсов для вычислений.
Мы регулярно пишем научные статьи по нашим разработкам и выступаем на конференциях, в том числе международных. Нам важно понимать, что мы занимаемся не наукой «в вакууме», а разрабатываем технологии, которые полезны в компании и за её пределами.
Лучше всего о деятельности лаборатории расскажут её проекты. Лаборатория ИИ разрабатывает фреймворки и библиотеки для упрощения работы специалистов по машинному обучению. Остановимся на трёх из них, которые особенно важны для бизнеса. Ежедневно они улучшают пользовательский опыт в сервисах Сбера и упрощают работу инженерам и аналитикам.
LightAutoML
LightAutoML (LAMA) появилась четыре года назад, среди её авторов многократные победители международных соревнований Kaggle. LAMA — это open-source-библиотека, которой пользуются дата-сайентисты. С помощью неё можно построить собственную модель «из коробки» за 10 минут.
Фреймворк сокращает время разработки и внедрения ML-модели и кастомизируется под потребности пользователя. В него команда интегрирует другие новейшие наработки по оригинальным алгоритмам и подходам.
Большинство существующих библиотек невозможно сразу применить в работе, потому что в них нужно долго разбираться. А LAMA изначально была нацелена больше на прикладной формат: нам было важно, чтобы дата-сайентисты могли быстро решать с её помощью свои задачи.
Какие задачи решает фреймворк:
- Работает с любым типом данных: с таблицами, текстами и картинками.
- Автоматизирует машинное обучение с помощью автовалидации и бенчмаркинга.
- Выгружает отчёт после тестирования моделей, чтобы можно было подобрать оптимальную для конкретной задачи.
LAMA могут пользоваться дата-сайентисты из любых компаний — а ещё они предлагают доработки в открытом коде и давбт обратную связь по библиотеке.
RePlay
RePlay существует в открытом доступе с 2021 года. Это тоже опенсорс-проект для людей, которые работают с данными: дата-сайентистов, дата-инженеров, ресёчеров.
Фреймворк упрощает работу с рекомендательными системами: приводит данные к единому формату, позволяет проверять алгоритмы на корректность и использовать разные части пайплайна в реальных сервисах. Все расчёты проходят в одном из трёх форматов Spark, Pandas, Polars. Это возможность для исследователей и инженеров тестировать новые алгоритмы и экономить время.
Мы создали 15 алгоритмов, которые решают разные рекомендательные задачи: это бейзлайны, коллаборативные модели и нейросети. В основе лежат наши исследования, опубликованные на международных конференциях. Разработка фреймворка велась внутри нашей лаборатории, а с прошлого года мы развиваем библиотеку совместно с коллегами из рекомендательной платформы Сбера.
Сейчас фреймворк внедряется и используется в рекомендательных сервисах Сбера. RePlay подойдёт и для небольших компаний, которые не могут позволить себе найм дата-сайентиста.
Sim4Rec
Sim4Rec тоже работает с рекомендательными системами и не только сравнивает алгоритмы, но и оценивает качество их работы. Sim4Rec обучает рекомендации реагировать на предпочтения пользователя через анализ используемых товаров и истории взаимодействий.
Какие задачи решает Sim4Rec:
- Моделирует реакции пользователя на рекомендации.
- Использует синтетические данные, когда реальных не хватает.
- Может измерять бизнес-метрики до запуска AB-тестов.
С помощью этого фреймворка можно сделать работу алгоритмов рекомендаций эффективнее: они обучаются в специальном симуляторе данных, который имитирует поведение пользователя на сайте. Поэтому они легко прогнозируют предпочтения реальных людей.
Мы обсудили только часть из более чем 10 фреймворков, созданных в лаборатории. PyTorch-LifeStream, Py-Boost и другие продукты также постоянно используются в банке и за его пределами. Важным достоинством наших библиотек является их совместимость между собой и возможность дополнять друг друга.
В Лаборатории искусственного интеллекта Сбербанка коллеги постоянно генерируют идеи для новых проектов, которые повышают статус компании в научном сообществе.
Если вам тоже хочется сделать вклад в науку, откликайтесь на вакансии лаборатории.
Центр робототехники
Центр существует с 2017 года. Сначала он базировался в Сколково, а затем перешёл под управление Сбера. Его главный профиль — разработка роботов, но сотрудники также активно задействованы и в исследовании технологий.
Центр состоит из нескольких команд, вот некоторые из них:
- Группа Манипуляции и LLM: отвечает за обучение роботов конкретным действиям — взять, положить, собрать, вынуть, протереть.
- Группа Навигации: занимается тем, чтобы робот понимал и верно оценивал своё местоположение в пространстве.
- Инженерное направление: широкий спектр задач от программирования и моделирования электрических схем до отладки устройств на базе микроконтроллеров.
Мы работаем над проектами до стадии MVP: исследуем технологии, разрабатываем модели будущих роботов и тестируем их. После этого над проектом начинают работать производственные подразделения, которые выпускают уже полноценный продукт.
Мобильно-манипуляционные роботы
Суть проекта в том, чтобы создать «мозг общего назначения», который может применяться в разных сферах и самостоятельно взаимодействовать с окружающей средой.
Такой робот может выполнить команду: «Возьми молоко из холодильника». Он сам пойдет на кухню, найдёт холодильник и определит, какая из бутылок в нем является молоком. На эти базовые навыки мы планируем наложить профессиональные: например, научить робота заниматься каким-нибудь ремеслом.
Планируется, что роботы будут передвигаться в пространстве без рельс и дополнительной инфраструктуры. Это важно для их интеграции на производства — он не будет нуждаться в помощи человека.
SberShuttle
SberShuttle — это автоматизированная логистическая складская система. Она может перемещать контейнеры с одной части склада в другую: например, к оператору и обратно. Тем самым уменьшается количество ручной работы.
Система полностью разработана Центром робототехники: от программного обеспечения до самой конструкции. В 2018 году на неё был получен патент.
SberShuttle состоит из нескольких частей:
- Зона хранения: здесь находятся предметы, которые шаттлу нужно перемещать.
- Лифт для вертикального перемещения: позволяет шаттлу перемещаться между полками на складе.
- Сам шаттл.
- Станция отбора: здесь сотрудник склада получает товар, который переместил шаттл.
Робот-художник
Робот управляется искусственным интеллектом и алгоритмами, которые позволяют ему рисовать. Пока он пользуется только маркером и пишет картины в нескольких стилях. Вместе с нейросетью Kandinsky команда лаборатории планирует и дальше развивать его художественные навыки.
Сейчас робота-художника можно увидеть в офисе Сбера на Кутузовском проспекте и на выставке «Россия» в нашем павильоне. Пока это робот, который только развлекает, но мы надеемся найти ему применение и на производствах.
Робот-дезинфектор
Этот робот уже выпущен в работу и используется в офисах Сбера. Вечером после рабочего дня он катается по этажам и дезинфицирует поверхности ультрафиолетовым лучом.
Сбер поддерживает сотрудников, которые стремятся проводить исследования и вносить свой вклад в науку. Для этого в компании есть вся необходимая технологическая инфраструктура.
Помимо развития собственных R&D-центров Сбер создаёт исследовательские лаборатории в партнерстве с ведущими университетами, помогает сотрудникам публиковаться в научных журналах и выступать на международных конференциях в качестве спикеров.
Если вам захотелось участвовать в разработке проектов лабораторий Сбера или запустить свой собственный, вам не нужна ученая степень. Присоединиться к научному комьюнити Сбера и взглянуть на работу R&D-лабораторий изнутри можно на одной из открытых вакансий на карьерном портале.
Комментарий удалён модератором
Просто для красоты) Продавать не планируем, но сделать его полезным, а не только развлекательным — да
всегда восхищаюсь теми, кто умеет делать то, чего не умею я)
Да, мы тоже восхищаемся своими коллегами!
Да, конечно сейчас уже без искусственного интеллекта уже никуда. И со временем его доля во всех сферах будет только расти. Так что это нужно воспринимать как должное.
Да, это факт. Поэтому мы и развиваем R&D-лаборатории — чтобы идти в ногу со временем!
Комментарий удалён модератором
Диана, привет! У нас действительно работают кандидаты наук, но это не обязательное условие для того, чтобы попасть в лабораторию)