GigaChat от «Сбера» научили распознавать изображения и рукописный текст
Функция также доступна через API.
Пользователи GigaChat Pro теперь могут отправить изображение в качестве запроса для дополнительного контекста, рассказали в «Сбере». Например, модель сможет определить, сколько человек на фотографии, во что они одеты и прочее.
Кроме того, модель научилась распознавать печатный и рукописный текст, формулы, графики, таблицы и анализировать данные из них. К примеру, можно сфотографировать часть конспекта и попросить нейросеть дать краткое содержание.
Функция также доступна бизнес-клиентам через API. Ритейлеры могут загрузить изображение товара и попросить сервис придумать к нему продающее описание или компании могут систематизировать медиаконтент, приводит примеры использования «Сбер».
Модель GigaChat Pro доступна бесплатно в веб-версии, Telegram и «ВКонтакте». Для доступа ко всем функциям нужно зайти через «Сбер ID».
«Сбер» представил собственного чат-бота GigaChat в апреле 2023 года, а в сентябре того же года открыл доступ к нейросети для всех пользователей, представил GigaChat API для бизнеса и добавил ИИ-помощника в свой сервис SaluteBot. Чат-бота также поддерживают «умные» колонки SberBoom.