Genspark: ИИ-агент, который создаёт презентации, видео и бронирует столики в ресторанах
Стартап MainFunc, основанный бывшими сотрудниками Google и Baidu, запустил Genspark — «супер-ИИ-агента», который может создавать презентации, видео, писать код, искать информацию и даже звонить в рестораны.
Что умеет Genspark?
Genspark работает на системе «смеси агентов», которая использует разные модели ИИ для выполнения различных задач. Возможности сервиса:
- Создание контента – пишет тексты, генерирует изображения, видео и аудио.
- Работа с данными – анализирует информацию, может, например, просмотреть пятичасовое интервью и сделать из него презентацию с инфографикой.
- Голосовой помощник – функция «Позвони за меня» бронирует столики в ресторанах (пока только для США и Японии).
- Планирование – составляет маршруты путешествий и создаёт интерактивные страницы со ссылками.
Какие технологии используются?
Genspark использует сразу несколько ИИ-моделей:
- Тексты и код – GPT-4o, Claude 3.7 Sonnet, DeepSeek.
- Изображения и видео – DALL·E 3, Imagen 3, Veo 2, Recraft V3.
- Переводы – DeepL.
Сколько это стоит?
В сервисе есть 200 бесплатных кредитов в день (примерно на два сложных запроса).
Платная подписка стоит $25 в месяц (≈2109 рублей по курсу на 3 марта 2025 года) и включает 10 000 кредитов.
Кто создал Genspark?
- Эрик Цзин – бывший разработчик Bing и главный менеджер по продуктам в Baidu.
- Кей Чжу – экс-сотрудник Google и Baidu.
Летом 2024 года стартап привлёк $60 млн при оценке в $260 млн. Первоначально их ИИ-агент умел только искать информацию, но теперь превратился в полноценного цифрового помощника.
Genspark объединяет сразу несколько функций, создавая универсальный инструмент для работы с информацией и творчеством.