Код, графика и подсчёт букв в словах: как полная версия модели o1 от OpenAI справляется с запросами пользователей
Модель должна рисовать, работать с текстом и программировать «лучше», чем её предшественница GPT-4o. В заметке — несколько примеров.
Пользователь соцсети X рассказал, что загрузил в чат-бота ChatGPT схематичный рисунок дата-центра. Модель за десять секунд провела расчёты для его охлаждения в космосе, используя первый закон термодинамики.
В другом примере o1 воссоздала композицию картины в ответ на запрос «Как можно точнее повтори изображение в [формате векторной графики]».
Для сравнения пользователь дал ту же задачу Claude и GPT-4o. Вот результаты:
Нейросеть также написала код для пользовательского интерфейса меньше чем за 15 минут — на основе рукописных инструкций из комикса.
Пользователь сказал o1, что не умеет программировать, и попросил дать «чёткие инструкции». Модель прислала код, рассказав, как писала его сама и как его можно запустить — пошагово. Claude не смог сразу выдать готовый код.
Другой пользователь предложил продвинутой модели o1-pro такой запрос: «Напиши стихотворение о количестве букв r в слове strawberry, но не используй слово strawberry или букву r».
Для обозначения клубники модель использовала метафоры — например, «поцелованное солнцем пьянящее наслаждение», — и правильно указала, что в английском слове три буквы r. GPT-4 отвечала, что их две.
Исследователь из OpenAI Ноам Браун показал, как o1-pro написала эссе про клубнику на три абзаца, не используя слова с буквой e. Она заменила слово strawberry на латинское название fragaria ananassa.
GPT-4o не справилась с задачей и использовала слово strawberry в первой же строчке.
Автор блога Denis Sexy IT Денис Ширяев попросил o1-pro выполнить похожее задание, но на русском языке: «Напиши рассказ про букву "е", не используя букву "е"». Одна всё-таки «проскочила».
В другом примере модель смогла определить, какой вид белка описал пользователь — по параметрам его структуры.
- OpenAI выпустила полную версию модели o1 5 декабря 2024 года (ограниченную представили в сентябре). Компания называет её «самой "умной"» из уже вышедших у неё. При тестировании OpenAI считала, что модель справилась с запросом, только если она давала правильный вариант «в четырёх из четырёх случаев».
- о1 доступна подписчикам Plus за $20 в месяц и нового плана Pro за $200. Первым — с ограничениями по количеству запросов. Вторым — без. Доступ к продвинутой версии o1-pro дали только владельцам Pro.
Если уже протестировали o1 и o1-pro — поделитесь впечатлениями в комментариях.