OpenAI разрешила разработчикам дообучать модель GPT-4o на своих наборах данных

Например, чтобы добиться особой структуры или стиля ответов.

  • В качестве примера Bloomberg приводит ситуацию, в которой производитель скейтбордов дообучает модель для чат-бота, куда скейтеры обращаются с вопросами о хранении и ремонте «досок». В OpenAI отметили: чтобы увидеть разницу, достаточно добавить в обучающий дата-сет всего «несколько десятков примеров».
  • Дообучение доступно всем разработчикам с платной подпиской. В соответствующем разделе нужно нажать на кнопку «Создать» и в выпадающем меню с базовыми моделями выбрать gpt-4o-2024-08-06. Как устроен «файнтюнинг» — описали в справочном разделе.
  • Пока загрузить можно только текстовые данные. Изображения и другие виды контента не поддерживаются, уточнили Bloomberg в компании и добавили, что на дообучение в среднем уходит до двух часов.
  • По словам OpenAI, «контроль» над дообученными моделями будет исключительно у самих разработчиков. Запросы, ответы и прочие «бизнес-данные» не будут использовать для тренировки ИИ или передавать третьим лицам.
  • Дообучение обойдётся в $25 за 1 млн токенов (до 23 сентября 2024 года организациям полагается по 1 млн токенов в день бесплатно). При использовании дообученной модели 1 млн «входных» токенов будет стоить $3,75, а «выходных» — $15.
Источник фото: MakeUseOf
Источник фото: MakeUseOf
77
66
36 комментариев

Друзья, дообучение — это максимально простая опция, даже если у вас доступ к ChatGPT через телеграм-бота. Всё, что вам нужно — набор данных и возможность загрузить файлы.

Недавно я запилил набор для ChatGPT «Идеальный Текст» (улучшайзер текста): 4 сниппета (небольших файла) с данными, которые дообучают нейросеть, значительно улучшают качество текста и устраняют ошибки, делая работу с ChatGPT более эффективной.

Попробуйте: https://textme.work/chatgpt-booster/

1
1
Ответить

Через пару запросов и ответов чатбот сделает смарт транкейт и половина ваших инструкций похерится. Еще иногда чатбот упорно игнорирует инструкцию из промта. Я описываю использование чата для написания кода. Их новая фича исправит этот баг.

4
Ответить

Новость отличная, много месяцев уже ждал, с 3.5 хороший опыт fine-tune был. Но сейчас все побежали, видимо, файнтьюнить, небольшая работа на сотню строк зависла на "Files validated, moving job to queued state".
Утром надо проверить. :)

1
Ответить

А где это в приложении chat gpt? Не могу найти, подписка есть

1
Ответить

Комментарий недоступен

1
Ответить

Не за что, обращайтесь!

Ответить

Ну наконец-то, дошло письмо до дедушки Мороза 🤘🏻

Ответить