Пользователи заметили, что o1 от OpenAI может неконтролируемо переключаться на китайский и другие языки во время решения задач

Исследователи предполагают, что причина не только в иностранных данных для обуче��ия, пишет TechCrunch.

Источник: UnknownEssence

После выхода модели рассуждений o1 и продвинутой версии o1-pro от OpenAI в сети появились сообщения о том, что они могут расписывать ход решения на китайском, хинди и других языках, даже если весь диалог вёлся на английском.

Исследователь из Google DeepMind Тед Сяо заявил, что «из-за доступности и стоимости» OpenAI использует сторонние китайские сервисы для разметки данных — маркировки релевантных изображений, видео и текстов при обучении моделей.
Также o1 может использовать языки, которые считает эффективными для достижения разных целей, так как «не знает, что такое язык или что языки бывают разными», — рассказал TechCrunch исследователь ИИ и доцент канадского Альбертского университета Мэтью Гуздиал.

Например, один из пользователей попросил модель помочь ему вспомнить песню, и она переключилась на французский.

А для решения математических задач o1 может выбирать китайский, так как иероглифами «эффективнее» записывать числа, считает инженер-программист из Hugging Face Тичжэнь Ван.
Точную причину установить невозможно — эти модели слишком «непрозрачные», подчеркнул Лука Сольдайни, сотрудник Института искусственного интеллекта сооснователя Microsoft Полла Аллена (AI2).

5 декабря 2024 года OpenAI выпустила полную версию модели рассуждений o1, она доступна подписчикам Plus за $20 в месяц и нового плана Pro за $200 в месяц. Первым — с ограничениями по количеству запросов. Вторым — без. Доступ к продвинутой версии o1-pro дали только владельцам Pro.

Код, графика и подсчёт букв в словах: как полная версия модели o1 от OpenAI справляется с запросами пользователей

Модель должна рисовать, работать с текстом и программировать «лучше», чем её предшественница GPT-4o. В заметке — несколько примеров.

Причины, почему модель может переключаться на другие языки