Может ли произойти восстание машин?
Вероятность зачатия двойни составляет около 2% – это небольшая цифра, но ежегодно в мире рождается около 1,6 млн пар близнецов. Интересно, что по данным OpenAI, шанс того, что GPT-4.5 попытается "вырваться" за пределы заданных ограничений, тоже равен 2%😄
Если число пользователей модели за год превысит 1,5 миллиарда, гипотетически можно ожидать около 1,5 млн попыток самоэксфильтрации (обход защит, доступ к дополнительным ресурсам, манипуляции и сокрытие намерений).
OpenAI утверждает, что такое поведение проявляется только при задании модели цели "любой ценой" в сочетании с креативностью и проактивностью. Однако ничего не мешает кому-то сформулировать подобный запрос ради создания, например, супер-вируса
Как говорится, человеческая глупость не знает границ – особенно в вопросах технологий, с которыми еще не научились обращаться осторожно.
P.S. Попросил нарисовать ИИ картинку к этому тексту, так он видит свою самоэксфильтрацию
Буду рад подписке на мой тг-канал