Искусственный интеллект не обладает «ценностями» или «убеждениями»

Исследование Массачусетского технологического института (MIT) опровергло популярное мнение о том, что ИИ может обладать собственными ценностями или предпочтениями.

🔥 Еще больше интересного в моем канале продуктовые штучки

Ученые пришли к выводу, что современные модели ИИ не имеют стабильной системы убеждений и предпочтений, а вместо этого имитируют и "галлюцинируют" ответы на основе текстовых данных.
Источник

Первый вывод – ИИ не обладает устойчивыми ценностями или принципами. Модели изменяют свои "взгляды" в зависимости от формулировки запросов, демонстрируя непоследовательность и нестабильность. ИИ действует как имитатор, создавая ответы на основе вероятностных языковых моделей, но не способен внутренне усвоить человеческие предпочтения или моральные принципы.

Второй вывод: модели не поддаются простому управлению или изменению их "взглядов". «Настройка" моделей для желаемого поведения сложнее, чем предполагалось ранее.

Базовые представления о "системе взглядов" ИИ не получают подтверждения. Источник

Ученые предупреждают о рисках антропоморфизации ИИ — приписывания ему человеческих качеств, таких как ценности или мнения. Это может привести к неправильному пониманию природы ИИ.
Источник

Исследование MIT подчеркивает важность критического подхода к восприятию ИИ и его возможностей, особенно в контексте заявлений о том, что технологии могут развивать собственные системы ценностей.

#иибудущее #будущееии #нейромодели #llm #llms

Наташа Хазеева

2 апр

Как думают нейромодели?

Компания Anthropic (создатель нейро модели Claude) задалась этим нетривиальным вопросом и изучила, как именно думает нейромодель. Да-да, вы не ослышались. И пришла к любопытным выводам, которые полезно знать не только тем, кто работает с нейросетями. Например, чтобыо нейросети могу продумывать ответ на 2-3 шага вперед и ... обманывать! Как? Читайте…

Клод заканчивает стихотворение из двух строк (см. пояснение ниже). <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.anthropic.com%2Fresearch%2Ftracing-thoughts-language-model&postId=1896633" rel="nofollow noreferrer noopener" target="_blank">Источник</a>

Искусственный интеллект не обладает «ценностями» или «убеждениями»

Основные выводы исследования

Выводы?

Пожалуйста, поддержите меня, поставьте лайк! 🙏