Обучение ИИ с использованием обратной связи от человека

Сейчас расскажу вам про одну штуку, которая здорово улучшила качество работы ИИ. Это обучение с подкреплением на основе обратной связи от человека (Reinforcement Learning from Human Feedback). То есть, вы поправляете ИИ, и он запоминает, где и как вы его поправили, чтобы реже делать такие ошибки в будущем. Или вы хвалите ИИ, и он запоминает, что ва…

11

Так интересно разбираться в теме ИИ! 🤖

1
Ответить