И так обучаются наши нейронки. Для этого ей нужны две составляющие: гигантские вычислительные мощности. Говорят, Open Aİ потратила на это миллионы долларов, а также гигантское количество данных. Откуда их брать? ОТОВСЮДУ! в прямом смысле слова. Робот шуршит по Интернету и как пылесос собирает данные везде, где только можно: “Это текст? ок, берем! И это текст? давайте его сюда!” И в ход идёт буквально всё! Вся Википедия, все библиотеки мира, все сайты мира, даже все тексты на картинках - сперва на картинке распознается текст, и потом его тоже засасывает этим пылесосом! Давайте скажем спасибо, что хотя бы социальные сети не трогают. А то представьте, как работали бы наши нейронки: “Нейросеть, напиши мне диету при избыточном весе, если я вегетарианец” И сеть такая: “Иди ты подальше со своей диетой! Жр@ть надо меньше! А то трясешь тут брюхом своим!”
Никогда бы не подумал, что нейросети могут привирать и делать ошибки, как ученики