Как работает ChatGPT? Неочевидные ракурсы

Почти каждый, кто следит за новостями в мире технологий, слышал о ChatGPT. Многим из нас кажется, будто мы понимаем принцип его работы. Об этом сервисе уже столько написано, что, если не вникать в детали кода, в принципе, понятно, как тут все устроено. В этой статье мы сделаем акцент на 3 неочевидных нюансах работы самого популярного сервиса на ИИ.

Удивительно, но технология, по которой работает ChatGPT, родилась больше 30 лет (!) назад. И эта технология напоминает словарик Т9, который появился еще в кнопочных телефонах. Когда вы начинаете вбивать слово, Т9 понимает, какое должно быть окончание. Сейчас он усовершенствовался и может подсказать не только окончание, но и следующе слово или даже всю фразу.

Это простой алгоритм, но, если ему «скормить» больший объём знаний и дать мощные инструменты для вычисления, он сумеет предугадывать гораздо больше. Это похоже на то, как мы можем предугадывать развитие сюжета фильма, имея определённый уровень насмотренности.

Вот вы смотрите его и уже в какой-то момент думаете: «Похоже, этот – предатель, а вот этого убьют…». А у кого-то есть знакомые, с которыми невозможно вместе смотреть кино, потому что они заранее вслух озвучивают свои догадки о том, как будут развиваться события на этот раз и ломают всю интригу. Нейросеть работает по такому же принципу.

Откуда вы могли знать в середине фильма, чем все закончится и кто окажется убийцей? Просто, мы, посмотрев огромное количество фильмов уже уловили основные тенденции, по которым складывается тот или иной сюжет, интуитивно знаем детали, через которые сценаристы обычно показывают тех или иных персонажей. Мы уже знаем или чувствуем, как это бывает обычно и сравниваем новый предлагаемый контекст с привычным образцом.

С нейросетью происходит примерно то же самое. Она обучается на объёме данных, который ей предоставлен. Эти данные включают в себя книги, журналы, газеты, статьи и сайты. Но это только часть ее dataset!

Вторая часть данных, на которых учатся нейросети - это ваши запросы. Нейросеть анализирует, что вы спрашиваете, и пытается понять ваши интересы и потребности. То есть, если вы ее спрашиваете, как приготовить обед из стольких-то блюд, нейросеть «прикидывает», что, возможно, не только вы этим интересуетесь. И мониторит количество и суть запросов на аналогичные темы, чтобы сформировать ответ, наиболее удовлетворяющий запрос такого рода.

Также материалом для лучшего понимания пользователей нейросети служат тексты, которые вы в нее загружаете, ссылки на сайты, которые вы ей даете для анализа, и т.д. Сейчас с СhatGPT в платных тарифах вы даже можете загрузить определенные данные для обучения своего агента.

Основной вопрос – «Как получать результат от нейросети?» Более подробную информацию по этому вопросу можно получить уже на бесплатном курсе «Нейросети. Быстрый старт». Он краткий, и, в то же время, емкий, позволяет начать применять нейросети, получая хорошие результаты уже после 3-х уроков.

Но вернемся к нашей теме. Раньше говорили, что точный вопрос содержит половину ответа. И это было, действительно, так. Было. Но сейчас мир изменился. Нейросеть может ответить на любой вопрос. Поэтому формулировка запроса, по сути дела, определяет 100% ответа.

В отличие от обычной поисковой системы, выдающей весь объем найденных материалов, хоть как-то относящихся к теме, нейросеть по вашему запросу создаёт ответ с нуля. Она его выдает – один (если вы не просили варианты), а не десятки страниц. И генерирует она наиболее ожидаемый (с ее точки зрения)) вариант. Точно также, как Т9 предугадывает окончание слова.

Качество запроса определяет качество ответа. Продуманный, детализированный промпт нейросеть способна отработать подчас даже лучше, чем если бы ответ писал человек. Если же вы загрузили короткий поверхностный промт в надежде, что ИИ сам додумает детали или угадает ваши пожелания и умолчания, то, к сожалению, ответ почти наверняка будет шаблонным, скучным, без деталей – «невкусным».

Какие бывают типы и аналоги GPT нейросетей?

Есть оригинальные нейросети, которые используют свой dataset, такие как ChatGPT, Claude, Google Bard и т.д.

Есть Telegram боты-посредники.

И есть сервисы-агрегаторы, такие как Notion AI и Bing.

Вторые и третьи используют ChatGPT как инструмент для решения своих задач. Если научиться работать с оригинальной нейросетью, то потом можно будет получать релевантные результаты в любой среде. Особенно с учетом того, что к большинству нейросетей доступ на территории РФ заблокирован. И иногда приходится прибегать альтернативам.

Но важно помнить, что бесплатные боты не всегда работают так же хорошо, как оригинальный ChatGPT. Многие люди, пробовавшие бесплатные Telegram боты, были разочарованы, полагая, что все нейросети также бестолковы и бесполезны.

Для этого есть объективные причины. Что бы ни писали разработчики в своих рекламных предложениях, официальных Telegram ботов у компании Open AI нет. Все боты работают через API, за что с владельца бота взимается плата за потраченные токены (части сгенерированных слов). При этом Open AI предоставляет доступ к разным языковым моделям, в том числе – сильно устаревшим и маломощным. Чем примитивнее модель, тем дешевле она обходится владельцам.

Разумеется, в бесплатных чат-ботах для массовой аудитории вряд ли будут использовать самую дорогостоящую модель GPT-4.

Более или менее продвинутые боты, безусловно, существуют. Но у них либо короткий пробный период, сопровождающийся назойливой рекламой, за которым неизбежно придется платить, либо ощутимые ограничения функционала в бесплатном режиме. При этом, возможности Telegram ботов, по определению, беднее, нежели оригинальный ChatGPT, который, к тому же, в разы более интеллектуальный, чем могут представить себе многие пользователи.

Итак, теперь мы знаем, что стоит за фасадом ChatGPT. Не все так однозначно, как казалось на первый взгляд, правда? Для продуктивной работы с ChatGPT ключевое значение имеет понимание принципов его работы. Именно это позволяет максимально эффективно задействовать потенциал ИИ в решении задач, в чем бы они ни заключались. Начните погружение в тонкости и детали процесса с нашим бесплатным курсом «Нейросети. Быстрый старт» от Lebedev Academy.

1 комментарий

Денис Коваленко

16.12.2023

Все курсы по нейросетям можно свести к простой рекомендации: предоставляй подробное техническое задание и давай контекст - всё... По большей части это всё. Помню, что в далеких нулевых как-то видел на остановке объявление, что-то типа "Обучение поисковым системам" или что-то типа того... Всё циклично)))

Ответить

Как работает ChatGPT? Неочевидные ракурсы

Т9 на стероидах

Правильно сформулированный вопрос содержит 50% ответа?

Что у бота под капотом?