ChatGPT не заберет твою работу, юзернейм, и вот почему
Что я понял пытаясь применить нейросети для повседневных задач: написание кода, генерацию изображений и составления текстов.
Стоны восторга и ужаса по поводу пришествия сверхумных нейросетей наводнили ленты соцсетей. Беспомощного обывателя подхватила волна хайпа: программисты больше не нужны, копирайтеры и иллюстраторы останутся без работы!
Это конечно же полная чушь и сейчас объясню почему.
Контекст: мои навыки
Для дальнейшего повествования важно понять, какие навыки у меня есть и каких нет. Это напрямую влияет на то, как и для чего я могу использовать нейросети.
Вообще я C-level менеджер, но помимо этого у меня есть и такие способности:
- Написание текстов — я достаточно много времени уделял этому, периодически пишу технические и бизнес-статьи; как-то ради интереса даже книгу написал (и да, её покупают!). Уровень владения — высокий.
- Дизайн и графика — сам не рисую, но у меня есть насмотренность: могу отличить иллюстрацию со стоков от дорогой работы, понимаю про стили, процесс производства, композицию и вот это все. Уровень владения — средний.
- Написание кода — в университете я писал на Паскале, потом сам верстал сайты на HTML+CSS, освоил Bootstrap, понимаю базовые концепции программирования и знаю про основные инструменты разработчика, SDLC, как приложение в облаке работает (в общих чертах). Уровень владения — на уровне джун+.
Дальше расскажу как я попробовал усилить каждый из этих навыков нейросетью и что из этого вышло. Спойлер: результаты разные.
Написание текстов
Я использовал ChatGPT в основном для написания писем на английском. И он отлично работает, если ты знаешь о чем и в какой форме надо написать, предоставляешь тезисы, а также знаешь английский, чтобы проверить полученный результат и внести правки.
То есть, чтобы получить хороший результат при написании важного текста, надо уже иметь все навыки для того, чтобы сделать это самостоятельно.
С первого промпта готовый текст никогда не выходит. Типичные проблемы, которые приходилось исправлять:
- Тезисы смешались и присутствуют в тексте в неоптимальном порядке.
- Одни и те же мысли дублируются в разных абзацах, повторения-повторения.
- Смысл написанного немного отличается от того, что автор хотел сообщить.
- Нейросеть не поняла суть тезиса и написала не то, что надо.
В общем, это очень похоже на результат работы неопытного сотрудника, которому надо подробно ставить задачу, объяснять как все сделать, а потом еще и проверить за ним. При этом нейросеть экономила мне до 90% времени на генерации и редактуре.
Внимание! Эта статья не содержит GPT. Текст написан кожаным мешком от начала и до конца, без привлечения какой-либо автоматизации.
Генерация изображений
Думаю много кто промптил «Путин краб» в MidJourney и сисястых дев в StableDiffusion (до того как нюдсы выпилили из стандартной поставки). Так что на проблемах с пальцами и базовой анатомией останавливаться не буду.
Нейросети по любому достаточно абстрактному запросу рисуют портреты. А в коммерческой иллюстрации портрет почти никогда не нужен; важен сюжет, жанровая сцена и соблюдение заданного стиля. Со стилями железяка более-менее разобралась, а со всем остальным есть проблемы.
Я пытался изобразить девушку сидящую на ветке большого дерева с чашкой чая. Получался в основном кошмар. Очень часто руки или ноги врастали в ствол или ветка торчала из живота. Попробуйте загадать нейроиллюстратору «человек делает стойку на руках» и для вас откроется портал в зловещую долину.
Что получаем по итогу? Чтобы сделать хорошую иллюстрацию надо разбираться в стилях (видеть где они нарушены), понимать как пользоваться перспективой, как выстроить композицию, соображать какой смысл вложить в картинку (метафора).
А еще — как запустить у себя на локальной машине скачанный SD и подружить его с ControlNet, чтобы изображение имело нужную композицию; где качать обученные модели под свою задачу, как обучить свою модель... И попутно разобраться со всеми этими крутилками.
Мне потребовалось полчаса и звонок другу-разработчику уровня CTO, чтобы просто запустить SD. И еще полчаса, чтобы получить какой-то адекватный результат по заданному сюжету, а не просто портрет. Я не представляю как какой-нибудь фрилансер-иллюстратор освоит этот инструментарий без полугодового онлайн курса от NeuroSkillBox.
Думаю вы уже сообразили: если кто-то (например я) не умел создавать коммерчески успешные иллюстрации без нейросети, то он и сейчас это не умеет. Но те, кто умели, смогут их делать быстрее и дешевле и съедят тех, кто не освоит новые инструменты. Такие дела.
Написание кода
На это направление я возлагал самые большие надежды: самостоятельно создавать приложения и не платить по 900k в наносекунду социально не адаптированным людям. Мечта!
Решил начать с простого: написать код на Пайтоне, который пушит аудио файл в Яндекс.Облако и там при помощи СпичКита расшифровывает его в текст. Два десятка строк кода, не больше!
За 5 минут я объяснил ChatGPT какой код мне нужен, а потом 2 часа пытался его запустить и дебажил. Из них примерно час я потратил на то, чтобы понять почему у меня не ставятся модули. Оказалось, что на (в) MacOS вместо pip install %module_name% надо набирать pip3 install %module_name%. Oh God WHY?
А еще 2 часа перед этим я разбирался как использовать функцию работы с speech2text (там есть 3 или больше варианта вызова), какие форматы аудио поддерживаются, где взять API-ключи (достиг успеха только со второй попытки), что такое IAM-токен, создавал object storage, загружал файл и выдавал на него права... Все это относительно простые вопросы если ты 15 лет работаешь в IT (как я) или ты УЖЕ программист (не как я).
Довести программу до рабочего состояния мне так и не удалось. Я не решил проблему с SSL сертификатами и не понял почему API возвращает ошибку «пустое аудио», хотя там 15-минутная запись моих очень умных мыслей.
Говорят на Си (не путать с Xi) все еще сложнее чем на китайском — надо потратить неделю только на то, чтобы подготовиться к разработке (и это если уже знаешь что делать).
Наверно, я смог бы написать калькулятор при помощи ChatGPT. Но зачем?
И наверно, я смог бы решить свою задачу, если бы уже умел писать веб-приложения на Пайтоне и работать с API.
Кажется, мы пришли к одинаковым выводам во всех трех сценариях. Давайте обобщим.
Выводы: жизнь станет лучше, но сложней
- Нейросети помогают, но не делают за тебя. По прежнему нужна хорошая квалификация для получения коммерчески-значимого результата.
- Профессионалам станет легче работать за счет автоматизации рутины. А набор необходимых базовых знаний для новичков будет только расти: делай все то же самое, что и раньше, но теперь с применением нейросетей.
- Вывод Шредингера: хорошая новость — те, кто работают головой, смогут получать результат быстрее; плохая новость — работать головой придется еще больше (и не все смогут).
Мой Телеграм канал, где я рассказываю про свой опыт управления, бизнеса и работы над собой.