AI, больно! ML и нейросети

+13
с 26.04.2025

Меня зовут Рома Филонов. Я ML-разработчик, работал в крупных компаниях вроде Яндекса, Сбера и ВКонтакте. ТГ - t.me/Ai_bolno_ml

8 подписчиков
3 подписки

То, что модель начинает поддакивать пользователю настраивается еще на стадии ее обучения. И это может обернутся тем, что нейросетка будет "врать" на простых фактах, пытаясь подмазаться к пользователю. Во время ее обучения, можно перемудрить и по итогу сильно потерять в итоговом качестве

Огонь! Спасибо за подробный гайд
С лицом для куклы, гптшка косячит постоянно

Да, похоже на то, это была большая проблема с точки зрения железа и точки зрения софта нейросетей как сделать сразу много много кадров видео связанных между логически. Видеомодели очень бурно развиваются последние полгода, думаю в 26м году мы увидим уже модели которые будут 40 минутные видео с озвучкой делать

да, там не Jira, я для как синоним использовал, чтобы все читающие понимали о чем речь

1

Ахах, классика! 😂 Та презентация реально легендарная. Иногда жизнь сама пишет сценарии лучше любого ИИ

1

Также в самой статье я привел промпт на русском для получения такой фотки
Скопируйте весь текст и вставьте его в генератор - он сам переведет его на английский

Можно зайти в раздел Explore
Нажать на понравишуюся картинку и ткнуть в кнпоку Edit prompt
Там покажет какой текстовый промпт был использован для генерации это картинки
Прикрепил скрин с примером или заходите смотрите видео, там все показываю - https://youtu.be/cLwdAxm4Uqw?si=K6tXBnYrJiTIrBX6

Современные диффузионные модели (FLUX и новее) с момента перехода от простых текстовых эмбедеров CLIP на
связку CLIP + LLM(у FLUX например используется T5), обрели очень высокий гайденс к текстовому промпту. Если для Stable Diffusion можно было хоть до посинения делать красивые длинные промпты, она все равно не выдала бы хорошее соответствие к текстовому описанию из-за CLIP модели, текстовый эмбедер был маленький и не вывозил сложные сцены.

Поэтому "делать проще" - можно, но тем самым вы не используете всю мощь модели. Она сделает очень точное соответствие вашему промпту и потеть самому составлять такое описание НЕ НАДО. Обязательно используйте Prompt enhancer - отдельные сервисы или просто ChatGPT, которой вы напишете "позирующий парень в свитере, мягкий свет, спокойный фон" и скажете сделай промпт более подробным