Qnoc

+4988
с 2022
5 подписчиков
2 подписки

открою секрет — почти все модели все свои CoT прячут от пользователя и показывают только ответ. Токены и деньги тратятся, да, но вы это читать не должны. Более того ChatGPT вообще не дает возможность прочитать CoT для защиты подхода от копирования.

Я прям уже начинаю сомневаться в математике, но если пользоваться данными из таблички то там цифры такие:

Public-400 High tokens: 111M
Public-400 Low tokens: 9.5B

Это выходит 280к токенов на задачу в "лайт" варианте и 24млн по хардкору. То есть это 750 книжных страниц для лайт варианта, и под сотню тысяч страниц (если учесть semi-private тесты, они еще дороже) для дорогой модели, это дичь

Чёт в табличках high и low то efficiency, то compute, я запутался, названия похоже перепутал, но все цифры корректные с точностью до округления

ARC-AGI довольно большой и "дорогой" тест, особенно для CoT моделей которые на рассуждения кучу токенов тратят. Результаты есть для o3-high и o3-low — разница в длине рассуждений (high/low здесь "оптимальность", ниже=дороже), и вторая дала результаты лучше, но использовала в 170+ раз больше компьюта.

Прогонка o3-high по тесту стоила около $9000, это все цифры от автора бенчмарка, а про цену прогонки для o3-low говорить запретили. Правда несложная арифметика даёт нам $9000×170 = $1 500 000.

Полтора миллиона долларов стоили эти 500 тестов и эта эффективность в 87,5%

Знал про ключ, но думал что это просто компромиссный текущий вариант, который можно на любую информацию раскатать. Спасибо что поправляете.

Могу сильно ошибаться в деталях, очень давно уже этим интересовался, но вроде суть "квантовой криптографии" в передаче сообщения квантовыми средствами без участия шифрования вообще. Ну то есть вместо того чтобы информацию передавать обычными каналами где все могут "подслушать", но шифровать ее и делать подслушанное бесполезным без пароля, информация изначально передается при помощи квантового запутывания, которое исключает возможность подслушивания как таковую, поэтому передавать можно все в "сыром" виде. То есть да, идея не новая и работающая, но требует полной переделки всей инфраструктуры передачи сообщений, на всех "передатчиках" и "приемниках", нет алгоритмов чтобы просто шифровать иначе, а отправлять как обычно.

Вы удивитесь, насколько системы шифрования "стоят на месте". Вы можете по-разному хранить пароль, передавать его, генерировать, не знаю даже что ещё. Но абсолютно все шифрование основано на единственом принципе, что умножить два огромных простых числа легко, а вот разложить готовое произведение назад в простые числа сложно. Алгоритм Шора для квантовых компьютеров делает именно это, раскладывает на простые числа. Чтобы что-то этому противопоставить нужна не просто куча программисто-часов, нужен какой-то существенно другой математический принцип в основу, который не будет так же ломаться квантами.

9

Первый в приоритете Claude потому что артефакты это чудо, это буквально "приложение по запросу" и я хочу это как встроенную функцию в телефоне уже вчера. Правда в питоне Клод любит делать излишне детальный код, приходится каждый раз пояснять что "давай попроще".

Дальше Gemini Pro через AI Studio потому что это кажется самая хорошая модель бесплатно, и контекстное окно бешенное, можно скармливать ранее написанные скрипты целиком и просить поправить, удобно.

ЧатЖПТ в конце просто потому что "фишечек" нет, а бесплатное окно ежедневное для хорошей модели заканчивается быстро.

1

4 примера:
- Захотел посчитать как много нужно откладывать ежемесячно и в течение скольких лет чтобы на старости лет на хлеб с маслом хватало (типичные успешные рассуждения успешного висишника). Калькуляторов таких уйма онлайн, но лень было перебирать что нужно именно под мои хотелки. Claude написал код с первой же попытки, и сразу же запустил, поскольку это был артефакт с реакт кодом. Это прям магия, приложение по запросу за 30 секунд, хоть и простенькое.
- В недавно вышедшей карто-собирательной игре бывают события с особенными картами, и известными вероятностями выпадения оных. Попросил тот же клод написать скрипт который будет пытаться искать эти карты много раз, чтобы потом усреднить результаты и так посчитать средние показатели всякие. Тоже с первого раза, уточнял только интерфейс чтобы скринить удобнее было.
- Люблю фоном для работы на втором мониторе включать ютуб, но не люблю автовоспроизведение (слишком много мусолит одно и то же), хотелось сделать рандом из кучи отдельных плейлистов. Этот скрипт сделал вроде Gemini 1.5 Pro, на питоне. Запускаю теперь одной командой, он скрейпит плейлисты из JSON, шаффлит, и выдает ссылку с готовым новым плейлистом, можно открывать и смотреть.
- На Ютубе очень надоел кликбейт везде. Написал скрипт (во много запросов и частично с ручной правкой) с ChatGPT который открывает мою главную Ютуба, берет 7 видео сверху, запрашивает через стороннюю библиотеку транскрипт каждого, отправляет их на Gemini API с запросом очень кратко пересказать, и выводит страничку с по сути "текстовыми превьюшками" видосов, а я не вижу ни заголовков, ни картинок, выбираю именно по сути. Тут отдельно скажу, что я не знал практически ничего — ни как взаимодействовать с Gemini по API (очень просто, как оказалось), ни как скрейпить Ютуб, ни как получать транскрипты, все это частично модель подсказывала, частично гуглил и предлагал модели (и можно же ведь просто скопировать введение в how-to библиотеки и все)

5

Если вы знаете какое-то место где может быть реклама, но ее там ещё нет — надо только немножко подождать

Не знаю вообще как бренд Jaguar переживет такое дикое падение спроса среди пользователей виси

1

Многое из этого пробовал, практически во всем натыкаешься либо на неточности (порой фатальные), либо на то, что вытащить реально уникальный совет из нейронки невозможно, и в результате многое просто бесполезно если здравым смыслом обладаешь. Но полезно наработать интуицию чтобы понимать о чем скорее всего сетка нафантазирует, а чего в обучающем сете было достаточно чтобы только корректные корреляции сохранить.

Вот что точно незаменимо уже для меня стало — средне-легкие скрипты для автоматизации чего угодно теперь пишутся за 10 минут вместо пары часов гугления библиотек и синтаксиса.

17

на 1000 умножать вообще очень удобно, кстати

6
2
1
1
1

Если пытаться что-то существенное делать на планшете — да, айпад на три головы выше, и приложениями, и ОС, и интеграцией всего. Если в основном медиа (видео, кино, книги, комиксы) — любой планшет на андроиде тот же экспириенс даст за вдвое/втрое/подставьте-свое меньше денег, и плюсом еще от открытости системы скорее всего только проще станет.

15

Гугл прям как я — если с первого раза не получилось прыгнуть выше головы, то срочно прекращаем все попытки

6

Не уверен на 100%, но кажется бесплатный Gemini это маленькая моделька Flash, и ее дают использовать бесплатно без ограничений как у chatgpt или claude, но обратная сторона медали в том, что модель прям заметно тупее.

Однако в Google AI Studio https://aistudio.google.com можно выбрать Gemini Pro и использовать ее в менее красивом интерфейсе, но зато по лимитам API, то есть 50 бесплатных запросов в день (что, кажется, больше чем дают бесплатно OpenAI и Anthropic)

6

В то что Боинг всех нас переживет верю, а вот в Интел как-то не верится. Акции у обоих в цене потеряли одинаково, но вот полностью проебали все полимеры только интел

2

Насчет яркости соглашусь, понятно что бывает нужно подсветить вечером пока пункт еще работает но уже темно, понятно что для рекламы бренда наверное можно и ночью светить, но то что у всего этого никак не регулируется яркость практически всегда это треш, при том что по-моему уже даже очень дешевое освещение простейшему диммеру подвластно

только что ради интереса запросил выгрузку всех своих фото, архив весит 40гб, но для гугла и моих 15гб на гугл диске эти 40гб равны (практически) нулю

Пункты выдачи — одно из немногих мест, которое оправдано обвешать и обсветить со всех сторон. Они всегда мелкие и находятся в каком-нибудь углу двора, то есть на какой-то важный облик улицы мало шансов повлиять, и покупатель этот пункт выдачи выбирает исключительно на карте на сайте, а потом его еще найти нужно. Не один раз выискивал в каком-то закоулке пвз, когда приходилось идти не в привычный, пвз вайлдбериз гораздо проще найти когда они все дико розовые.

24

У меня около 10000 фотографий, но они хранятся в качестве до 16мп с вот этой опцией, и поэтому они просто не считаются против этого лимита 15гб. С точки зрения сервиса они весят 0 байт, я даже посмотреть это нигде не могу, они просто не весят ничего. Что-то (600мб) весят только какие-то рандомные несколько фото, которые за эти 10 лет почему-то загрузились в оригинальном качестве, и гугл посчитал их против 15гб лимита. TLDR — гугл хранит фото и видео бесплатно, если включить опцию "сжимать до 16мп"

Я имею в виду, что все мои фото и видео кроме нескольких видимо сотен случайных хранятся и просто не считаются против лимита, и я ничего не плачу. Всего фото около 10 тысяч наверное.

В гугл фото бесплатное хранилище и фото, и видео, если разрешить сжимать фото до 16мп (это чуть больше 12мп, которые были в айфонах вплоть до про 14 или 15), а видео до 1080p. 10+ лет уже храню все фотки только там, из 15 бесплатных гигабайт на гугл диске все мои фото и видео занимают 600 мегабайт (потому что видимо несколько лет назад я зачем-то на время выключил пережатие до 16мп)

1

Без иронии — самым грустным при переходе из совсем детства в хоть немного нормальное осознание окружающего мира было понимание, что никакой справедливости нигде не существует

22

Кому интересно почему США могут чего-то там требовать от Турции — потому что они сильнее и никто не хочет с ними ссориться. Оказывается, когда решаешь со всем миром силой помериться, надо сначала прикинуть, а нет ли кого-то сильнее.

3
1

Несколько раз обращал внимание на материал на улице, в хорошем смысле, не могу сказать что он прям "похож на дерево" (особенно когда он просто под ботинками), но действительно приятный, ощущается надёжно, не дёшево, действительно как некая 50/50 смесь дерева с его плюсами и минусами и пластика с его.

Но про "натуральный и экологичный" вы конечно пиздец приукрасили. Конечно он не "выделяет химию", так не делает, по-моему, вообще никакой материал. Но это по-прежнему в большой степени полимеры, то есть проблемы с длительным неразложением и микропластиком остаются, плюс не понятно, подвергаются ли доски переработке.

Пластик не зло во плоти, но его использование априори не экологично, это всегда надо иметь в виду.

Напомните сколько там денях инвестиций запланировали привлечь, думаю сегодня на самосвалах из-за границы повезут, пора начинать считать

Целый день уже все новостные сайты на свете не трубили, что чатботы разумны, захватят нас и будут вводить зонды куда не надо. ОпенЭйАй без такого загнется сразу же, надо срочно подогреть всех либо пиздежом, либо простейшей функцией "спроси че-нить у этого мешка кожанного"

6
1

Ставки по вкладам вырастут, больше денег у людей станет, ну опять выиграли только ну что за экономика

67
5
4
1