открою секрет — почти все модели все свои CoT прячут от пользователя и показывают только ответ. Токены и деньги тратятся, да, но вы это читать не должны. Более того ChatGPT вообще не дает возможность прочитать CoT для защиты подхода от копирования.
Я прям уже начинаю сомневаться в математике, но если пользоваться данными из таблички то там цифры такие:
Public-400 High tokens: 111M
Public-400 Low tokens: 9.5B
Это выходит 280к токенов на задачу в "лайт" варианте и 24млн по хардкору. То есть это 750 книжных страниц для лайт варианта, и под сотню тысяч страниц (если учесть semi-private тесты, они еще дороже) для дорогой модели, это дичь
Чёт в табличках high и low то efficiency, то compute, я запутался, названия похоже перепутал, но все цифры корректные с точностью до округления
ARC-AGI довольно большой и "дорогой" тест, особенно для CoT моделей которые на рассуждения кучу токенов тратят. Результаты есть для o3-high и o3-low — разница в длине рассуждений (high/low здесь "оптимальность", ниже=дороже), и вторая дала результаты лучше, но использовала в 170+ раз больше компьюта.
Прогонка o3-high по тесту стоила около $9000, это все цифры от автора бенчмарка, а про цену прогонки для o3-low говорить запретили. Правда несложная арифметика даёт нам $9000×170 = $1 500 000.
Полтора миллиона долларов стоили эти 500 тестов и эта эффективность в 87,5%
Знал про ключ, но думал что это просто компромиссный текущий вариант, который можно на любую информацию раскатать. Спасибо что поправляете.
Могу сильно ошибаться в деталях, очень давно уже этим интересовался, но вроде суть "квантовой криптографии" в передаче сообщения квантовыми средствами без участия шифрования вообще. Ну то есть вместо того чтобы информацию передавать обычными каналами где все могут "подслушать", но шифровать ее и делать подслушанное бесполезным без пароля, информация изначально передается при помощи квантового запутывания, которое исключает возможность подслушивания как таковую, поэтому передавать можно все в "сыром" виде. То есть да, идея не новая и работающая, но требует полной переделки всей инфраструктуры передачи сообщений, на всех "передатчиках" и "приемниках", нет алгоритмов чтобы просто шифровать иначе, а отправлять как обычно.
Вы удивитесь, насколько системы шифрования "стоят на месте". Вы можете по-разному хранить пароль, передавать его, генерировать, не знаю даже что ещё. Но абсолютно все шифрование основано на единственом принципе, что умножить два огромных простых числа легко, а вот разложить готовое произведение назад в простые числа сложно. Алгоритм Шора для квантовых компьютеров делает именно это, раскладывает на простые числа. Чтобы что-то этому противопоставить нужна не просто куча программисто-часов, нужен какой-то существенно другой математический принцип в основу, который не будет так же ломаться квантами.
Первый в приоритете Claude потому что артефакты это чудо, это буквально "приложение по запросу" и я хочу это как встроенную функцию в телефоне уже вчера. Правда в питоне Клод любит делать излишне детальный код, приходится каждый раз пояснять что "давай попроще".
Дальше Gemini Pro через AI Studio потому что это кажется самая хорошая модель бесплатно, и контекстное окно бешенное, можно скармливать ранее написанные скрипты целиком и просить поправить, удобно.
ЧатЖПТ в конце просто потому что "фишечек" нет, а бесплатное окно ежедневное для хорошей модели заканчивается быстро.
4 примера:
- Захотел посчитать как много нужно откладывать ежемесячно и в течение скольких лет чтобы на старости лет на хлеб с маслом хватало (типичные успешные рассуждения успешного висишника). Калькуляторов таких уйма онлайн, но лень было перебирать что нужно именно под мои хотелки. Claude написал код с первой же попытки, и сразу же запустил, поскольку это был артефакт с реакт кодом. Это прям магия, приложение по запросу за 30 секунд, хоть и простенькое.
- В недавно вышедшей карто-собирательной игре бывают события с особенными картами, и известными вероятностями выпадения оных. Попросил тот же клод написать скрипт который будет пытаться искать эти карты много раз, чтобы потом усреднить результаты и так посчитать средние показатели всякие. Тоже с первого раза, уточнял только интерфейс чтобы скринить удобнее было.
- Люблю фоном для работы на втором мониторе включать ютуб, но не люблю автовоспроизведение (слишком много мусолит одно и то же), хотелось сделать рандом из кучи отдельных плейлистов. Этот скрипт сделал вроде Gemini 1.5 Pro, на питоне. Запускаю теперь одной командой, он скрейпит плейлисты из JSON, шаффлит, и выдает ссылку с готовым новым плейлистом, можно открывать и смотреть.
- На Ютубе очень надоел кликбейт везде. Написал скрипт (во много запросов и частично с ручной правкой) с ChatGPT который открывает мою главную Ютуба, берет 7 видео сверху, запрашивает через стороннюю библиотеку транскрипт каждого, отправляет их на Gemini API с запросом очень кратко пересказать, и выводит страничку с по сути "текстовыми превьюшками" видосов, а я не вижу ни заголовков, ни картинок, выбираю именно по сути. Тут отдельно скажу, что я не знал практически ничего — ни как взаимодействовать с Gemini по API (очень просто, как оказалось), ни как скрейпить Ютуб, ни как получать транскрипты, все это частично модель подсказывала, частично гуглил и предлагал модели (и можно же ведь просто скопировать введение в how-to библиотеки и все)
Если вы знаете какое-то место где может быть реклама, но ее там ещё нет — надо только немножко подождать
Не знаю вообще как бренд Jaguar переживет такое дикое падение спроса среди пользователей виси
Многое из этого пробовал, практически во всем натыкаешься либо на неточности (порой фатальные), либо на то, что вытащить реально уникальный совет из нейронки невозможно, и в результате многое просто бесполезно если здравым смыслом обладаешь. Но полезно наработать интуицию чтобы понимать о чем скорее всего сетка нафантазирует, а чего в обучающем сете было достаточно чтобы только корректные корреляции сохранить.
Вот что точно незаменимо уже для меня стало — средне-легкие скрипты для автоматизации чего угодно теперь пишутся за 10 минут вместо пары часов гугления библиотек и синтаксиса.
на 1000 умножать вообще очень удобно, кстати
Если пытаться что-то существенное делать на планшете — да, айпад на три головы выше, и приложениями, и ОС, и интеграцией всего. Если в основном медиа (видео, кино, книги, комиксы) — любой планшет на андроиде тот же экспириенс даст за вдвое/втрое/подставьте-свое меньше денег, и плюсом еще от открытости системы скорее всего только проще станет.
Гугл прям как я — если с первого раза не получилось прыгнуть выше головы, то срочно прекращаем все попытки
Не уверен на 100%, но кажется бесплатный Gemini это маленькая моделька Flash, и ее дают использовать бесплатно без ограничений как у chatgpt или claude, но обратная сторона медали в том, что модель прям заметно тупее.
Однако в Google AI Studio https://aistudio.google.com можно выбрать Gemini Pro и использовать ее в менее красивом интерфейсе, но зато по лимитам API, то есть 50 бесплатных запросов в день (что, кажется, больше чем дают бесплатно OpenAI и Anthropic)
В то что Боинг всех нас переживет верю, а вот в Интел как-то не верится. Акции у обоих в цене потеряли одинаково, но вот полностью проебали все полимеры только интел
Насчет яркости соглашусь, понятно что бывает нужно подсветить вечером пока пункт еще работает но уже темно, понятно что для рекламы бренда наверное можно и ночью светить, но то что у всего этого никак не регулируется яркость практически всегда это треш, при том что по-моему уже даже очень дешевое освещение простейшему диммеру подвластно
только что ради интереса запросил выгрузку всех своих фото, архив весит 40гб, но для гугла и моих 15гб на гугл диске эти 40гб равны (практически) нулю
Пункты выдачи — одно из немногих мест, которое оправдано обвешать и обсветить со всех сторон. Они всегда мелкие и находятся в каком-нибудь углу двора, то есть на какой-то важный облик улицы мало шансов повлиять, и покупатель этот пункт выдачи выбирает исключительно на карте на сайте, а потом его еще найти нужно. Не один раз выискивал в каком-то закоулке пвз, когда приходилось идти не в привычный, пвз вайлдбериз гораздо проще найти когда они все дико розовые.
У меня около 10000 фотографий, но они хранятся в качестве до 16мп с вот этой опцией, и поэтому они просто не считаются против этого лимита 15гб. С точки зрения сервиса они весят 0 байт, я даже посмотреть это нигде не могу, они просто не весят ничего. Что-то (600мб) весят только какие-то рандомные несколько фото, которые за эти 10 лет почему-то загрузились в оригинальном качестве, и гугл посчитал их против 15гб лимита. TLDR — гугл хранит фото и видео бесплатно, если включить опцию "сжимать до 16мп"
Я имею в виду, что все мои фото и видео кроме нескольких видимо сотен случайных хранятся и просто не считаются против лимита, и я ничего не плачу. Всего фото около 10 тысяч наверное.
В гугл фото бесплатное хранилище и фото, и видео, если разрешить сжимать фото до 16мп (это чуть больше 12мп, которые были в айфонах вплоть до про 14 или 15), а видео до 1080p. 10+ лет уже храню все фотки только там, из 15 бесплатных гигабайт на гугл диске все мои фото и видео занимают 600 мегабайт (потому что видимо несколько лет назад я зачем-то на время выключил пережатие до 16мп)
Без иронии — самым грустным при переходе из совсем детства в хоть немного нормальное осознание окружающего мира было понимание, что никакой справедливости нигде не существует
Кому интересно почему США могут чего-то там требовать от Турции — потому что они сильнее и никто не хочет с ними ссориться. Оказывается, когда решаешь со всем миром силой помериться, надо сначала прикинуть, а нет ли кого-то сильнее.
Несколько раз обращал внимание на материал на улице, в хорошем смысле, не могу сказать что он прям "похож на дерево" (особенно когда он просто под ботинками), но действительно приятный, ощущается надёжно, не дёшево, действительно как некая 50/50 смесь дерева с его плюсами и минусами и пластика с его.
Но про "натуральный и экологичный" вы конечно пиздец приукрасили. Конечно он не "выделяет химию", так не делает, по-моему, вообще никакой материал. Но это по-прежнему в большой степени полимеры, то есть проблемы с длительным неразложением и микропластиком остаются, плюс не понятно, подвергаются ли доски переработке.
Пластик не зло во плоти, но его использование априори не экологично, это всегда надо иметь в виду.
Напомните сколько там денях инвестиций запланировали привлечь, думаю сегодня на самосвалах из-за границы повезут, пора начинать считать
Целый день уже все новостные сайты на свете не трубили, что чатботы разумны, захватят нас и будут вводить зонды куда не надо. ОпенЭйАй без такого загнется сразу же, надо срочно подогреть всех либо пиздежом, либо простейшей функцией "спроси че-нить у этого мешка кожанного"
Ставки по вкладам вырастут, больше денег у людей станет, ну опять выиграли только ну что за экономика
больше нельзя шутить.