бомжи на виси не заходят, зачем тут писать новости про эти игрушки для бедных?
Rндекс
4 вполне терпимо для бюджетника, много приложений одновременно в памяти не удержит, но хоть в текущем скорее всего проблем не будет. У некоторых производителей до сих пор хватает совести и с тремя, и даже двумя гб продавать, спасибо хоть не это
На самом деле чтобы модель сама понимала когда нужен CoT а когда нет было бы неплохо. Когда он не лежит пользуюсь DeepSeek, по умолчанию всегда включаю CoT, но иногда кажется что это только заводит модель в какие-то дебри
Никакого импичмента не будет, дел он наворотит побольше чем в прошлый срок, но жирка в США предостаточно чтобы даже намеков на какое-то серьезное сопротивление не возникло. Через 4 года уйдет спокойно на пенсию, и потом с ним до конца жизни все будут бесконечно и безрезультатно судиться, скриньте
Fun fact: модель вообще не контролируют отдельно сначала думать, а потом выводить ответ, модель сама это генерит, обрамляя кусок с раздумьями токенами "начинаю-думать" и "закончили-думать". Чем дольше модель "думает", тем лучше ответ, но как удлинить раздумья если она сама все генерит?
Ответ до смешного прост: ждём, когда модель выведет токен "закончили-думать", тупо подменяем его на "погодите-ка" (ну то есть Wait), и заставляем генерить дальше. То есть этот такой нейрогазлайтинг, насильно заставляем модель в себе сомневаться.
Почему Wait, а не что-то другое? Потому что измерили, и Wait работает лучше
Исторически большинство сайтов в интернете пишутся латиницейЗря сболтнул, ой зря, теперь ещё и обязательно на .рф домен переехать обяжут
В целом мне кажется среди всех альтернатив такое ограничение одно из самых "человечных", Казахстан пока не сильно лютует в целом, прижимает только где видимо совсем разгул. Прожил там два года без каких-либо проблем и особых неудобств связанных с нерезидентством, все нравилось, уехал по в общем-то не связанным с Казахстаном причинам.
Мнение: весь рынок акций превратился в казино, особенно в хайповых отраслях никакими взвешенными решениями и не пахнет, уровень спекуляций уже к крипте приближается, а значит обсуждать все это смысла нет
больше нельзя шутить.
открою секрет — почти все модели все свои CoT прячут от пользователя и показывают только ответ. Токены и деньги тратятся, да, но вы это читать не должны. Более того ChatGPT вообще не дает возможность прочитать CoT для защиты подхода от копирования.
Я прям уже начинаю сомневаться в математике, но если пользоваться данными из таблички то там цифры такие:
Public-400 High tokens: 111M
Public-400 Low tokens: 9.5B
Это выходит 280к токенов на задачу в "лайт" варианте и 24млн по хардкору. То есть это 750 книжных страниц для лайт варианта, и под сотню тысяч страниц (если учесть semi-private тесты, они еще дороже) для дорогой модели, это дичь
Чёт в табличках high и low то efficiency, то compute, я запутался, названия похоже перепутал, но все цифры корректные с точностью до округления
ARC-AGI довольно большой и "дорогой" тест, особенно для CoT моделей которые на рассуждения кучу токенов тратят. Результаты есть для o3-high и o3-low — разница в длине рассуждений (high/low здесь "оптимальность", ниже=дороже), и вторая дала результаты лучше, но использовала в 170+ раз больше компьюта.
Прогонка o3-high по тесту стоила около $9000, это все цифры от автора бенчмарка, а про цену прогонки для o3-low говорить запретили. Правда несложная арифметика даёт нам $9000×170 = $1 500 000.
Полтора миллиона долларов стоили эти 500 тестов и эта эффективность в 87,5%
Знал про ключ, но думал что это просто компромиссный текущий вариант, который можно на любую информацию раскатать. Спасибо что поправляете.
Могу сильно ошибаться в деталях, очень давно уже этим интересовался, но вроде суть "квантовой криптографии" в передаче сообщения квантовыми средствами без участия шифрования вообще. Ну то есть вместо того чтобы информацию передавать обычными каналами где все могут "подслушать", но шифровать ее и делать подслушанное бесполезным без пароля, информация изначально передается при помощи квантового запутывания, которое исключает возможность подслушивания как таковую, поэтому передавать можно все в "сыром" виде. То есть да, идея не новая и работающая, но требует полной переделки всей инфраструктуры передачи сообщений, на всех "передатчиках" и "приемниках", нет алгоритмов чтобы просто шифровать иначе, а отправлять как обычно.
Вы удивитесь, насколько системы шифрования "стоят на месте". Вы можете по-разному хранить пароль, передавать его, генерировать, не знаю даже что ещё. Но абсолютно все шифрование основано на единственом принципе, что умножить два огромных простых числа легко, а вот разложить готовое произведение назад в простые числа сложно. Алгоритм Шора для квантовых компьютеров делает именно это, раскладывает на простые числа. Чтобы что-то этому противопоставить нужна не просто куча программисто-часов, нужен какой-то существенно другой математический принцип в основу, который не будет так же ломаться квантами.
Первый в приоритете Claude потому что артефакты это чудо, это буквально "приложение по запросу" и я хочу это как встроенную функцию в телефоне уже вчера. Правда в питоне Клод любит делать излишне детальный код, приходится каждый раз пояснять что "давай попроще".
Дальше Gemini Pro через AI Studio потому что это кажется самая хорошая модель бесплатно, и контекстное окно бешенное, можно скармливать ранее написанные скрипты целиком и просить поправить, удобно.
ЧатЖПТ в конце просто потому что "фишечек" нет, а бесплатное окно ежедневное для хорошей модели заканчивается быстро.
4 примера:
- Захотел посчитать как много нужно откладывать ежемесячно и в течение скольких лет чтобы на старости лет на хлеб с маслом хватало (типичные успешные рассуждения успешного висишника). Калькуляторов таких уйма онлайн, но лень было перебирать что нужно именно под мои хотелки. Claude написал код с первой же попытки, и сразу же запустил, поскольку это был артефакт с реакт кодом. Это прям магия, приложение по запросу за 30 секунд, хоть и простенькое.
- В недавно вышедшей карто-собирательной игре бывают события с особенными картами, и известными вероятностями выпадения оных. Попросил тот же клод написать скрипт который будет пытаться искать эти карты много раз, чтобы потом усреднить результаты и так посчитать средние показатели всякие. Тоже с первого раза, уточнял только интерфейс чтобы скринить удобнее было.
- Люблю фоном для работы на втором мониторе включать ютуб, но не люблю автовоспроизведение (слишком много мусолит одно и то же), хотелось сделать рандом из кучи отдельных плейлистов. Этот скрипт сделал вроде Gemini 1.5 Pro, на питоне. Запускаю теперь одной командой, он скрейпит плейлисты из JSON, шаффлит, и выдает ссылку с готовым новым плейлистом, можно открывать и смотреть.
- На Ютубе очень надоел кликбейт везде. Написал скрипт (во много запросов и частично с ручной правкой) с ChatGPT который открывает мою главную Ютуба, берет 7 видео сверху, запрашивает через стороннюю библиотеку транскрипт каждого, отправляет их на Gemini API с запросом очень кратко пересказать, и выводит страничку с по сути "текстовыми превьюшками" видосов, а я не вижу ни заголовков, ни картинок, выбираю именно по сути. Тут отдельно скажу, что я не знал практически ничего — ни как взаимодействовать с Gemini по API (очень просто, как оказалось), ни как скрейпить Ютуб, ни как получать транскрипты, все это частично модель подсказывала, частично гуглил и предлагал модели (и можно же ведь просто скопировать введение в how-to библиотеки и все)
Если вы знаете какое-то место где может быть реклама, но ее там ещё нет — надо только немножко подождать
Не знаю вообще как бренд Jaguar переживет такое дикое падение спроса среди пользователей виси
Многое из этого пробовал, практически во всем натыкаешься либо на неточности (порой фатальные), либо на то, что вытащить реально уникальный совет из нейронки невозможно, и в результате многое просто бесполезно если здравым смыслом обладаешь. Но полезно наработать интуицию чтобы понимать о чем скорее всего сетка нафантазирует, а чего в обучающем сете было достаточно чтобы только корректные корреляции сохранить.
Вот что точно незаменимо уже для меня стало — средне-легкие скрипты для автоматизации чего угодно теперь пишутся за 10 минут вместо пары часов гугления библиотек и синтаксиса.
на 1000 умножать вообще очень удобно, кстати
Если пытаться что-то существенное делать на планшете — да, айпад на три головы выше, и приложениями, и ОС, и интеграцией всего. Если в основном медиа (видео, кино, книги, комиксы) — любой планшет на андроиде тот же экспириенс даст за вдвое/втрое/подставьте-свое меньше денег, и плюсом еще от открытости системы скорее всего только проще станет.
Гугл прям как я — если с первого раза не получилось прыгнуть выше головы, то срочно прекращаем все попытки
Не уверен на 100%, но кажется бесплатный Gemini это маленькая моделька Flash, и ее дают использовать бесплатно без ограничений как у chatgpt или claude, но обратная сторона медали в том, что модель прям заметно тупее.
Однако в Google AI Studio https://aistudio.google.com можно выбрать Gemini Pro и использовать ее в менее красивом интерфейсе, но зато по лимитам API, то есть 50 бесплатных запросов в день (что, кажется, больше чем дают бесплатно OpenAI и Anthropic)
В то что Боинг всех нас переживет верю, а вот в Интел как-то не верится. Акции у обоих в цене потеряли одинаково, но вот полностью проебали все полимеры только интел
Насчет яркости соглашусь, понятно что бывает нужно подсветить вечером пока пункт еще работает но уже темно, понятно что для рекламы бренда наверное можно и ночью светить, но то что у всего этого никак не регулируется яркость практически всегда это треш, при том что по-моему уже даже очень дешевое освещение простейшему диммеру подвластно
только что ради интереса запросил выгрузку всех своих фото, архив весит 40гб, но для гугла и моих 15гб на гугл диске эти 40гб равны (практически) нулю
Не очень понятно, при чем тут инди и начинающие, если тул для воссоздания -> уже существующей игры <- по семи года записи геймплея.