Anthropic запускает новую гибридную ИИ модель, которая «думает» сколько захотите

Anthropic выпускает новую ИИ модель под названием Claude 3.7 Sonnet. Расскажу, зачем вообще модели думать (и особенно – долго).

🔥 Еще больше интересного в моем канале Продуктовые штучки

Подробности

Claude 3.7 Sonnet — первая модель искусственного интеллекта от Anthropic, способная «рассуждать».

Anthropic называет Claude 3.7 Sonnet первой в отрасли «гибридной моделью рассуждений ИИ», потому что это единая модель, которая может давать как ответы в реальном времени, так и более взвешенные, «продуманные» ответы на вопросы.

Пользователи могут выбирать, активировать ли «рассудочные» способности модели ИИ, которые побуждают Claude 3.7 Sonnet «думать» в течение короткого или длительного периода времени.

Варианты "раздумий":

- Быстрые ответы (standard thinking)

- Углубленный анализ (extended thinking)

- Продвинутые рассуждения (advanced reasoning)

Anthropic выпускает Claude 3.7 Sonnet в то время, когда лаборатории ИИ поставляют новые модели ИИ с головокружительной скоростью. Anthropic исторически придерживалась более методичного, ориентированного на безопасность подхода. Но на этот раз компания стремится возглавить гонку.

Но как долго это продлится — вопрос. OpenAI может быть близка к выпуску собственной гибридной модели ИИ; генеральный директор компании Сэм Альтман заявил, что она появится через «месяцы».

Зачем объединили?

Это усилия Anthropic по упрощению пользовательского опыта продуктов ИИ.

Большинство чат-ботов ИИ сегодня имеют пугающий выбор модели, который заставляет пользователей выбирать из нескольких различных вариантов, которые различаются по стоимости и возможностям.

Anthropic предпочитает, чтобы вы не думали об этом: в идеале одна модель делает всю работу. В конечном итоге Anthropic хотела бы, чтобы Claude самостоятельно определял, как долго ему следует «думать» над вопросами, не требуя от пользователей предварительного выбора.

Выбор того, как долго может рассуждать модель. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Ftechcrunch.com%2F2025%2F02%2F24%2Fanthropic-launches-a-new-ai-model-that-thinks-as-long-as-you-want%2F&postId=1831635" rel="nofollow noreferrer noopener" target="_blank">Источник</a>.
Выбор того, как долго может рассуждать модель. Источник.

Справедливости ради нужно сказать, что OpenAI также скоро уйдет от разделения моделей.

Как оценивается модель на фоне других?

По оценке создателей, модель хорошо справляется с кодированием, финансовыми и юридическими задачами.

Claude по-прежнему не хватает веб-поиска в реальном времени: как и у других моделей, дата отсечения знаний версии 3.7 — октябрь 2024 года.

По оценкам The Verge, yовая модель искусственного интеллекта «гибридного мышления» от Anthropic — самая умная на сегодняшний день

Кому доступна и сколько стоит?

Claude 3.7 Sonnet будет доступен всем пользователям и разработчикам в понедельник, сообщила Anthropic, но только те, кто заплатит за премиум-планы чат-бота Claude от Anthropic, получат доступ к функциям рассуждения. Бесплатные пользователи Claude получат стандартную версию Claude 3.7 Sonnet без рассуждений, которая, по утверждению Anthropic, превосходит ее предыдущую передовую модель ИИ Claude 3.5 Sonnet (да, компания пропустила номер.)

то есть за $3 можно ввести примерно 750 000 слов, больше слов, чем вся серия «Властелин колец»

Claude 3.7 Sonnet стоит $3 за 1 миллион входных токенов и $15 – за миллион выходных токенов. Это делает его дороже, чем o3-mini от OpenAI ($1,10 за 1 миллион входных токенов/$4,40 за 1 миллион выходных токенов) и R1 от DeepSeek (55 центов за 1 миллион входных токенов/$2,19 за 1 миллион выходных токенов), но стоит иметь в виду, что o3-mini и R1 — это строго рассуждающие модели, а не гибриды, как Claude 3.7 Sonnet.

Что такое модели рассуждений?

Рассуждения — метод, к которому обратились многие лаборатории искусственного интеллекта, поскольку традиционные методы повышения производительности искусственного интеллекта теряют свою актуальность.

Модели рассуждений, такие как o3-mini, R1, Gemini 2.0 Flash Thinking от Google и Grok 3 (Think) от xAI, используют больше времени и вычислительной мощности перед ответом на вопросы. Модели разбивают проблемы на более мелкие шаги, что повышает точность окончательного ответа.

Модели рассуждений не обязательно думают или рассуждают так, как это делает человек, но их процесс моделируется после дедукции.

Claude 3.7 Sonnet демонстрирует свою фазу формулирования ответа с помощью «видимого блокнота». Пользователи увидят полный ход мыслей Claude для большинства подсказок, но некоторые части могут быть отредактированы в целях обеспечения доверия и безопасности. Anthropic утверждает, что оптимизировала режимы мышления Claude; разработчики, использующие API Anthropic, могут контролировать «бюджет» для мышления, скорость торговли и стоимость качества ответа.

Процесс рассуждений модели. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Ftechcrunch.com%2F2025%2F02%2F24%2Fanthropic-launches-a-new-ai-model-that-thinks-as-long-as-you-want%2F&postId=1831635" rel="nofollow noreferrer noopener" target="_blank">Источник</a>
Процесс рассуждений модели. Источник

Anthropic также заявляет, что Claude 3.7 Sonnet будет реже отказываться отвечать на вопросы, чем предыдущие модели, утверждая, что модель способна проводить более тонкие различия между вредными и безвредными подсказками. Anthropic заявляет, что она сократила ненужные отказы на 45% по сравнению с Claude 3.5 Sonnet. Это происходит в то время, когда некоторые другие лаборатории ИИ пересматривают свой подход к ограничению ответов своего чат-бота ИИ.

Пожалуйста, поддержите меня, поставьте лайк!

3
1 комментарий