Claude 3.7 Sonnet. Полное руководство по использованию самой умной модели Anthropic

Искусственный интеллект становится всё умнее, мощнее и доступнее — использовать эти технологии и не ощутить прирост в продуктивности уже невозможно. Недавно компания Anthropic представила свою самую интеллектуальную модель на сегодняшний день — Claude 3.7 Sonnet. Это первая гибридная модель рассуждения на рынке, и она меняет правила игры. Разбираемся, что в ней особенного и как её использовать для решения сложных задач.

На связи Роман Шарафутдинов! Я маркетолог, продюсер, специалист по нейросетям и спикер. Занимаюсь стратегическим маркетингом, продюсированием, помогаю экспертам, блогерам, предпринимателям и фрилансерам внедрять нейросети в свою работу.

Подписывайтесь на мой Телеграм-канал, где я делюсь еще большим количеством полезностей из мира нейросетей и маркетинга.

Помню, как в начале 2025 года я перестал активно использовать Claude — количество необоснованных отказов и ограничений сводило на нет все преимущества. Но теперь новая модель стала не только умнее, но и значительно полезнее!

Почему Claude 3.7 Sonnet — это революция в мире ИИ

Пока OpenAI недавно анонсировала, что GPT-5 будет унифицированной моделью, Anthropic уже выпустила Claude 3.7 Sonnet, который способен как на быстрые ответы, так и на глубокие рассуждения, опережая конкурентов в этом подходе к разработке ИИ.

Ключевое отличие Claude 3.7 Sonnet от предыдущих моделей — это гибридный режим работы. Он может функционировать как в режиме обычной языковой модели (LLM), так и в режиме рассуждения (reasoning model). Это означает, что модель может «думать» над вопросами столько, сколько попросят пользователи, и в зависимости от продолжительности рассуждений ответы могут значительно различаться.

Ключевые возможности Claude 3.7 Sonnet

1. Режим расширенного мышления (Extended Thinking Mode)

Пожалуй, самая заметная функция — возможность расширенного мышления. В отличие от большинства моделей ИИ, которые дают мгновенные ответы, Claude 3.7 Sonnet может выделить время на «размышления» перед тем, как ответить на вопросы. Этот процесс размышления виден пользователям, делая рассуждения ИИ более прозрачными.

При использовании API пользователи могут точно контролировать, сколько «размышлений» требуется модели. Вы можете указать Claude думать определенное количество токенов, до предела вывода в 128 тысяч токенов. Это позволяет балансировать между скоростью и стоимостью в зависимости от качества ответов.

Вот пример кода на TypeScript для режима расширенного мышления:

```typescript import Anthropic from '@anthropic-ai/sdk'; const client = new Anthropic(); const response = await client.messages.create({ model: "claude-3-7-sonnet-20250219", max_tokens: 20000, thinking: { type: "enabled", budget_tokens: 16000 }, messages: [{ role: "user", content: "Существует ли бесконечное количество простых чисел таких, что n mod 4 == 3?" }] }); // Вывод как процесса мышления, так и итогового ответа console.log(response); ``` Ответ API будет содержать блоки как мышления, так и текстового содержания: ```json { "content": [ { "type": "thinking", "thinking": "Чтобы подойти к этому, давайте подумаем о том, что мы знаем о простых числах...", "signature": "zbbJhbGciOiJFU8zI1NiIsImtakcjsu38219c0.eyJoYXNoIjoiYWJjMTIzIiwiaWFxxxjoxNjE0NTM0NTY3fQ...." }, { "type": "text", "text": "Да, существует бесконечно много простых чисел таких, что..." } ] } ```

Для людей, которым нужна более высокая точность, особенно по сложным темам, таким как математика, физика или программирование, режим расширенного мышления имеет огромное значение.

Модель может прорабатывать проблемы шаг за шагом, подобно тому, как мыслят люди, что приводит к более надежным ответам.

2. Увеличенная выходная емкость

Claude 3.7 Sonnet поддерживает до 128 тысяч выходных токенов (в бета-версии), что в более чем 15 раз превышает предыдущие ограничения.

Это очень полезно для:

- Генерации сложного кода

- Детальной документации планирования

- Написания текстов большого объема

- Обработки объемных задач анализа данных

Эта расширенная емкость означает, что модель может справляться с намного более сложными задачами без ограничений по токенам.

3. Улучшенные возможности программирования

В качестве разработчика, это то, чему я больше всего рад. Модель демонстрирует значительные улучшения в программировании во многих областях:

- Планирование и решение сложных задач кодирования

- Обработка полноценных обновлений стека

- Работа со сложными кодовыми базами

- Создание сложных веб-приложений и панелей управления с нуля

- Производство готового к использованию кода с меньшим количеством ошибок

Несколько технологических компаний, таких как Cursor, Cognition, Vercel и Replit, уже протестировали Claude 3.7 Sonnet и обнаружили, что он работает лучше, чем другие модели для реальных задач кодирования.

4. Снижение ненужных отказов

По данным Anthropic, Claude 3.7 Sonnet делает более тщательные различия между вредными и безвредными запросами, уменьшая ненужные отказы на 45% по сравнению с предыдущими моделями. Это помогает ИИ быть более полезным, не блокируя постоянно разумные запросы.

Это огромный плюс, потому что одна из причин, по которой я использовал Claude все меньше и меньше в последние пару месяцев, — это высокая частота отказов. Честно говоря, это была раздражающая особенность.

5. Claude Code

Claude Code — это совершенно новый инструмент командной строки для того, что Anthropic называет «агентным программированием». В настоящее время доступен как ограниченная исследовательская превью-версия, он позволяет разработчикам давать существенные инженерные задачи Claude прямо из своего терминала.

Инструмент действует как партнер по программированию, который может:

- Искать и читать код

- Редактировать файлы

- Писать и запускать тесты

- Фиксировать и отправлять код в GitHub

- Использовать инструменты командной строки

- Держать вас в курсе на каждом этапе

При раннем тестировании было обнаружено, что Claude Code может выполнять задачи за один подход, которые обычно занимают более 45 минут ручной работы, сокращая время разработки.

Claude Code в настоящее время доступен как ограниченная исследовательская превью-версия. Разработчики, заинтересованные в его тестировании, должны присоединиться к программе предварительного просмотра.

Производительность Claude 3.7 Sonnet

Производительность Claude 3.7 Sonnet показывает значительные улучшения по сравнению с предыдущими моделями в нескольких ключевых областях:

Производительность в программировании

Claude 3.7 Sonnet показал впечатляющие результаты на тестах программирования и реальных испытаниях. Он достигает производительности на уровне современных технологий на SWE-bench Verified, который оценивает способность моделей ИИ решать реальные проблемы программного обеспечения.

Производительность в рассуждениях

Anthropic также рассказала о том, как Claude 3.7 Sonnet достигает современной производительности на TAU-bench, фреймворке, который тестирует ИИ-агентов на сложных реальных задачах с взаимодействием пользователя и инструментов.

Компания говорит, что их цель с Claude Code — лучше понять, как разработчики используют Claude для программирования, что поможет им внести улучшения в будущие модели.

Как использовать возможности Claude 3.7 Sonnet на максимум

Чтобы извлечь максимальную пользу из Claude 3.7 Sonnet, важно понимать, как правильно формулировать запросы.

После анализа документации Anthropic и проведения сотен экспериментов, я выявил ключевые техники, которые раскрывают весь потенциал Claude:

1) XML-теги. Ваше секретное оружие для структуры

Думайте о XML-тегах как о родном языке Claude. В то время как GPT-4 может работать с различными подходами к форматированию, Claude был специально оптимизирован для XML-структуры.

Вот шаблон, который меняет правила игры:

``` <text> Ваш входной контент здесь </text> ```

Имена тегов не имеют значения — важен последовательный формат `<тег>`. Это простое изменение может значительно улучшить понимание ваших намерений Claude.

2) Протокол прямой коммуникации

Помните, как ваши школьные учителя всегда говорили «будьте конкретны»? Этот совет стоит своего веса в золоте при работе с Claude. Я обнаружил, что четкие, прямые инструкции всегда превосходят многословные запросы.

Вместо:

«Не могли бы вы взглянуть на этот текст и, возможно, обобщить основные моменты?»

Используйте:

«Обобщите основные идеи из предоставленного текста в тегах используя 4 маркированных пункта.»

3) Контроль вывода: Техника «Формат-Первым»

Вот мощный шаблон, который я обнаружил для контроля вывода Claude:

``` <format> → идея 1 → идея 2 → идея 3 </format> ```

Предоставляя точный формат, который вы хотите, и начиная ответ ассистента с первого токена (например, «→»), вы можете устранить естественную тенденцию Claude быть излишне разговорчивым.

4) Метод назначения персонажа

Хотите разблокировать еще лучшую производительность? Назначьте Claude конкретную роль. Но вот в чем хитрость — сделайте его *лучшей* версией этой роли.

Я заметил значительно лучшие результаты, используя «Ты лучший копирайтер в мире» вместо просто «Ты копирайтер».

5) Протокол мышления вслух

Здесь все становится интересным. Применяя двухэтапный процесс мышления, вы можете значительно улучшить рассуждения Claude:

``` <thinking> Внутренний процесс рассуждения здесь </thinking> <answer> Окончательный отполированный ответ здесь </answer> ```

6) Техника улучшения примеров

Few-shot prompting (подход с несколькими примерами) не просто полезен — он трансформирующий. Я обнаружил, что предоставление 2-3 высококачественных примеров может улучшить качество ответа до 80%.

7) Сеть безопасности «Я не знаю»

Хотите предотвратить галлюцинации? Добавьте эту простую фразу:

«Отвечай только если знаешь или можешь сделать хорошо обоснованное предположение; в противном случае, скажи, что не знаешь.»

8) Стратегия позиционирования документа

Для длинных документов размещайте инструкции в конце запроса. Claude уделяет особое внимание финальным частям вашего запроса, делая это позиционирование важным для сложных задач.

9) Активация пошагового мышления

Добавление фразы «Думай шаг за шагом» запускает более методичный процесс рассуждения в Claude. Это особенно эффективно для сложных задач решения проблем.

10) Фреймворк декомпозиции задач

Разбивайте сложные задачи на четкие шаги:

1. Первая цель

2. Вторая цель

3. Финальные требования к выводу

11) Метод цепного промтинга

Иногда разделение сложной задачи на отдельные запросы дает лучшие результаты, чем попытка выполнить все за один раз.

12) Техника «Релевантность-Первым»

Для больших документов, начните с: «Вот самое релевантное предложение в контексте:» Это помогает Claude сначала сфокусироваться на самой важной информации.

Как получить доступ к Claude 3.7 Sonnet

Claude 3.7 Sonnet теперь доступен как на веб-сайте Claude, так и через API. Чтобы получить доступ через интерфейс чата, вы можете попробовать следующие каналы:

- Веб-браузер интерфейс

- iOS приложение

- Android приложение

Просто переключитесь на Claude 3.7 Sonnet из выпадающего списка моделей.

Все планы Claude могут получить доступ к модели, включая Free, Pro, Team и Enterprise. Однако режим расширенного мышления доступен только для платных планов (Pro, Team и Enterprise).

Разработчики также могут получить доступ к Claude 3.7 Sonnet через:

- Anthropic API

- Amazon Bedrock

- Google Cloud's Vertex AI

При использовании API разработчики имеют полный контроль над бюджетом мышления модели, позволяя указывать, сколько токенов модель может использовать для мышления.

Вот пример вызова API с использованием TypeScript:

```typescript import Anthropic from '@anthropic-ai/sdk'; const anthropic = new Anthropic({ apiKey: 'my_api_key', // по умолчанию process.env["ANTHROPIC_API_KEY"] }); const msg = await anthropic.messages.create({ model: "claude-3-7-sonnet", max_tokens: 1024, messages: [{ role: "user", content: "Привет, Claude" }], }); console.log(msg); ```

Ценообразование Claude 3.7 Sonnet

Как я уже упоминал, Claude 3.7 Sonnet включен в бесплатный тарифный план на claude.ai, но без режима расширенного мышления. Вы также можете выбрать обновление своего аккаунта до Pro (20 долларов в месяц) или Team (30 долларов в месяц).

- Pro тариф: Полный доступ, включая режим расширенного мышления

- Team и Enterprise планы: Полный доступ с дополнительными функциями для организаций

Claude 3.7 Sonnet сохраняет ту же ценовую политику, что и предыдущие модели:

- $3 за миллион входных токенов

- $15 за миллион выходных токенов

Это ценообразование включает токены мышления при использовании режима расширенного мышления. Для пользователей API есть возможности для экономии:

- До 90% экономии затрат с кэшированием запросов

- 50% экономии затрат с пакетной обработкой

Пример использования для бизнес-задач: Финансовый анализ

После тестирования нескольких моделей ИИ для создания финансовых стратегий и решения сложных математических задач, Claude 3.7 Sonnet показал впечатляющие результаты, особенно в обработке запросов с неоднозначными формулировками.

Например, при запросе:

"Какие нетехнологические акции имеют хорошую дивидендную доходность, отличную ликвидность, растущую чистую прибыль, растущий свободный денежный поток и выросли на 50% или более за последние два года?"

В то время как другие модели не смогли найти подходящие акции или предоставили неточные данные, Claude 3.7 Sonnet выявил пять компаний, полностью соответствующих заданным критериям: PWP, ARIS, VNO, SLG и AKR.

Это демонстрирует сильные способности к рассуждению модели при работе с неоднозначными запросами и сложными данными.

Практические примеры для разработчиков

Пример 1: Интеграция Claude 3.7 Sonnet для анализа данных продаж

```typescript import Anthropic from '@anthropic-ai/sdk'; async function analyzeSalesData() { const client = new Anthropic({ apiKey: process.env.ANTHROPIC_API_KEY, }); const salesData = ` Квартал 1: Продукт A: 125000₽, Продукт B: 95000₽, Продукт C: 210000₽ Квартал 2: Продукт A: 142000₽, Продукт B: 102000₽, Продукт C: 198000₽ Квартал 3: Продукт A: 138000₽, Продукт B: 118000₽, Продукт C: 187000₽ Квартал 4: Продукт A: 156000₽, Продукт B: 132000₽, Продукт C: 178000₽ `; const response = await client.messages.create({ model: "claude-3-7-sonnet-20250219", max_tokens: 2000, thinking: { type: "enabled", budget_tokens: 8000 }, messages: [{ role: "user", content: `Проанализируй следующие данные о продажах по кварталам и дай мне: 1. Какая линейка продуктов показала лучшую динамику? 2. Есть ли тревожные тенденции? 3. Какие рекомендации ты дашь на следующий квартал? ДАННЫЕ ПРОДАЖ: ${salesData}` }] }); // Вывод как процесса мышления, так и итогового ответа console.log(response.content); } analyzeSalesData(); ```

Пример 2: Создание веб-интерфейса с расширенным режимом мышления

```javascript import React, { useState } from 'react'; import axios from 'axios'; function ClaudeThinkingInterface() { const [prompt, setPrompt] = useState(''); const [thinking, setThinking] = useState(''); const [response, setResponse] = useState(''); const [isLoading, setIsLoading] = useState(false); const [thinkingBudget, setThinkingBudget] = useState(5000); const generateResponse = async () => { setIsLoading(true); setThinking(''); setResponse(''); try { const result = await axios.post('/api/claude', { prompt, thinkingBudget }); if (result.data.thinking) { setThinking(result.data.thinking); } setResponse(result.data.response); } catch (error) { console.error('Ошибка при генерации ответа:', error); setResponse('Произошла ошибка при обработке запроса.'); } finally { setIsLoading(false); } }; return ( <div className="container"> <h1>Claude 3.7 Sonnet с режимом мышления</h1> <div className="input-group"> <textarea value={prompt} onChange={(e) => setPrompt(e.target.value)} placeholder="Введите ваш запрос здесь..." rows={5} /> <label> Бюджет на мышление (токены): <input type="number" value={thinkingBudget} onChange={(e) => setThinkingBudget(Number(e.target.value))} min={0} max={16000} /> </label> <button onClick={generateResponse} disabled={isLoading || !prompt} > {isLoading ? 'Генерация...' : 'Получить ответ'} </button> </div> {thinking && ( <div className="thinking-section"> <h2>Процесс мышления:</h2> <div className="thinking-content"> {thinking.split('\n').map((line, i) => ( <p key={i}>{line}</p> ))} </div> </div> )} {response && ( <div className="response-section"> <h2>Ответ:</h2> <div className="response-content"> {response.split('\n').map((line, i) => ( <p key={i}>{line}</p> ))} </div> </div> )} </div> ); } export default ClaudeThinkingInterface; ```

Выводы:

Почему Claude 3.7 Sonnet изменит ваш подход к работе?

Для меня как разработчика наличие более мощной модели ИИ означает, что я могу быть более уверен в том, что она будет лучше осведомлена о кодовой базе моего проекта и более способна генерировать более безопасный и более полный код.

Способность понимать контекст всей кодовой базы особенно ценна. Предыдущие модели часто теряли представление о том, как различные части проекта соединяются вместе, но Claude 3.7 Sonnet, похоже, поддерживает более целостное понимание крупных проектов.

Для исследователей возможность глубокого мышления этой модели означает меньшую вероятность галлюцинаций и генерацию более осмысленных и фактических ответов. Видимый процесс рассуждений также помогает исследователям понять, как модель пришла к своим выводам, что важно для доверия и проверки.

Для обычных пользователей ответы от этой новой модели на самом деле более надежны и менее роботизированы. Более длинное окно контекста и улучшенное рассуждение приводят к разговорам, которые ощущаются более естественными и полезными.

Для тех, кто работает с большими объемами данных, эта модель открывает совершенно новые возможности для автоматизации анализа и принятия решений.

Claude 3.7 Sonnet — это не просто очередное обновление, это новая эра в взаимодействии человека с ИИ. Попробуйте сами и убедитесь, что разница заметна с первого запроса.

А вы уже успели протестировать новую модель Claude 3.7 Sonnet? Поделитесь своими впечатлениями! На решении каких задач вы планируете использовать режим расширенного мышления?

Подписывайтесь на мой Телеграм-канал, где я делюсь еще большим количеством полезностей из мира нейросетей и маркетинга.

3
1 комментарий