Новый Claude 3.7: ИИ-помощник с регулируемыми режимами мышления

Новый Claude 3.7: ИИ-помощник с регулируемыми режимами мышления

Привет! На связи Юлия Рогозина, аналитик бизнес-процессов Sherpa Robotics. В сегодняшней статье я расскажу о новейшей разработке в мире искусственного интеллекта — модели Claude 3.7 от Anthropic, которая впервые позволяет пользователям контролировать глубину "рассуждений" ИИ. Это серьезный технологический прорыв, который может изменить наш подход к автоматизации сложных аналитических задач.

Компания Anthropic, основанная выходцами из OpenAI, представила первую модель искусственного интеллекта, способную выдавать как стандартные ответы, так и демонстрировать «рассуждения» для решения сложных задач в настраиваемом объеме.

Гибридный подход к мышлению

Новая гибридная модель, получившая название Claude 3.7, позволит пользователям и разработчикам легче решать проблемы, требующие как интуитивных, так и пошаговых аналитических рассуждений.

«Пользователь получает значительный контроль над поведением модели — насколько глубоко она будет размышлять, и может выбирать между рассуждениями и интеллектом с одной стороны, и временем и бюджетом с другой», — объясняет Майкл Герстенхабер, руководитель продукта AI-платформы в Anthropic.

Черновик рассуждений

Claude 3.7 также оснащен новой функцией «черновика» (scratchpad), которая показывает процесс рассуждений модели. Подобная функция уже доказала свою популярность в китайской ИИ-модели DeepSeek. Это помогает пользователю понять, как модель работает над проблемой, чтобы при необходимости изменить или уточнить запрос.

По словам Дианны Пенн, руководителя исследовательского направления Anthropic, черновик становится еще полезнее в сочетании с возможностью регулировать уровень «рассуждений» модели. Если, например, модель затрудняется правильно разбить проблему на составляющие, пользователь может попросить ее потратить больше времени на этот процесс.

Гонка за «рассуждающим» ИИ

Ведущие компании в сфере ИИ все больше концентрируются на обучении моделей «рассуждать» над проблемами, чтобы расширить их возможности и области применения. OpenAI, компания, запустившая нынешний бум ИИ с ChatGPT, первой представила рассуждающую ИИ-модель o1 в сентябре 2024 года. С тех пор OpenAI выпустила более мощную версию o3, а конкурирующий Google представил аналогичное предложение для своей модели Gemini под названием Flash Thinking.

Ключевое отличие Claude 3.7 состоит в том, что пользователям не нужно переключаться между разными моделями для доступа к возможностям рассуждения — все встроено в одну модель.

Два типа мышления

Разница между обычной моделью и моделью с рассуждениями аналогична двум типам мышления, описанным нобелевским лауреатом по экономике Даниэлем Канеманом в его книге 2011 года «Думай медленно... решай быстро»: быстрое и инстинктивное мышление Системы 1 и более медленное, обдуманное мышление Системы 2.

Модели типа ChatGPT, известные как большие языковые модели (LLM), выдают мгновенные ответы на запросы, обращаясь к большой нейронной сети. Эти ответы могут быть удивительно умными и связными, но могут не справиться с вопросами, требующими пошаговых рассуждений, включая простую арифметику.

LLM можно заставить имитировать обдуманные рассуждения, если дать ей инструкцию составить план, которому она должна следовать. Однако этот прием не всегда надежен, и модели обычно с трудом решают проблемы, требующие обширного, тщательного планирования.

Обучение с подкреплением

OpenAI, Google и теперь Anthropic используют метод машинного обучения, известный как обучение с подкреплением (reinforcement learning), чтобы научить свои последние модели генерировать рассуждения, ведущие к правильным ответам. Это требует сбора дополнительных обучающих данных от людей о решении конкретных проблем.

Пенн утверждает, что режим рассуждений Claude получил дополнительные данные по бизнес-приложениям, включая написание и исправление кода, использование компьютеров и ответы на сложные юридические вопросы.

«Мы сосредоточились на улучшении технических тем или тем, требующих длительных рассуждений. От наших клиентов мы видим большой интерес к внедрению наших моделей в их реальные рабочие процессы», — говорит Пенн.

Превосходство в программировании

Anthropic заявляет, что Claude 3.7 особенно хорош в решении задач программирования, требующих пошаговых рассуждений, превосходя OpenAI o1 по некоторым тестам, таким как SWE-bench. Компания выпускает новый инструмент, Claude Code, специально разработанный для такого типа программирования с помощью ИИ.

«Модель уже хороша в программировании, — говорит Пенн. — Но дополнительные размышления будут полезны для случаев, требующих очень сложного планирования — например, если вы анализируете чрезвычайно большую базу кода компании».

Что это значит для бизнеса

Появление ИИ с регулируемыми режимами мышления создает существенные возможности для компаний разного масштаба. Организации, которые начнут внедрять такие технологии, получат несколько стратегических преимуществ:

  • Ускорение разработки программного обеспечения. ИИ, способный переключаться между быстрым мышлением и глубоким анализом, может существенно ускорить проверку кода, рефакторинг и документирование проектов, сокращая время вывода продуктов на рынок.
  • Оптимизация юридических и финансовых процессов. Анализ контрактов, нормативных документов и финансовой отчетности требует как быстрых ответов, так и глубоких рассуждений — гибридный подход может сократить затраты на экспертизу до 40%.
  • Дифференциация клиентского сервиса. Интеллектуальные чат-боты и виртуальные ассистенты, способные к настраиваемой глубине рассуждений, могут эффективнее решать проблемы клиентов без эскалации на операторов, повышая удовлетворенность и снижая операционные расходы.

Будущее гибридного ИИ

Способность переключаться между быстрыми интуитивными ответами и глубокими размышлениями — важный шаг в развитии более универсальных и полезных ИИ-систем. Это позволяет одной модели эффективно решать как простые повседневные задачи, так и сложные технические проблемы.

По мере того как ИИ-модели становятся более гибкими в своих подходах к решению задач, мы можем ожидать их более широкого применения в различных отраслях — от обработки текстов и творчества до сложного программирования и принятия стратегических решений.

9
1 комментарий