Возможности ИИ удваиваются каждые 7 месяцев: как быстро он догоняет человека

ИИ-системы становятся всё более способными — и это уже не просто ощущение, а зафиксированная закономерность. Согласно данным исследовательской организации METR (Measuring Exponential Task Resolution), за последние 6 лет способность ИИ решать практические задачи удваивалась примерно каждые 7 месяцев.

Возможности ИИ удваиваются каждые 7 месяцев: как быстро он догоняет человека

Если этот темп сохранится, уже через пять лет ИИ сможет автоматизировать проекты, на которые у человека уходит целый месяц. Это не футуризм — это ближайшее будущее, подтверждённое эмпирическими измерениями.

METR предложила новый способ оценки ИИ-моделей: "50%-task-completion time horizon". Он показывает, какую по длительности задачу ИИ может выполнить с вероятностью успеха 50% — аналог того, сколько времени на такую же задачу потребовалось бы человеку.

На сегодня, например, одна из самых продвинутых моделей — Claude 3.7 Sonnet — способна справляться с задачами длиной примерно 50 минут. Это реальный ориентир, который позволяет сравнивать ИИ и человека не по баллам в тестах, а по понятийному признаку: насколько сложную задачу можно доверить ИИ от начала до конца.

В течение 6 лет эта «временная планка» удваивалась каждые 7 месяцев. Иными словами, ИИ становится вдвое «выносливее» и «умнее» каждые полгода с небольшим. Это напоминает закон Мура — только применительно не к вычислениям, а к спектру реальных задач, которые можно делегировать искусственному разуму.

Где ИИ по-прежнему слаб

Несмотря на прогресс, современные ИИ-модели далеки от полноценной автономной работы. В частности:

  • Успешность резко падает на задачах длительностью более 4 часов — менее 10% успешных завершений
  • Даже с большим контекстным окном (например, 100К токенов), модели начинают «теряться» гораздо раньше — на 20–30К
  • Логическая цепочка из нескольких действий часто рвётся, даже если каждая часть по отдельности ИИ выполняет без ошибок
  • Модели плохо справляются с адаптацией к собственным ошибкам и с задачами, требующими пересмотра решений

Почему это важно

Метрики вроде METR предлагают новый взгляд на прогресс в ИИ: не абстрактная «интеллектуальность», а реальное, измеряемое время задач, с которыми ИИ справляется. Такой подход особенно полезен для бизнеса, исследователей и разработчиков, которым важна практическая применимость.

А если темпы роста сохранятся, нас ждёт скачок: через 2–3 года ИИ сможет закрывать недельные задачи, а через 5 — автоматизировать месячные проекты в области разработки, аналитики, исследований и других профессий знаний.

1 комментарий