Perplexity AI запустила функцию Deep Research. Обзор новой функции и ее сравнение с DeepSeek R-1, ChatGPT и Gemini
В Perplexity появилась новая функция под названием Deep Research, которая выполняет десятки поисковых запросов, читает сотни источников и анализирует материалы, чтобы предоставить исчерпывающий ответ по каждому вашему запросу.
Когда Google представил модель 1.5 Pro с функцией глубокого исследования в Gemini еще в декабре 2024 года, я понял, что пройдет совсем немного времени, прежде чем OpenAI и Perplexity также выпустят аналогичные функции.
Но вот что действительно интересно: в то время как OpenAI сделала функцию глубокого исследования в ChatGPT эксклюзивной для пользователей с подпиской за 200 долларов в месяц, Perplexity предлагает свою версию глубокого исследования и для не-подписчиков (с ограниченным количеством ответов в день).
Так что если вы пользователь ChatGPT, который раздумывает над тем, чтобы перейти на новую версию только ради функции глубокого исследования, вам стоит подумать дважды. Возможно, эти 200 долларов лучше потратить на что-то другое.
Телеграм-бот SYNTX предоставляет доступ к более чем 30 ИИ-инструментам. Без ВПН, оплата любой картой, запросы на любом языке, пробуйте бесплатно! В боте есть GPTo1, Gemini, Claude, Grok, Llama, Perplexity, DeepSeek, MidJourney, DALL-E 3, Flux, Ideogram и Recraft, LUMA, Runway, Kling, Sora, Pika, Hailuo AI (Minimax), Suno, синхронизатор губ, Редактор с 12 различными ИИ-инструментами для ретуши фото. ☝Это только часть функций, доступных в SYNTX!
Как получить доступ к функции Deep Research от Perplexity
Зайдите на сайт Perplexity AI и авторизуйтесь. Вы можете найти новую опцию Deep Research в выпадающем меню моделей.
Давайте попробуем выполнить поиск с помощью этого промпта:
Elon Musk announces Grok-3 release with live demo
Нажмите кнопку Submit и дождитесь окончания работы функции глубокого исследования. Вот список всех источников, которые она просмотрела, прежде чем составить полный ответ.
Не удивляйтесь, если поиск займет много времени. Perplexity постарается найти наиболее релевантные статьи из сотен источников, прежде чем составить резюме. В приведенном выше примере глубокое исследование и окончательная генерация ответа заняли около трех минут.
В результате получилась статья из 1100 слов о предстоящем выпуске модели Grok-3 от xAI. Полную версию статьи вы можете прочитать здесь.
Если вы не знали, вы можете преобразовать ответ в Perplexity Page и поделиться им с кем угодно в виде веб-страницы. Просто нажмите кнопку экспорта и выберите опцию Perplexity Page.
Вы сможете легко определить контент, созданный с помощью Deep Research, потому что рядом с ответом есть небольшой значок-индикатор.
Если вы хотите распечатать ответ или разместить его на своем сайте, есть возможность экспортировать его в PDF-файл или в файл с разметкой Markdown..
Сравнение Deep Research с DeepSeek R-1, ChatGPT и Gemini
По данным Perplexity, ее версия Deep Research достигла 21,1 % точности на Humanity's Last Exam, что значительно выше, чем у Gemini Thinking, o3-mini, o1, DeepSeek R-1 и многих других современных моделей.
Друзья, буду рад, если вы подпишетесь на мой телеграм-канал про нейросети и на канал с гайдами и советами по работе с нейросетями - я стараюсь делиться только полезной информацией.
Humanity's Last Exam - это комплексный тест для ИИ-систем, состоящий из более чем 3 000 вопросов по 100+ предметам, от математики и естественных наук до истории и литературы.
Они публикуют эти вопросы в открытом доступе, но при этом сохраняют закрытый тестовый набор вопросов для оценки модели.
Вот один из примеров вопросов:
Hummingbirds within Apodiformes uniquely have a bilaterally paired oval bone, a sesamoid embedded in the caudolateral portion of the expanded, cruciate aponeurosis of insertion of m. depressor caudae. How many paired tendons are supported by this sesamoid bone? Answer with a number. (У колибри, относящихся к отряду Apodiformes, есть уникальная двусторонняя парная овальная кость - сесамоид, встроенный в каудолатеральную часть расширенного крестообразного апоневроза вставки m. depressor caudae. Сколько парных сухожилий поддерживается этой сесамовидной костью? Ответь цифрой.)
Команда также провела SimpleQA - эталонный тест, оценивающий способность языковых моделей отвечать на короткие вопросы, требующие фактов.
Цель SimpleQA - стать простым и надежным набором данных для оценки фактологичности пограничных моделей. Несколько примеров вопросов приведены ниже:
Deep Research от Perplexity показала 93,9 % точности в бенчмарке - базе из нескольких тысяч вопросов, проверяющих достоверность фактов.
SimpleQA - это простая и целенаправленная оценка знаний моделей, и я надеюсь, что этот бенчмарк останется актуальным для следующих поколений передовых моделей.
Что касается скорости, то она довольно высока. Из трех моих последних поисков ответы на все были получены за 3 минуты или меньше. Согласно сообщению в их блоге, они работают над тем, чтобы сделать скорость еще выше.
Используя тот же промпт, я задал Gemini вопрос, используя модель 1.5 Pro с глубоким исследованием. Gemini потребовалось шесть минут, чтобы сформулировать ответ из 1100 слов.
Разница в скорости составляет три минуты, но если быть честным, то Gemini использовала для подготовки ответа 39 сайтов, в то время как Perplexity - 17.
Доступность и ограничения Deep Research в Perplexity
На данный момент Deep Research в Perplexity доступна только в веб-браузере, а в скором времени должна появиться на iOS, Android и Mac.
Pro-подписчики получают неограниченное количество запросов, в то время как пользователи без подписки имеют доступ к ограниченному количеству запросов в день (около 5 запросов в день).
Подписка pro также имеет следующие преимущества:
- Неограниченное количество бесплатных поисков
- 300+ Pro-поисков в день
- Выбор более умного ИИ среди Deepseek R1, OpenAI o3-mini, Claude 3.5 Sonnet, Sonar и других.
- Загрузка неограниченного количества файлов
- Поиск файлов в пространстве
- Пользовательские центры знаний и пространства для совместной работы
Я должен отдать должное Perplexity за быстрый выпуск полезных функций. Даже несмотря на постоянные юридические баталии по вопросам авторских прав - например, иск от The Wall Street Journal, обвиняющий их в использовании контента без разрешения, - они продолжают развиваться и делать ИИ-исследования более доступными.
Мне очень нравится, как Deep Research извлекает подробную информацию, не заставляя вас самостоятельно копаться в десятках ссылок. То, что ответы можно превратить в страницы, которыми можно поделиться, - тоже приятный момент. Она не идеальна, и у нее все еще есть ограничения, но для бесплатного инструмента (с некоторыми ежедневными ограничениями) она очень полезна.
Тем не менее, мне интересно, откроют ли они в конечном итоге API. Это могло бы сделать его еще более мощным для разработчиков, создающих исследовательские инструменты на базе ИИ. В любом случае, интересно посмотреть, как Perplexity будет бороться с OpenAI и Google в этом пространстве, особенно без ценника в 200 долларов.
Телеграм-бот SYNTX предоставляет доступ к более чем 30 ИИ-инструментам. Без ВПН, оплата любой картой, запросы на любом языке, пробуйте бесплатно! В боте есть GPTo1, Gemini, Claude, Grok, Llama, Perplexity, DeepSeek, MidJourney, DALL-E 3, Flux, Ideogram и Recraft, LUMA, Runway, Kling, Sora, Pika, Hailuo AI (Minimax), Suno, синхронизатор губ, Редактор с 12 различными ИИ-инструментами для ретуши фото. ☝Это только часть функций, доступных в SYNTX!
Источник статьи на английском - здесь