Реализация AI агента на базе LLM с нуля – что включает цикл разработки

Разработка AI агента, использующего большие языковые модели (LLM) – это малоизвестный пока еще и потому интересный инженерный процесс, охватывающий весь цикл создания от идеи до финального развертывания. Технические стандарты разработки агентских систем пока еще формируются. В данной статье я поделюсь своим опытом и рассмотрю ключевые этапы, технол…

Как выбрать LLM-модель, которая заберет у вас работу

Как выбрать LLM-модель, которая заберет у вас работу

Пока одни спорят, заменит ли ИИ людей, другие уже выбирают, какую нейросеть поставить себе в напарники. ChatGPT, Claude, Mistral, а еще китайские модели, которые неожиданно набирают популярность — надо бы разобраться в этом хаосе.

Как и зачем запускать LLM локально 🚀

С развитием технологий искусственного интеллекта открытые языковые модели (Open Source LLM) стали достойной альтернативой коммерческим решениям, таким как #ChatGPT, Google Gemini и Claude 3. Запуск моделей на локальном компьютере имеет ряд преимуществ, но требует определенных технических ресурсов. В этой статье разберем, зачем это нужно и как можно…

1

Современные требования к инфраструктуре для агентских AI-систем. Развертывание, поддержка и операционные расходы

Агентские AI-системы, которые могут взаимодействовать с окружением посредством сложных интеграций,принимать автономные решения и адекватно реагировать на обратную связь от пользователя, требуют серьезной инфраструктурной поддержки. В этой статье я собираюсь рассмотреть ключевые аспекты развертывания и поддержки таких систем как в облаке, так и на в…

1

Claude 3.7 Sonnet. Полное руководство по использованию самой умной модели Anthropic

Искусственный интеллект становится всё умнее, мощнее и доступнее — использовать эти технологии и не ощутить прирост в продуктивности уже невозможно. Недавно компания Anthropic представила свою самую интеллектуальную модель на сегодняшний день — Claude 3.7 Sonnet. Это первая гибридная модель рассуждения на рынке, и она меняет правила игры. Разбираем…

4

Оценка больших языковых моделей в 2025 году: пять методов

Оценка больших языковых моделей в 2025 году: пять методов

Поскольку оценка систем LLM является многомерной задачей, важно разработать комплексную методологию измерения их производительности. В этой статье рассматриваются основные проблемы существующих методов оценки и предлагаются решения для их устранения.

1

Бенчмаркинг AI-агентов: оценка производительности в реальных задачах

Бенчмаркинг AI-агентов: оценка производительности в реальных задачах

AI-агенты уже решают реальные задачи — от обслуживания клиентов до сложной аналитики данных. Но как убедиться, что они действительно эффективны? Ответ заключается в комплексной оценке AI-агентов.

Рассказываю про together.ai: облачную платформу для ИИ-разработчиков и тестирования языковых моделей

Если вы хотите попробовать разные языковые модели ИИ без сложных настроек или ищете облачную инфраструктуру для работы с нейросетями, together.ai может быть интересным вариантом. Эта платформа ориентирована прежде всего на разработчиков, но также позволяет обычным пользователям тестировать разные ИИ-модели в режиме чата.

Люди больше не нужны? Профессии, которые уже заменил ИИ

Люди больше не нужны? Профессии, которые уже заменил ИИ

2023 - 2024 годы стали переломными для искусственного интеллекта. Развитие технологий ускорилось, а внедрение нейросетей затронуло буквально все сферы жизни. Мощные мультимодальные модели, такие как GPT-4 от OpenAI и Gemini Ultra от Google, теперь способны анализировать не только текст, но и изображения, аудио, код и даже сложные бизнес-данные.

1

Новый ИИ от Илона Маска Grok-3: действительно ли он так свободен в суждениях?

Компания xAI Илона Маска представила новую версию своего чат-бота Grok-3, который уже завоевал лидерство в рейтингах среди ИИ-моделей. В слепых тестах на платформе Chatbot Arena он обошёл ChatGPT, Gemini и DeepSeek, продемонстрировав выдающиеся результаты в программировании, математике и обработке сложных запросов.

Феномен DeepSeek: разбираем причины шума вокруг нейросети

Феномен DeepSeek: разбираем причины шума вокруг нейросети

Понедельник, 27 января, начался с крупнейшего однодневного падения компании в истории фондового рынка США. Акции NVIDIA упали на 18%, а прибыль снизилась на $589 миллиардов. А все из-за китайской версии «синего кита» — точнее, выхода ИИ-модели DeepSeek-R1. Издание The New Yorker назвало ситуацию «Sputnik moment», по аналогии с отправкой первого чел…

1

Red Teaming для LLM: Полное пошаговое руководство по Red Teaming больших языковых моделей

Red Teaming для LLM: Полное пошаговое руководство по Red Teaming больших языковых моделей

Помните ситуацию, когда Gemini излишне старался быть политкорректным и отображал на всех сгенерированных изображениях только представителей небелых рас? Хотя это могло показаться забавным для многих, данный инцидент наглядно показал, что по мере роста возможностей больших языковых моделей (LLM) возрастают и их уязвимости. Это связано с тем, что сло…