Llm: статьи и новости по теме

Реализация AI агента на базе LLM с нуля – что включает цикл разработки

Разработка AI агента, использующего большие языковые модели (LLM) – это малоизвестный пока еще и потому интересный инженерный процесс, охватывающий весь цикл создания от идеи до финального развертывания. Технические стандарты разработки агентских систем пока еще формируются. В данной статье я поделюсь своим опытом и рассмотрю ключевые этапы, технол…

Роман Куцев CEO LLM Arena

24 мар

Как выбрать LLM-модель, которая заберет у вас работу

Пока одни спорят, заменит ли ИИ людей, другие уже выбирают, какую нейросеть поставить себе в напарники. ChatGPT, Claude, Mistral, а еще китайские модели, которые неожиданно набирают популярность — надо бы разобраться в этом хаосе.

Алексей Королев

16 мар

Как и зачем запускать LLM локально 🚀

С развитием технологий искусственного интеллекта открытые языковые модели (Open Source LLM) стали достойной альтернативой коммерческим решениям, таким как #ChatGPT, Google Gemini и Claude 3. Запуск моделей на локальном компьютере имеет ряд преимуществ, но требует определенных технических ресурсов. В этой статье разберем, зачем это нужно и как можно…

immers.cloud

14 мар

Современные требования к инфраструктуре для агентских AI-систем. Развертывание, поддержка и операционные расходы

Агентские AI-системы, которые могут взаимодействовать с окружением посредством сложных интеграций，принимать автономные решения и адекватно реагировать на обратную связь от пользователя, требуют серьезной инфраструктурной поддержки. В этой статье я собираюсь рассмотреть ключевые аспекты развертывания и поддержки таких систем как в облаке, так и на в…

Claude 3.7 Sonnet. Полное руководство по использованию самой умной модели Anthropic

Искусственный интеллект становится всё умнее, мощнее и доступнее — использовать эти технологии и не ощутить прирост в продуктивности уже невозможно. Недавно компания Anthropic представила свою самую интеллектуальную модель на сегодняшний день — Claude 3.7 Sonnet. Это первая гибридная модель рассуждения на рынке, и она меняет правила игры. Разбираем…

Роман Куцев CEO LLM Arena

3 мар

Оценка больших языковых моделей в 2025 году: пять методов

Поскольку оценка систем LLM является многомерной задачей, важно разработать комплексную методологию измерения их производительности. В этой статье рассматриваются основные проблемы существующих методов оценки и предлагаются решения для их устранения.

Роман Куцев CEO LLM Arena

27 февр

Бенчмаркинг AI-агентов: оценка производительности в реальных задачах

AI-агенты уже решают реальные задачи — от обслуживания клиентов до сложной аналитики данных. Но как убедиться, что они действительно эффективны? Ответ заключается в комплексной оценке AI-агентов.

AI Nerd

25 февр

Рассказываю про together.ai: облачную платформу для ИИ-разработчиков и тестирования языковых моделей

Если вы хотите попробовать разные языковые модели ИИ без сложных настроек или ищете облачную инфраструктуру для работы с нейросетями, together.ai может быть интересным вариантом. Эта платформа ориентирована прежде всего на разработчиков, но также позволяет обычным пользователям тестировать разные ИИ-модели в режиме чата.

Роман Куцев CEO LLM Arena

24 февр

Люди больше не нужны? Профессии, которые уже заменил ИИ

2023 - 2024 годы стали переломными для искусственного интеллекта. Развитие технологий ускорилось, а внедрение нейросетей затронуло буквально все сферы жизни. Мощные мультимодальные модели, такие как GPT-4 от OpenAI и Gemini Ultra от Google, теперь способны анализировать не только текст, но и изображения, аудио, код и даже сложные бизнес-данные.

AI Nerd

23 февр

Новый ИИ от Илона Маска Grok-3: действительно ли он так свободен в суждениях?

Компания xAI Илона Маска представила новую версию своего чат-бота Grok-3, который уже завоевал лидерство в рейтингах среди ИИ-моделей. В слепых тестах на платформе Chatbot Arena он обошёл ChatGPT, Gemini и DeepSeek, продемонстрировав выдающиеся результаты в программировании, математике и обработке сложных запросов.

Роман Куцев CEO LLM Arena

14 февр

Феномен DeepSeek: разбираем причины шума вокруг нейросети

Понедельник, 27 января, начался с крупнейшего однодневного падения компании в истории фондового рынка США. Акции NVIDIA упали на 18%, а прибыль снизилась на $589 миллиардов. А все из-за китайской версии «синего кита» — точнее, выхода ИИ-модели DeepSeek-R1. Издание The New Yorker назвало ситуацию «Sputnik moment», по аналогии с отправкой первого чел…

Роман Куцев CEO LLM Arena

14 февр

Red Teaming для LLM: Полное пошаговое руководство по Red Teaming больших языковых моделей

Помните ситуацию, когда Gemini излишне старался быть политкорректным и отображал на всех сгенерированных изображениях только представителей небелых рас? Хотя это могло показаться забавным для многих, данный инцидент наглядно показал, что по мере роста возможностей больших языковых моделей (LLM) возрастают и их уязвимости. Это связано с тем, что сло…