Реализация AI агента на базе LLM с нуля – что включает цикл разработки

Разработка AI агента, использующего большие языковые модели (LLM) – это малоизвестный пока еще и потому интересный инженерный процесс, охватывающий весь цикл создания от идеи до финального развертывания. Технические стандарты разработки агентских систем пока еще формируются. В данной статье я поделюсь своим опытом и рассмотрю ключевые этапы, технол…

Современные требования к инфраструктуре для агентских AI-систем. Развертывание, поддержка и операционные расходы

Агентские AI-системы, которые могут взаимодействовать с окружением посредством сложных интеграций,принимать автономные решения и адекватно реагировать на обратную связь от пользователя, требуют серьезной инфраструктурной поддержки. В этой статье я собираюсь рассмотреть ключевые аспекты развертывания и поддержки таких систем как в облаке, так и на в…

1

Почему лучше начинать новый чат в ChatGPT для каждой темы?

При работе с ChatGPT рекомендуется начинать новый чат для каждой новой темы. Это связано с особенностями обработки информации моделью и влияет на её производительность и точность.

2

Что на самом деле показало нашумевшее исследование о «сбежавших и обманывающих» больших языковых моделях

Что на самом деле показало нашумевшее исследование о «сбежавших и обманывающих» больших языковых моделях

Всем привет! В последнее время я заметил множество постов и статей в русскоязычном сегменте интернета, которые ссылаются на одно интересное исследование, но интерпретируют его… скажем так, довольно своеобразно. Часто можно встретить заголовки вроде «ИИ научился обманывать чтобы спастись!» или «Нейросети вышли из-под контроля и пытались сбежать!». Э…

Как ChatGPT может помочь вам в торговле криптовалютой.

Как ChatGPT может помочь вам в торговле криптовалютой.

Инвестирование в акции с помощью Chatgpt: как использовать ChatGPT для анализа компаний (с подсказками!)

Инвестирование в акции с помощью Chatgpt: как использовать ChatGPT для анализа компаний (с подсказками!)
2

Преимущества Tesla H100 в ML

Меня зовут Руслан, я инженер-программист, автор YouTube канала Ruslan Dev, специализируюсь на облачных вычислениях и машинном обучении. В этом кейсе я расскажу о своем опыте разработки больших языковых моделей (LLM). Так как один из самых передовых графических процессоров Н100 стоит как крыло самолета, я арендовал ее через облачный сервис immers.cl…

2

Почему Llama 3.1 - лучшая открытая нейросеть

В последние месяцы выходит большое количество нейросетей, но только небольшое количество из них заслуживает внимания. Сегодня поговорим о нейросети *Meta Lama 3.1 (признана в РФ экстремистской организацией и запрещена).

2

Какую модель GPT-4 следует использовать? Руководство по GPT-4, GPT-4o и GPT-4o Mini GPT-o1

Какую модель GPT-4 следует использовать? Руководство по GPT-4, GPT-4o и GPT-4o Mini GPT-o1

Llama 3.1 и Mistral Large 2

В прошлом месяце вышли две интересных модели - Llama 3.1, улучшенная версия Llama 3, и Mistral Large 2.