Как мы корпоративный AI тренировали

Все началось с того, что мы в "Intelion Cloud" – компании, которая, как следует из названия, занимается облачными решениями, надумали рассказать нейросети все, что сами знаем о своей работе и воспитать идеального ИИ-ассистента. Посвятить её в знания о структуре Группы "Intelion", регламентах работы, функционале сотрудников и так далее.

33

Преимущества Tesla H100 в ML

Меня зовут Руслан, я инженер-программист, автор YouTube канала Ruslan Dev, специализируюсь на облачных вычислениях и машинном обучении. В этом кейсе я расскажу о своем опыте разработки больших языковых моделей (LLM). Так как один из самых передовых графических процессоров Н100 стоит как крыло самолета, я арендовал ее через облачный сервис immers.cl…

22

Вышла новая опенсорс модель Llama 3 Reflection 70 превосходит, Claude 3.5 Sonnet и GPT-4o.

Вышла новая опенсорс модель Llama 3 Reflection 70 превосходит, Claude 3.5 Sonnet и GPT-4o.

Почему Llama 3.1 - лучшая открытая нейросеть

В последние месяцы выходит большое количество нейросетей, но только небольшое количество из них заслуживает внимания. Сегодня поговорим о нейросети *Meta Lama 3.1 (признана в РФ экстремистской организацией и запрещена).

22

Llama 3.1 и Mistral Large 2

В прошлом месяце вышли две интересных модели - Llama 3.1, улучшенная версия Llama 3, и Mistral Large 2.

Нейроновости #8 | Юникод

Нейроновости #8 | Юникод

Краткая выжимка новостей по нейросетям за последнее время

88

Как я обучил модель, которая понимает русский лучше GPT 3.5 Turbo

Меня зовут Ruslan Dev и в этой статье я расскажу, как я смог обучить модель, которая превзошла GPT 3.5 Turbo на русскоязычной части MT-Bench. Также я рассмотрю новую конфигурацию для обучения на двух графических процессорах параллельно с помощью accelerate и deepspeed.

22

Чем отличаются языковые модели и их эволюция

Предпосылкой к созданию языковых моделей стало стремление ученых создать системы, которые могли бы понимать естественный язык. Один из первых, кто занялся этой задачей, был Норберт Винер в 1948 году, предложивший идею по созданию устройств, способных моделировать человеческое мышление и язык. Однако первые языковые модели, в современном понимании,…

33

Meta* расширяет свои инструменты для создания искусственного интеллекта для рекламодателей

Meta* расширяет свои инструменты для создания искусственного интеллекта для рекламодателей
44

Как запустить Llama 3 в Visual Studio Code на своем компьютере - пошаговое руководство

Как запустить Llama 3 в Visual Studio Code на своем компьютере - пошаговое руководство

Я знаю, я знаю. Идея запустить модель искусственного интеллекта с 8 миллиардами параметров на своем ноутбуке может показаться несложной только для технически подкованных людей. Но не волнуйтесь! В этой статье - пошаговое руководство, с помощью которого это сможет сделать каждый.

1616

Meta* выпустила Llama 3 - самую мощную языковую модель с открытым исходным кодом

Meta* выпустила Llama 3 - самую мощную языковую модель с открытым исходным кодом

Несколько часов назад компания Meta выпустила новую и самую мощную версию своей открытой модели большого языка (LLM) Llama 3. В релиз вошли две версии модели: Llama 3 8B, содержащая 8 миллиардов параметров, и Llama 3 70B, содержащая 70 миллиардов параметров. Обе версии поставляются в базовом варианте и варианте с настройкой по инструкциям.

77

5 способов использовать LLM на вашем ноутбуке

Развертывайте мощные языковые модели на своем персональном компьютере для индивидуальной кастомизации и оптимизации возможностей искусственного интеллекта, обеспечивая при этом высокий уровень контроля, конфиденциальности и персонализации.

Справочник по выбору GPU для работы с большими языковыми моделями Llama

Dalle-3
2727
22

Суммаризация текста с помощью LLaMA-2 13B для новичков

LLM модель типа LLaMA-2, вышедшая в июле 2023 года, умеет многое с помощью правильно составленного текстового запроса (промта) без дополнительного программирования. Одна из очень полезных возможностей это суммаризация текста, c помощью которой можно сделать краткую выдержку по большому тексту даже на русском языке.

"Brain linked with chipset", стиль: artstation, Kandinsky 2.2
33

FractalGPT: появилось второе демо с алгоритмом фрактального синтеза ответа

Мы с командой разрабатываем FractalGPT - проект самообучающегося ИИ на базе больших языковых моделей(LLM) и логического вывода (reasoning). В этой статье мы расскажем о разработанном нами новом подходе, который называется fractal answer synthesis. Фрактальный синтез ответа позволяет существенно уменьшить уровень «галлюционирования» LLM и, как следс…

Просто фрактальный мозг
77