Llama: статьи и новости по теме

Истории про нейросети

12 февр

Почему искусственный интеллект допускает ошибки, как написать сайт с помощью нейросети?

Наташа Хазеева

Будущее

2 февр

ИИ — пожиратель энергии, но DeepSeek может это изменить?

На днях DeepSeek поразил всех заявлением о том, что его ИИ модель использует примерно одну десятую мощности, потраченной на модель Llama. Это перевернуло взгляд на то, сколько энергии и ресурсов нужно для разработки искусственного интеллекта. Не переоценена ли NVIDIA и нужны ли мегапроекты вроде Stargate?

Стоимость акций технологических компаний. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.axios.com%2F2025%2F01%2F31%2Fdeepseek-nvidia-ai-stocks&postId=1788071" rel="nofollow noreferrer noopener" target="_blank">Источник</a>.<br />

Nerual Dreming

18.12.2024

Что на самом деле показало нашумевшее исследование о «сбежавших и обманывающих» больших языковых моделях

Всем привет! В последнее время я заметил множество постов и статей в русскоязычном сегменте интернета, которые ссылаются на одно интересное исследование, но интерпретируют его… скажем так, довольно своеобразно. Часто можно встретить заголовки вроде «ИИ научился обманывать чтобы спастись!» или «Нейросети вышли из-под контроля и пытались сбежать!». Э…

Роман Куцев CEO LLM Arena

13.12.2024

Сможет ли ИИ принять правильное решение? Ответы нейросетей на моральные вызовы

Нейросети научились писать симфонию и превращать холсты в шедевры. Они умеют даже чувствовать и сопереживать. Если попросить ChatGPT написать грустный стих или весело описать процесс теплообмена — справится быстро не хуже профессионального поэта. А вот умение искусственного интеллекта решать моральные дилеммы и логические задачи пока под вопросом.…

ArtificialInt

25.09.2024

Как мы корпоративный AI тренировали

Все началось с того, что мы в "Intelion Cloud" – компании, которая, как следует из названия, занимается облачными решениями, надумали рассказать нейросети все, что сами знаем о своей работе и воспитать идеального ИИ-ассистента. Посвятить её в знания о структуре Группы "Intelion", регламентах работы, функционале сотрудников и так далее.

immers.cloud

Разработка

12.09.2024

Преимущества Tesla H100 в ML

Меня зовут Руслан, я инженер-программист, автор YouTube канала Ruslan Dev, специализируюсь на облачных вычислениях и машинном обучении. В этом кейсе я расскажу о своем опыте разработки больших языковых моделей (LLM). Так как один из самых передовых графических процессоров Н100 стоит как крыло самолета, я арендовал ее через облачный сервис immers.cl…

Machine learning

06.09.2024

Вышла новая опенсорс модель Llama 3 Reflection 70 превосходит, Claude 3.5 Sonnet и GPT-4o.

immers.cloud

28.08.2024

Почему Llama 3.1 - лучшая открытая нейросеть

В последние месяцы выходит большое количество нейросетей, но только небольшое количество из них заслуживает внимания. Сегодня поговорим о нейросети *Meta Lama 3.1 (признана в РФ экстремистской организацией и запрещена).

immers.cloud

13.08.2024

Llama 3.1 и Mistral Large 2

В прошлом месяце вышли две интересных модели - Llama 3.1, улучшенная версия Llama 3, и Mistral Large 2.

Юникод

28.07.2024

Нейроновости #8 | Юникод

Краткая выжимка новостей по нейросетям за последнее время

Как я обучил модель, которая понимает русский лучше GPT 3.5 Turbo

Меня зовут Ruslan Dev и в этой статье я расскажу, как я смог обучить модель, которая превзошла GPT 3.5 Turbo на русскоязычной части MT-Bench. Также я рассмотрю новую конфигурацию для обучения на двух графических процессорах параллельно с помощью accelerate и deepspeed.

Чем отличаются языковые модели и их эволюция

Предпосылкой к созданию языковых моделей стало стремление ученых создать системы, которые могли бы понимать естественный язык. Один из первых, кто занялся этой задачей, был Норберт Винер в 1948 году, предложивший идею по созданию устройств, способных моделировать человеческое мышление и язык. Однако первые языковые модели, в современном понимании,…

Llama

Почему искусственный интеллект допускает ошибки, как написать сайт с помощью нейросети?

1. Горе комментаторы и "додумщики"

ИИ — пожиратель энергии, но DeepSeek может это изменить?

Что на самом деле показало нашумевшее исследование о «сбежавших и обманывающих» больших языковых моделях

Сможет ли ИИ принять правильное решение? Ответы нейросетей на моральные вызовы

Как мы корпоративный AI тренировали

Преимущества Tesla H100 в ML

Вышла новая опенсорс модель Llama 3 Reflection 70 превосходит, Claude 3.5 Sonnet и GPT-4o.

Почему Llama 3.1 - лучшая открытая нейросеть

Llama 3.1 и Mistral Large 2

Нейроновости #8 | Юникод

Как я обучил модель, которая понимает русский лучше GPT 3.5 Turbo

Чем отличаются языковые модели и их эволюция