Google выпустила модель Gemma 3 для разработчиков — её можно запустить на «одном графическом процессоре»

Нейросеть создана на базе тех же технологий, что и «самая продвинутая» модель компании Gemini 2.0.

Gemma 3 из семейства открытых моделей Google предлагают использовать для создания ИИ-сервисов и приложений, где нужен анализ текста, изображений или коротких видео.
Компания заявляет, что она обеспечивает лучшую производительность, чем o3-mini, и сравнимую с DeepSeek-R1. При этом может работать только на одном графическом процессоре Nvidia H100. Модель оптимизирована для работы с «любым» процессором — «от Jetson Nano до новейших чипов Blackwell». Есть версии на 1 млрд, 4 млрд, 12 млрд и 27 млрд параметров.

На момент написания заметки модель занимает десятое место в рейтинге Chatbot Arena LLM, где пользователи вслепую выбирают, какая нейросеть лучше отвечает на их запросы.

Gemma 3 поддерживает 35 языков, включая русский, и «предобучена» на 140 языках. Длина контекстного окна — 128 тысяч токенов по сравнению с 8000 в предыдущей Gemma 2.
Протестировать, как работает модель, можно в AI Studio, выбрав её из списка. Скачать Gemma 3 можно бесплатно с Hugging Face, Ollama и Kaggle.