Google выпустила модель Gemma 3 для разработчиков — её можно запустить на «одном графическом процессоре»

Нейросеть создана на базе тех же технологий, что и «самая продвинутая» модель компании Gemini 2.0.

  • Gemma 3 из семейства открытых моделей Google предлагают использовать для создания ИИ-сервисов и приложений, где нужен анализ текста, изображений или коротких видео.
  • Компания заявляет, что она обеспечивает лучшую производительность, чем o3-mini, и сравнимую с DeepSeek-R1. При этом может работать только на одном графическом процессоре Nvidia H100. Модель оптимизирована для работы с «любым» процессором — «от Jetson Nano до новейших чипов Blackwell». Есть версии на 1 млрд, 4 млрд, 12 млрд и 27 млрд параметров.
Производительность моделей DeepSeek-R1, DeepSeek-V3, o3-mini, Gemma 3 и других. Точками показано, сколько процессоров нужно для их работы. Источник: Google
Производительность моделей DeepSeek-R1, DeepSeek-V3, o3-mini, Gemma 3 и других. Точками показано, сколько процессоров нужно для их работы. Источник: Google
  • На момент написания заметки модель занимает десятое место в рейтинге Chatbot Arena LLM, где пользователи вслепую выбирают, какая нейросеть лучше отвечает на их запросы.
Скриншот vc.ru на 12:50 мск 12 марта 2025 года
Скриншот vc.ru на 12:50 мск 12 марта 2025 года
  • Gemma 3 поддерживает 35 языков, включая русский, и «предобучена» на 140 языках. Длина контекстного окна — 128 тысяч токенов по сравнению с 8000 в предыдущей Gemma 2.
  • Протестировать, как работает модель, можно в AI Studio, выбрав её из списка. Скачать Gemma 3 можно бесплатно с Hugging Face, Ollama и Kaggle.
9
2
1
15 комментариев