Google выпустила Gemma 2 с 9 и 27 миллиардами параметров

Спустя два месяца после того, как компания Google представила Gemma 2 на Google IO 2024, она наконец-то сделала ее доступной для ученых и разработчиков по всему миру. Технологический гигант выпускает модель в двух вариантах - с 9 миллиардами и 27 миллиардами параметров.

Еще больше полезностей - в телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.

Но Google не собирается останавливаться только на двух размерах Gemma 2. Компания объявила о планах выпустить в скором времени модель с 2,6 миллиардами параметров, призванную "преодолеть разрыв между легкой доступностью и мощной производительностью".

🔥Телеграм-бот SYNTX предоставляет доступ к более чем 40 нейросетям. Без ВПН, оплата любой картой, запросы на любом языке, пробуйте бесплатно!
🎙 Общайтесь в одном диалоговом окне с GPT4o/Gemini/Claude, выход в интернет, работа с файлами, неограниченное количество символов!
👨‍🎨 Создавайте изображения в MidJourney, DALL-E 3 и Ideogram
🆕 Любой образ, в любой локации с вашим фото сделает ФотоМастер
🎞 Генерируйте видео в LUNA текстом или по картинке
🎵 Сочиняйте мировые хиты с помощью Suno
🖼 Редактор с 12 различными ИИ-инструментами для ретуши фото
☝️Это только часть функций, доступных в SYNTX!

Gemma 2 - это семейство продвинутых языковых ИИ-моделей, каждая из которых имеет стандартный и настроенный под конкретные инструкции варианты.

Модель 9B была обучена примерно на 8 триллионах токенов, а версия 27B - примерно на 13 триллионах токенов веб-данных, кода и математических вычислений.

В обеих моделях длина контекстного окна составляет 8 000 токенов. Варианты с настройкой инструкций обозначаются как "gemma-2-9b-it" и "gemma-2-27b-it", а базовые модели - просто "gemma-2-9b" и "gemma-2-27b".

Эти облегченные модели предназначены для эффективной работы на различном оборудовании, включая графические процессоры Nvidia и TPU Google, что делает их подходящими как для облачных приложений, так и для приложений на устройствах.

Я готов поспорить, что в новые модели Pixel будут встроены модели Gemma.

Если вы хотите узнать больше о технических деталях Gemma 2, ознакомьтесь с этой статьей.

Также вы можете скачать весовые модели Gemma 2 с этих платформ:

Kaggle
Hugging Face Models
Vertex AI Model Garden (скоро появится).

Разработчики и ученые могут использовать Gemma 2 бесплатно через Kaggle или через бесплатный уровень для блокнотов Colab.

Если вам не терпится посмотреть, как работает новая модель и каково качество ее ответов, попробуйте ее в Google AI Studio (но в этом случае должен быть не российский аккаунт. Список стран приведен на странице сервиса).

Войдя в систему, вы заметите, что новая модель "Gemma 2" доступна в выпадающем списке Models.

Вот пример промпта и ответа, демонстрирующего возможности модели:

Here's a blurb for an upcoming startup event. Rewrite this in a more professional tone intended for a corporate email. "Calling all tech junkies, investors, and curious minds! 🤖🧠🎉 Ready to witness the future? We're throwing a pitch party where brilliant startups will showcase their mind-blowing AI creations. Think healthcare that reads your mind (almost!), businesses that run themselves (we wish!), and robots that make you coffee (we definitely need!). Whether you're an investor, a budding entrepreneur, or just someone who wants to geek out over AI, this event is your jam! Come watch the pitches, mingle with industry experts, and get inspired by these rockstar companies. Oh, and did we mention free food and drinks? Register now before the robots take all the spots! 😉"

И вот какой ответ я получил.

Subject: Invitation to [Event Name]: An AI Startup Showcase Dear [Recipient Name], We cordially invite you to [Event Name], a premier showcase of cutting-edge AI startups. Join us as innovative companies present their groundbreaking solutions across diverse sectors, including healthcare, business automation, and robotics. This event offers a unique opportunity to: Discover the latest advancements in artificial intelligence. Network with industry leaders, investors, and fellow tech enthusiasts. Gain insights into the future of AI and its transformative potential. Complimentary refreshments will be served. We encourage you to register at your earliest convenience as space is limited. Sincerely, The [Event Name] Team [Website Link]

Также вы можете попробовать Gemma 2 в Ollama. Скачать Ollama можно здесь.

Затем запустите модель с помощью команды:

ollama run gemma2

Это позволит загрузить файл манифеста размером 5,5 ГБ. После загрузки вы сможете сразу же пообщаться с Gemma 2 в терминале.

Если вы предпочитаете не скачивать модель на свой локальный компьютер, вы можете попробовать ее бесплатно в HuggingChat. Просто выберите текущую модель в "google/gemma-2-27b-it".

Можно также включить функцию " Search web", чтобы модель могла искать информацию в Интернете.

Чтобы использовать модели Gemma с трансформерами, убедитесь, что вы используете последнюю версию трансформеров:

pip install "transformers==4.42.1" --upgrade

Вот пример кода, как использовать gemma-2-9b-it с трансформерами.

from transformers import pipeline import torch pipe = pipeline( "text-generation", model="google/gemma-2-9b-it", model_kwargs={"torch_dtype": torch.bfloat16}, device="cuda", ) messages = [ {"role": "user", "content": "What's the meaning of life?"}, ] outputs = pipe( messages, max_new_tokens=256, do_sample=False, ) assistant_response = outputs[0]["generated_text"][-1]["content"] print(assistant_response)

Этот код требует около 18 ГБ оперативной памяти, что подходит для многих потребительских GPU. Тот же сниппет работает для gemma-2-27b-it, что при 56 ГБ оперативной памяти делает его очень интересной моделью для использования в производстве.

Gemma 2 поставляется с той же лицензией, что и первая версия, - это разрешительная лицензия, которая допускает распространение, тонкую настройку, коммерческое использование и производные работы.

Такой подход к открытому лицензированию позволяет разработчикам и исследователям свободно использовать и модифицировать модель для различных приложений.

Одним из недостатков Gemma 2 является длина контекстного окна в 8 000 токенов. Учитывая, что другие модели, такие как Gemini, теперь предлагают длину контекста до 2 миллионов токенов, это ограничение для некоторых приложений может оказаться недостатком.

Тем не менее, модель 27b, которая выигрывает у llama 3 70b и haiku, очень интересна, и мне не терпится опробовать ее в различных вариантах использования.

Меня особенно волнует, как эта модель будет смотреться на фоне грядущей Llama 3 с 400 миллиардами параметров от Meta. Ознакомьтесь с предварительным просмотром новой модели, чтобы понять, чего мы можем ожидать.

Еще больше полезностей - в телеграм-канале про нейросети и канале про генерацию изображений Миджорниум.

🔥Телеграм-бот SYNTX предоставляет доступ к более чем 40 нейросетям. Без ВПН, оплата любой картой, запросы на любом языке, пробуйте бесплатно!
🎙 Общайтесь в одном диалоговом окне с GPT4o/Gemini/Claude, выход в интернет, работа с файлами, неограниченное количество символов!
👨‍🎨 Создавайте изображения в MidJourney, DALL-E 3 и Ideogram
🆕 Любой образ, в любой локации с вашим фото сделает ФотоМастер
🎞 Генерируйте видео в LUNA текстом или по картинке
🎵 Сочиняйте мировые хиты с помощью Suno
🖼 Редактор с 12 различными ИИ-инструментами для ретуши фото
☝️Это только часть функций, доступных в SYNTX!

#google #gemma2 #ai #ии

Источник статьи на английском - здесь.

Google выпустила Gemma 2 с 9 и 27 миллиардами параметров

Что такое Gemma 2?

Попробуйте Gemma 2 в AI Studio

Попробуйте Gemma 2 в Ollama

Попробуйте Gemma 2 в HuggingFace

Gemma 2 с трансформерами Hugging Face

Лицензирование Gemma 2