«Умнейший ИИ на Земле»: Grok-3 подтверждает громкие слова Илона Маска
Илон Маск запустил обновленную нейросеть Grok-3, которая по мощностям обошёл o1-pro и немного превосходит DeepSeek-R1 и Gemini 2.0 Flash Thinking.
Что мы знаем о Grok-3:
🔹 Превосходство по результатам бенчмарков
Сказал — сделал, тесты показали отличные результаты. Grok-3 обходит все существующие ИИ-модели, включая GPT-4, Claude 3.5, DeepSeek-V3 и Gemini-2 Pro в таких областях, как математика, программирование и креативные задачи.
🔹 Сложнейшие научные вычисления
Один из самых ярких примеров: Grok-3 за секунды рассчитал окно отправления на Марс и возвращения на Землю — задача, которая в обычных условиях занимает у учёных недели.
🔹 Суперкомпьютер Colossus
Для обучения модели использовался суперкомпьютер Colossus с 200 000 чипами NVIDIA H100, что в 10 раз мощнее, чем для предыдущих версий. Это обеспечивает рекордную скорость и эффективность.
🔹 Deep Research и самообучение
У Grok-3 появилась хайповая функция Deep Research, которая анализирует текстовые данные не только сайтов, но и постов в X*, выявляя контекст и генерируя точные ответы на запросы. Это позволяет искать информацию быстрее, чем аналогичные инструменты у OpenAI.
Также в модели применяется онлайн-обучение: она обучается не только на исторических данных, но и на той информации, которую узнала в процессе работы.
Тем самым нейронка постоянно самоулучшается, с каждым запросом становится умнее и точнее, без необходимости полного переподключения к базам данных и вмешательства со стороны людей.
«Мы сами боимся»
🔹 Режимы Think и Big Brain
Grok-3 обзавёлся двумя мощными режимами: Think, который активирует функцию рассуждений и Big Brain, делающий ИИ гением написания кода и решения математических задач.
🔹 Реальные игры и алгоритмы в реальном времени
Grok-3 способен не только отвечать на вопросы, но и создавать рабочие прототипы игр в реальном времени. Например, в одном из стримов была продемонстрирована созданная в режиме реального времени версия тетриса с механиками «три в ряд», где использовались алгоритмы симуляции и генеративные модели для создания игрового процесса.
Где протестировать Grok-3?
На данный момент Grok-3 доступен для пользователей Premium+ X*, но тестирование открыто на LmArena в разделе «Direct Chat» через модель early-grok-3.
Что ждём в будущем?
Планируют добавить голосовой режим, выложить исходный код Grok-2, усовершенствовать режим Big Brain и написать API под Grok-3, чтобы другие разработчики могли интегрировать нейронку в свои проекты.
* X заблокирован на территории РФ.