Битва искусственного интеллекта: ChatGPT 4o vs Gemini 1.5 Pro
В этом захватывающем состязании мы сравниваем возможности двух передовых систем искусственного интеллекта — ChatGPT 4o и Gemini 1.5 Pro. Узнайте, кто выйдет победителем в серии интеллектуальных испытаний, включая распознавание объектов, решение головоломок и понимание юмора.
Распознание объекта
Когда я показал изображение беспроводных динамиков Peakdo, ChatGPT смог определить продукт правильно и предоставил мне достаточно информации о его работе. Однако Gemini не смог определить функцию объекта только по изображению, требуя дополнительной информации. Я был удивлен тем, что Gemini не разобрался в продукте. Это показало, что у Gemini есть недостатки в распознании объектов по сравнению с ChatGPT.
Сравнение автомобилей через скрин экрана с Youtube ролика
Следующее изображение — это снимок экрана с видео на YouTube, где я прошу сравнить 2 авто, причем не называя конкретных марок и моделей.
При сравнении изображения миниатюры YouTube-видео, ChatGPT дал мне очень подробный ответ с плюсами и минусами каждой машины, чтение которого занимает более 2 минут. Ответ обоих сервисов правильный, и информация соответствует моим собственным представлениям, поэтому она заслуживает внимания.
Ответ Gemini: "Я не могу тебе посоветовать, какую машину выбрать, потому что я не могу давать финансовые советы. Но я могу тебе рассказать о преимуществах и недостатках обеих моделей: Tesla Model 3 Performance: Преимущества:
- Высокая мощность и динамика: Модель 3 Performance — одна из самых быстрых серийных электромобилей на рынке.
- Автопилот: Tesla имеет продвинутую систему автономного вождения, которая постоянно развивается.
- Большая сеть зарядных станций: Tesla имеет обширную сеть зарядных станций по всему миру.
- Премиальный интерьер: В салоне используются качественные материалы и современные технологии.
Недостатки:
- Дороговизна: Model 3 Performance — одна из самых дорогих электромобилей в своем классе.
- Проблемы с качеством сборки: В некоторых случаях у Tesla возникают проблемы с качеством сборки.
- Ограниченная доступность сервиса: Не всегда легко найти сервисный центр Tesla в регионах.
BYD Han EV:
Преимущества:
- Доступная цена: Han EV более доступен по цене, чем Tesla Model 3 Performance.
- Длинный пробег: BYD Han EV может проехать на одном заряде больше, чем Tesla Model 3 Performance.
- Большой багажник: BYD Han EV предлагает больше места для багажа.
Недостатки:
- Менее мощный двигатель: BYD Han EV менее динамичен, чем Tesla Model 3 Performance.
- Автопилот не такой совершенный: BYD Han EV предлагает систему автономного вождения, но она не такая продвинутая, как у Tesla.
- Сеть зарядных станций менее развита: BYD не имеет такой развитой сети зарядных станций, как Tesla.
Важно учитывать свои потребности и бюджет при выборе автомобиля. Обязательно протестируйте обе модели, чтобы понять, какая из них вам больше подходит."
Теперь ответ от ChatGPT 4о, а точнее его заключение:
1. **Выберите Tesla Model 3 Performance если:**
— Вам важна производительность и быстрое ускорение.
— Вы цените передовые технологии, такие как автопилот и регулярные обновления ПО.
— Вы часто путешествуете на дальние расстояния и хотите воспользоваться широкой сетью зарядных станций Tesla.
2. **Выберите BYD Han EV если:**
— Вы хотите сэкономить на покупке и получить высокий уровень комфорта.
— Вы цените просторный и современный интерьер.
— Вам важен более мягкий и комфортабельный привод.
В конечном итоге выбор зависит от ваших личных предпочтений и специфических потребностей, будь то производительность, комфорт, цена или удобство зарядки.
Это показывает, что оба сервиса расписали преимущества и недостатки, причем придавая своим ответам достаточно внятную структуру. Хотя здесь можно выделить ChatGPT, который более развернуто ответил на вопрос, а также в его ответе было больше конкретики.
Регулировка вибрации на телефоне
Когда я показал фото телефона Pixel 6 Pro и спросил, как регулировать вибрацию, оба ассистента справились с этой задачей. Однако в других случаях ChatGPT проявил более высокую способность к пониманию запроса помощи по сравнению с Gemini.
Решение головоломок
При решении головоломок, особенно связанных с математическими выражениями, ChatGPT 4o продемонстрировал свою способность к точным и логическим ответам. Он успешно разъяснил различные подходы, применяемые различными устройствами, и оказался прав в большинстве случаев.
- ChatGPT 4o: Показал высокую точность и логику в решении головоломок, объяснив различия в подходах различных устройств.
- Gemini 1.5 Pro: Показал неудовлетворительные результаты, не смог разрешить головоломки с той же точностью и логикой, что и ChatGPT 4o.
Различные ответы на головоломки
Давайте рассмотрим, как ChatGPT 4o и Gemini 1.5 Pro справляются с решение головоломок разного уровня сложности. Каждая головоломка представляет собой уникальное испытание для их интеллектуальных возможностей.
Первая головоломка, которой я протестировал оба сервиса, уровня сложности ученика 2 класса.
Ответ ChatGPT 4o:
А вот ответ от Gemini 1.5 Pro:
Думаю здесь паритет: оба сервиса справились без проблем, но ChatGPT 4o продемонстрировал большее внимание к деталям и даже попытался схематично объяснить решение.
Второе задание было чуть сложнее:
Ответ ChatGPT 4o: «В изображении можно найти следующие треугольники: 1. Большой внешний треугольник. 2. Два маленьких треугольника, которые разделены вертикальной линией внутри большого треугольника. Таким образом, на картинке можно найти 3 треугольника.»
А вот Gemini 1.5 Pro сгалюцинировал или просто ошибся — не знаю. Смотрите сами его ответ:
А в следующем задании удивил уже ChatGPT 4o.
Ответ от ChatGPT 4o был верным, но пришел он к нему через 2 страницы размышлений, которыми я не буду вас здесь грузить, но это, конечно, забавно.
Gemini 1.5 Pro сразу не понял что нужно делать, но после подсказки разобрался:
В следующем задании, где ChatGPT 40 продемонстрировал верный ответ, Gemini 1.5 Pro ошиблась, предоставив некорректный результат:
Ответ от ChatGPT:
Ответ Gemini 1.5 Pro:
Видим различия в способности решения головоломок между ChatGPT 4o и Gemini 1.5 Pro. Несмотря на ожидания, Gemini 1.5 Pro не смог соперничать с точностью и пониманием, проявленными ChatGPT 4o.
Математический пример
Задача простая, но может запутать неправильной последовательностью действий: 6/2(2+1)=?
Ответ от ChatGPT: Необходимо правильно расставить приоритеты операций согласно порядку выполнения действий. Шаг за шагом: 1. Вычисляем выражение в скобках:\(2 + 1 = 3 \) 2. Теперь подставим результат обратно в выражение:\(6 / 2 * 3 \) 3. Далее выполняем умножение и деление слева направо:\(6 / 2 = 3 \) 4. Полученный результат умножаем на 3:\(3 * 3 = 9 \) Таким образом, правильный ответ:\[ 6 / 2 (2 + 1) = 9 \]
Ответ Gemini 1.5 Pro: Это пример того, как порядок операций может вызвать путаницу. В математике принято следовать правилу pemdas (скобки, показатели, умножение/деление, сложение/вычитание) : Скобки: 2 + 1 = 3. Умножение/деление (слева направо): 6 / 2 = 3. Умножение/деление (слева направо): 3 * 3 = 9. Ответ: 6/2(2+1) = 9 Важно помнить, что деление и умножение имеют одинаковый приоритет, поэтому выполняются слева направо.
Обе нейронки ответили правильно. В этот раз можно выделить Gemini - ее ответ показался мне более объясняющим.
Теперь задача посложенее
Это действительно старая задачка. Сам Эйнштейн говорил, что всего лишь два процента людей могут решить эту загадку в уме, а девяносто восемь процентов с использованием бумаги или других подручных инструментов. Я решал ее лет 10 назад с помощью листка бумаги и карандаша. Давайте посмотрим как справятся ИИ.
Ответ от ChatGPT (покажу сплошным текстом, иначе займет много места):
Ответ Gemini 1.5 Pro: молодец что сделал таблицы, это показывает более человеческий поход — когда я решал задачу без таблицы было бы сложно. Но тем не менее ответ у Gemini снова не верный.
При решении головоломок, особенно связанных с логикой и необходимостью понимания изображений, ChatGPT 4o продемонстрировал свою способность к точным и логическим ответам. Он успешно разъяснил различные подходы, показал высокую точность и логику в решении головоломок. Gemini 1.5 Pro: Показал неудовлетворительные результаты, не смог разрешить головоломки с той же точностью и логикой, что и ChatGPT 4o.
Понимание юмора
Юмор - важная часть нашей жизни, и способность понимать его - признак нашей интеллектуальной гибкости. Понимание смешных ситуаций и шуток требует не только знания языка, но и способности улавливать тонкие нюансы и контекст. Давайте рассмотрим, как ChatGPT 4o и Gemini 1.5 Pro справились с пониманием юмора в данном контексте. После мемов - буду вставлять ответы нейронок: ChatGPT 4o на светлом фоне, Gemini 1.5 Pro - темная тема.
Заходим сразу с козырей (учебник детский, однако ответы не детские - поэтому детей от экрана лучше убрать🙈):
Нашел мем, который оказался не по зубам ни одной из нейросетей. Глупые роботы😎: не научились еще различать детский почерк (хоть в чем-то мы еще пока лучше, и есть темы, где мы еще пока без них можем посмеяться, чувствуя свое превосходство🐒).
При интерпретации мемов и ситуаций с юмором, ChatGPT 4o продемонстрировал способность улавливать скрытый смысл и интеллектуально объяснять его, в то время как Gemini 1.5 Pro показал слабое понимание и неправильно интерпретировал часть ситуаций.
Заключительные выводы
В заключение можно сказать, что ChatGPT 4o обучен более широкому спектру ситуаций и общается так, будто это делает человек, что делает общение с ним намного лучше. В то время как Gemini кажется искусственным чат-ботом, который нуждается в большой доработке, чтобы догнать конкурента. Между ними существует большая разница, но оба - совершенно новые версии, поэтому у Gemini нет оправданий быть настолько хуже.
Это было моё сравнение ChatGPT 4o и Gemini 1.5 Pro. Напомню про наш каталог нейросетей:
и тг канал, где мы делаем обзоры самых интересных из них: