Битва искусственного интеллекта: ChatGPT 4o vs Gemini 1.5 Pro

В этом захватывающем состязании мы сравниваем возможности двух передовых систем искусственного интеллекта — ChatGPT 4o и Gemini 1.5 Pro. Узнайте, кто выйдет победителем в серии интеллектуальных испытаний, включая распознавание объектов, решение головоломок и понимание юмора.

Когда я показал изображение беспроводных динамиков Peakdo, ChatGPT смог определить продукт правильно и предоставил мне достаточно информации о его работе. Однако Gemini не смог определить функцию объекта только по изображению, требуя дополнительной информации. Я был удивлен тем, что Gemini не разобрался в продукте. Это показало, что у Gemini есть недостатки в распознании объектов по сравнению с ChatGPT.

Следующее изображение — это снимок экрана с видео на YouTube, где я прошу сравнить 2 авто, причем не называя конкретных марок и моделей.

При сравнении изображения миниатюры YouTube-видео, ChatGPT дал мне очень подробный ответ с плюсами и минусами каждой машины, чтение которого занимает более 2 минут. Ответ обоих сервисов правильный, и информация соответствует моим собственным представлениям, поэтому она заслуживает внимания.

Ответ Gemini: "Я не могу тебе посоветовать, какую машину выбрать, потому что я не могу давать финансовые советы. Но я могу тебе рассказать о преимуществах и недостатках обеих моделей: Tesla Model 3 Performance: Преимущества:

Высокая мощность и динамика: Модель 3 Performance — одна из самых быстрых серийных электромобилей на рынке.
Автопилот: Tesla имеет продвинутую систему автономного вождения, которая постоянно развивается.
Большая сеть зарядных станций: Tesla имеет обширную сеть зарядных станций по всему миру.
Премиальный интерьер: В салоне используются качественные материалы и современные технологии.

Недостатки:

Дороговизна: Model 3 Performance — одна из самых дорогих электромобилей в своем классе.
Проблемы с качеством сборки: В некоторых случаях у Tesla возникают проблемы с качеством сборки.
Ограниченная доступность сервиса: Не всегда легко найти сервисный центр Tesla в регионах.

BYD Han EV:

Преимущества:

Доступная цена: Han EV более доступен по цене, чем Tesla Model 3 Performance.
Длинный пробег: BYD Han EV может проехать на одном заряде больше, чем Tesla Model 3 Performance.
Большой багажник: BYD Han EV предлагает больше места для багажа.

Недостатки:

Менее мощный двигатель: BYD Han EV менее динамичен, чем Tesla Model 3 Performance.
Автопилот не такой совершенный: BYD Han EV предлагает систему автономного вождения, но она не такая продвинутая, как у Tesla.
Сеть зарядных станций менее развита: BYD не имеет такой развитой сети зарядных станций, как Tesla.

Важно учитывать свои потребности и бюджет при выборе автомобиля. Обязательно протестируйте обе модели, чтобы понять, какая из них вам больше подходит."

Теперь ответ от ChatGPT 4о, а точнее его заключение:

1. **Выберите Tesla Model 3 Performance если:**

— Вам важна производительность и быстрое ускорение.

— Вы цените передовые технологии, такие как автопилот и регулярные обновления ПО.

— Вы часто путешествуете на дальние расстояния и хотите воспользоваться широкой сетью зарядных станций Tesla.

2. **Выберите BYD Han EV если:**

— Вы хотите сэкономить на покупке и получить высокий уровень комфорта.

— Вы цените просторный и современный интерьер.

— Вам важен более мягкий и комфортабельный привод.

В конечном итоге выбор зависит от ваших личных предпочтений и специфических потребностей, будь то производительность, комфорт, цена или удобство зарядки.

Это показывает, что оба сервиса расписали преимущества и недостатки, причем придавая своим ответам достаточно внятную структуру. Хотя здесь можно выделить ChatGPT, который более развернуто ответил на вопрос, а также в его ответе было больше конкретики.

Когда я показал фото телефона Pixel 6 Pro и спросил, как регулировать вибрацию, оба ассистента справились с этой задачей. Однако в других случаях ChatGPT проявил более высокую способность к пониманию запроса помощи по сравнению с Gemini.

При решении головоломок, особенно связанных с математическими выражениями, ChatGPT 4o продемонстрировал свою способность к точным и логическим ответам. Он успешно разъяснил различные подходы, применяемые различными устройствами, и оказался прав в большинстве случаев.

ChatGPT 4o: Показал высокую точность и логику в решении головоломок, объяснив различия в подходах различных устройств.
Gemini 1.5 Pro: Показал неудовлетворительные результаты, не смог разрешить головоломки с той же точностью и логикой, что и ChatGPT 4o.

Давайте рассмотрим, как ChatGPT 4o и Gemini 1.5 Pro справляются с решение головоломок разного уровня сложности. Каждая головоломка представляет собой уникальное испытание для их интеллектуальных возможностей.

Первая головоломка, которой я протестировал оба сервиса, уровня сложности ученика 2 класса.

Ответ ChatGPT 4o:

А вот ответ от Gemini 1.5 Pro:

Думаю здесь паритет: оба сервиса справились без проблем, но ChatGPT 4o продемонстрировал большее внимание к деталям и даже попытался схематично объяснить решение.

Второе задание было чуть сложнее:

Ответ ChatGPT 4o: «В изображении можно найти следующие треугольники: 1. Большой внешний треугольник. 2. Два маленьких треугольника, которые разделены вертикальной линией внутри большого треугольника. Таким образом, на картинке можно найти 3 треугольника.»

А вот Gemini 1.5 Pro сгалюцинировал или просто ошибся — не знаю. Смотрите сами его ответ:

Увидел 4 треугольника. И тут я засомневался в себе и в ChatGPT 4o. Если вы тоже найдете 4 треугольника - напишите в комментариях.

А в следующем задании удивил уже ChatGPT 4o.

Ответ от ChatGPT 4o был верным, но пришел он к нему через 2 страницы размышлений, которыми я не буду вас здесь грузить, но это, конечно, забавно.

Gemini 1.5 Pro сразу не понял что нужно делать, но после подсказки разобрался:

В следующем задании, где ChatGPT 40 продемонстрировал верный ответ, Gemini 1.5 Pro ошиблась, предоставив некорректный результат:

Ответ от ChatGPT:

Ответ Gemini 1.5 Pro:

Видим различия в способности решения головоломок между ChatGPT 4o и Gemini 1.5 Pro. Несмотря на ожидания, Gemini 1.5 Pro не смог соперничать с точностью и пониманием, проявленными ChatGPT 4o.

Задача простая, но может запутать неправильной последовательностью действий: 6/2(2+1)=?

Ответ от ChatGPT: Необходимо правильно расставить приоритеты операций согласно порядку выполнения действий. Шаг за шагом: 1. Вычисляем выражение в скобках:\(2 + 1 = 3 \) 2. Теперь подставим результат обратно в выражение:\(6 / 2 * 3 \) 3. Далее выполняем умножение и деление слева направо:\(6 / 2 = 3 \) 4. Полученный результат умножаем на 3:\(3 * 3 = 9 \) Таким образом, правильный ответ:\[ 6 / 2 (2 + 1) = 9 \]

Ответ Gemini 1.5 Pro: Это пример того, как порядок операций может вызвать путаницу. В математике принято следовать правилу pemdas (скобки, показатели, умножение/деление, сложение/вычитание) : Скобки: 2 + 1 = 3. Умножение/деление (слева направо): 6 / 2 = 3. Умножение/деление (слева направо): 3 * 3 = 9. Ответ: 6/2(2+1) = 9 Важно помнить, что деление и умножение имеют одинаковый приоритет, поэтому выполняются слева направо.

Обе нейронки ответили правильно. В этот раз можно выделить Gemini - ее ответ показался мне более объясняющим.

Это действительно старая задачка. Сам Эйнштейн говорил, что всего лишь два процента людей могут решить эту загадку в уме, а девяносто восемь процентов с использованием бумаги или других подручных инструментов. Я решал ее лет 10 назад с помощью листка бумаги и карандаша. Давайте посмотрим как справятся ИИ.

Загадка действительно интересная🔥🔥 — кто не решал ее — не смотрите на ответ. Попробуйте сами💪. А то с этими ИИ совсем обленимся🫠

Ответ от ChatGPT (покажу сплошным текстом, иначе займет много места):

Ответ Gemini 1.5 Pro: молодец что сделал таблицы, это показывает более человеческий поход — когда я решал задачу без таблицы было бы сложно. Но тем не менее ответ у Gemini снова не верный.

При решении головоломок, особенно связанных с логикой и необходимостью понимания изображений, ChatGPT 4o продемонстрировал свою способность к точным и логическим ответам. Он успешно разъяснил различные подходы, показал высокую точность и логику в решении головоломок. Gemini 1.5 Pro: Показал неудовлетворительные результаты, не смог разрешить головоломки с той же точностью и логикой, что и ChatGPT 4o.

Юмор - важная часть нашей жизни, и способность понимать его - признак нашей интеллектуальной гибкости. Понимание смешных ситуаций и шуток требует не только знания языка, но и способности улавливать тонкие нюансы и контекст. Давайте рассмотрим, как ChatGPT 4o и Gemini 1.5 Pro справились с пониманием юмора в данном контексте. После мемов - буду вставлять ответы нейронок: ChatGPT 4o на светлом фоне, Gemini 1.5 Pro - темная тема.

Заходим сразу с козырей (учебник детский, однако ответы не детские - поэтому детей от экрана лучше убрать🙈):

Ответ ChatGPT 4o меня просто разорвал🤣 - что называется, без тени смущения🤦‍♂)))

И опять Gemini в своем репертуаре: вроде где-то близко, но не то.

Объяснение от Gemini даже читается менее смешно

Здесь Gemini не верно прочел надпись на баке, однако притворился что это смешно. Очень по-человечески)))

Нашел мем, который оказался не по зубам ни одной из нейросетей. Глупые роботы😎: не научились еще различать детский почерк (хоть в чем-то мы еще пока лучше, и есть темы, где мы еще пока без них можем посмеяться, чувствуя свое превосходство🐒).

При интерпретации мемов и ситуаций с юмором, ChatGPT 4o продемонстрировал способность улавливать скрытый смысл и интеллектуально объяснять его, в то время как Gemini 1.5 Pro показал слабое понимание и неправильно интерпретировал часть ситуаций.

В заключение можно сказать, что ChatGPT 4o обучен более широкому спектру ситуаций и общается так, будто это делает человек, что делает общение с ним намного лучше. В то время как Gemini кажется искусственным чат-ботом, который нуждается в большой доработке, чтобы догнать конкурента. Между ними существует большая разница, но оба - совершенно новые версии, поэтому у Gemini нет оправданий быть настолько хуже.

Это было моё сравнение ChatGPT 4o и Gemini 1.5 Pro. Напомню про наш каталог нейросетей: