Как часы ломают ИИ и туннельное мышление

Когда мы активно используем языковые модели (LLM) или генераторы изображений, они кажутся нам чем-то умным, способным к осмысленному мышлению. Однако за фасадом "разумности" скрываются лишь алгоритмы, обученные на огромных массивах данных. И иногда это приводит к неожиданным результатам.

Часы, которые всегда показывают 10:11

Попробуйте попросить любой генератор изображений создать картинку часов, показывающих, например, 12:00. Скорее всего, вы получите часы с циферблатом, указывающим 10:11. Это происходит даже при детальном и продуманном запросе. Почему? Потому что в интернете подавляющее большинство фотографий часов показывают именно это время. Маркетологи считают, что стрелки, расположенные так, формируют "улыбку" на циферблате, создавая позитивный образ.

Модели ИИ обучаются на огромных наборах данных из интернета, поэтому они подражают тому, что видят чаще всего. И в данном случае — это именно часы с "улыбкой" на 10:11.

Эффект туннельного мышления

Этот феномен можно связать с концепцией туннельного мышления (tunnel vision) или эффектом информационного пузыря (information bubble). Люди часто замечают только те вещи, которые уже привыкли видеть или которые подтверждают их ожидания. Подобное происходит и с ИИ: обученные на узком, повторяющемся контексте данные ограничивают возможности генерации разнообразных вариантов.

Такое ограничение накладывает "шоры" как на алгоритмы, так и на восприятие пользователей, которые начинают принимать за норму однотипные результаты. В итоге модель, вместо того чтобы показать, например, 17:46, продолжает следовать шаблону, закреплённому в её данных.

Вывод

Это забавный пример того, как предвзятость данных влияет на работу ИИ. Он также напоминает нам, что машины не думают и не рассуждают, а лишь воспроизводят то, что заложено в их основе. Точно так же и люди рискуют попасть в ловушку туннельного мышления, если не осознают ограничений окружающей их информации.

——————

Картинка 1 - выдача гугла при поиске фотографий часов

Картинка 2 - сгенерированная моделью flux при запросе "woman wearing a iwc watch that shows 17:46". Всё равно получилось 10:11. Можно попробовать сгенерировать тут
Картинка 3 - сгенерированная моделью dall-e от OpenAI при том же запросе

Ваш, @ai_in_lavash