🐬 Google учит ИИ понимать дельфинов
DolphinGemma – это новая экспериментальная нейронка от Google, созданная для расшифровки звуков дельфинов и даже попыток общения с ними. Нейросетку сделали по тому же принципу, как обычные языковые модели (LLM) понимают человеческую речь — только тут вместо слов щелчки и свисты.
За десятилетия накопилась огромная база данных, где звуковые сигналы привязаны к контексту поведения дельфинов. Вот несколько ярких примеров из наблюдений:
- У каждого дельфина есть свой характерный именной свист, с помощью которого, например, мать зовёт детёныша, чтобы не потеряться
- Во время стычек и драк дельфины издают резкие импульсные сигналы, похожие на хриплые крики
- В моменты ухаживания или при преследовании акул слышны быстрые серии щелчков с повышающейся частотой («жужжащие» щелчки)
Эти наблюдения намекают, что в звуках дельфинов есть определённая структура и возможно элементы «языка». Ученые хотят понять, действительно ли дельфины общаются осознанно, есть ли у них язык и своя мини-культура. C появлением мощных моделей искусственного интеллекта, эта задача перестала казаться фантастикой.
DolphinGemma – как раз такая языковая модель, только вместо слов она оперирует звуками дельфинов. По сути, это нейросеть, обученная на акустических записях дельфинов. Модель небольшая по меркам современных LLM и весит всего 400 млн параметров, то есть запустится даже на телефоне (для сравнения, у GPT-3 порядка 175 миллиардов параметров).
Важно отметить: DolphinGemma не переводит дельфиньи звуки в человеческий язык. Принцип работы DolphinGemma во многом похож на то, как автозамена текста на телефоне угадывает слова. Модель принимает на вход фрагмент дельфиньего «разговора» – например, последовательность свистов и щелчков, – и предсказывает, какой звук должен последовать дальше.
Если модель стабильно предсказывает одни и те же комбинации звуков в одном и том же контексте – вероятно, это не случайность, и такой «оборот речи» действительно значим для дельфинов. Такие совпадения дадут ключ к разгадке возможного смысла сигналов.
Помимо пассивного анализа записей, учёные хотят проверить, можно ли наладить с дельфинами простейший обмен сигналами в реальном времени. Для этого создано специальное устройство под названием CHAT (Cetacean Hearing Augmentation Telemetry — система дополнительной связи с китообразными). CHAT – это переносной подводный «коммуникатор» - устройство. Главная цель CHAT – создать простой общий «язык» жестов для людей и дельфинов. Разумеется, напрямую перевести сложные естественные позывы дельфинов пока нереально. Поэтому учёные пошли по пути упрощения: они придумали несколько новых свистов и закрепили за каждым понятное значение.
Например, один условный свист может означать любимый предмет дельфинов – пучок водорослей. Это «слово» воспроизводятся компьютером CHAT через подводный динамик. Два аквалангиста демонстрируют дельфинам принцип: они произносят новый свист и одновременно показывают или передают друг другу соответствующий предмет, как бы называя его по-дельфиньи. Любознательные дельфины наблюдают за этой игрой. Идея в том, что животные, стремясь поиграть, начнут имитировать услышанные свисты, чтобы попросить понравившийся предмет. Если дельфин правильно повторяет сигнал, система это распознаёт и сообщает исследователю, какой именно «слово-свист» прозвучал (например, через специальные подводные наушники). Человек тут же реагирует – отдаёт дельфину желаемый предмет, поощряя тем самым использование «нового слова». Получается своего рода игра: дельфин «произносит» кодовое слово – человек понимает и выполняет просьбу. В простейшей форме это напоминает шарады с дельфином, где техническая система выступает посредником-переводчиком.
Важно подчеркнуть, что CHAT не учит дельфинов новым трюкам ради забавы. Цель – научиться взаимному общению. Если дельфин начнёт намеренно использовать введённые человеком сигналы, это покажет, что он понимает условное соответствие между звуком и предметом. По сути, дельфин сам включится в эксперимент по созданию общего словаря.
Проект DolphinGemma пока находится на начальной стадии практических испытаний, но учёные уже сделали несколько важных наблюдений:
- ИИ действительно способен уловить структуру дельфиньих сигналов.
- Подтверждены давние догадки о «лексиконе» дельфинов.
- Дельфины способны откликаться на новые сигналы.
DolphinGemma обещают выложить в открытый доступ этим летом. Так что ждем энтузиастов, которые научат ИИ понимать котиков, ворон или женщин.
Ссылка на видео про нейронку уже в телеграм канале.