Новая технология наушников с ИИ и шумоподавлением позволяет владельцам выбирать, какие звуки они слышат
Большинство тех, кто пользовался наушниками с шумоподавлением, знают, что слышать правильный шум в нужное время может быть жизненно важно. Кому-то, возможно, захочется стереть автомобильные гудки при работе в помещении, но не при прогулке по оживленным улицам. Однако люди не могут выбирать, какие звуки глушат их наушники.
Теперь команда под руководством исследователей из Вашингтонского университета разработала алгоритмы глубокого обучения, которые позволяют пользователям выбирать, какие звуки фильтруются через их наушники в режиме реального времени. Команда называет систему «семантическим слухом». Наушники передают записанный звук на подключенный смартфон, который подавляет все звуки окружающей среды.
С помощью голосовых команд или приложения для смартфона владельцы наушников могут выбрать, какие звуки они хотят включить из 20 классов, таких как сирены, детский плач, речь, пылесосы и щебетание птиц. Через наушники будут воспроизводиться только выбранные звуки.
«Понимание того, как звучит птица, и выделение его из всех других звуков в окружающей среде требует интеллекта в реальном времени, чего не могут достичь современные наушники с шумоподавлением», — сказал старший автор Шьям Голлакота.
«Проблема в том, что звуки, которые слышат пользователи наушников, должны синхронизироваться с их зрительными ощущениями. Вы не можете услышать чей-то голос через две секунды после того, как они с вами разговаривают. Это означает, что нейронные алгоритмы должны обрабатывать звуки менее чем за сотую долю секунды». "
Протестированная в таких условиях, как офисы, улицы и парки, система смогла извлечь сирены, щебетание птиц, сигналы тревоги и другие звуки, удаляя при этом все остальные реальные шумы. Когда 22 участника оценили аудиовыход системы по целевому звуку, они сказали, что в среднем качество улучшилось по сравнению с исходной записью.
В некоторых случаях система с трудом различала звуки, имеющие много общих свойств, например вокальную музыку и человеческую речь. Исследователи отмечают, что обучение моделей на большем количестве реальных данных может улучшить эти результаты.
Надеюсь вам понравилась статья.
Так же, у меня есть свой канал, в котором я размещаю интересные новости, обзоры и сервисы по нейросетям и искусственному интеллекту, которые помогают в работе и жизни. Если вам интересна эта тема, буду рад вас там видеть -
Идея интересная и кажется, что не такая уж и сложная, думаю вполне в ближайшие пару лет такие наушники появятся.