Узнать будущее в лицо: биометрия для новичков
Попытки научить машину распознавать на изображении человеческое лицо предпринимались с 1960-х годов. Футуристические предсказания были задолго до этого. Сегодня на обнаружении черт лица дело не заканчивается.
Нейронная сеть по заданному алгоритму строит биометрический шаблон, сравнивает его с другими в базе и выдает результат: не просто распознанное лицо, а лицо Ивана Ивановича Петрова, менеджера отдела продаж компании “Матрица”, вчера ушедшего с работы на 5 минут раньше окончания рабочего времени. И это лишь одно из применений технологии, и оно не звучит уже ни футуристически, ни устрашающе. Как это работает, что такое распознавание лиц в 2019-м — игрушка, инструмент охраны безопасности или неизбежная составляющая жизни? Попробуем разобраться.
Как работает технология распознавания лица
Располагаешь телефон напротив лица — он снимает блокировку. Загружаешь фото со встречи в фейсбук — программа услужливо предлагает тебе отметить друга или партнера по имени с привязкой к профайлу. Синхронизируешь фото с облаком, и GooglePhotos сам расставляет метки и сортирует фотографии по присутствующим в кадре людям. Загружаешь групповую фотографию в FaceApp, чтобы “состарить” всех, но программа упорствует и сопротивляется “на фотографии обнаружено несколько лиц, выберите для работы одно”. Магия да и только.
Распознавание лиц — это процесс, использующий идентификацию или верификацию человека по его лицу. Простым языком:
- На первом этапе обнаруживается лицо на плоском изображении.
- На втором этапе происходит “захват” лица по ключевым точкам. Информация по заданному алгоритму превращается в цифровой набор данных, основанный на уникальных характеристиках: расстоянии между глаз и от лба до кончика подбородка, форме носа, контуре губ, ушей, щек и т.д. - так называемый вектор признаков.
- На третьем этапе система анализирует полученную информацию, например, сравнивает, принадлежат ли эти два лица одному и тому же человеку (верификация) или выбирает из заданной базы данных конкретного зарегистрированного пользователя (идентификация).
Методов обнаружения и идентификации по лицу - огромное количество. От метода главных компонент (Principal Component Analysis - PCA) и линейного дискриминантного анализа (дискриминант Фишера, Linear Discriminant Analysis- LDA) до синтеза объектов линейных классов и многослойных нейронных сетей.
Есть методы, основанные на геометрических характеристиках. Считается, что достаточно 68 ключевых точек, чтобы распознать лицо как уникальное.
Алгоритм преобразования “увиденного” CV (Computer Vision) состоит из преобразования пикселей в биометрический шаблон. Верификация происходит за счет сравнения полученного шаблона с уже загруженными в базу. Пополнение базы — и есть по сути обучение нейронной сети. Чем больше данных для сравнения, тем лучше результат на выходе.
Горы или равнина
Распознавание лиц, как и сама база, может быть 2D и 3D. 2D — это как раз любые загруженные фото в приложениях, просто плоская картинка. И с точки зрения машины, идеальный кадр — это тот, что в фас, с хорошей освещенностью, на контрастном фоне и без мешающих деталей в области лица: маски, пирсинг, тату, очки, особенно 3D очки для обманки распознающих систем.
С 3D идентификацией FaceID массовый рынок впервые познакомили Apple. Речь о сканировании объемного объекта - в данном случае лица, показывать фотографию в объектив бесполезно. Первооткрывателями среди обывателей стали владельцы iPhone X. На разработку FaceID по некоторым данным было потрачено порядка 1,5-2 миллионов долларов. Что, к слову, не помешало раскритиковать технологию в 2017 году китайцам - для FaceID некоторые граждане были плохо различимы между собой.
К счастью, в жизни люди узнают друг друга не по радужке глаза или отпечатку пальца, а именно по лицу. Для машинного зрения все не так очевидно. Особенно если в приложение загружается 2D изображение — попробуй найди лицо на плоскости.
И у 2D, и у 3D распознавания есть свои плюсы и минусы. 3D даёт более точные результаты, но его легко обмануть. Для 2D проще наполнять базу данных для сравнения с шаблоном, но коэффициенты FAR и FRR ошибок намного выше.
* False Reject Rate — FRR (Ложно отрицательный результат) — сотрудника Петрова не признали в лицо как Петрова.
** False Acceptance Rate — FAR (Ложно положительный результат) — сотрудника Петрова распознали как сотрудника Брейнхардт.
Лица, оценённые по достоинству
Исследование Transparency Market Research три года назад предсказывало, что рынок глобальных биометрических технологий в 2019-м году будет стоить более 23 миллионов долларов. Причем первенство в технологиях пророчили Северной Америке. Однако в 2019 году лучшими на рынке распознавания лиц в мире признаются разработки Китая и России. Grand View Research утверждает, что к 2025 стоимость рынка будет уже почти 60 миллионов долларов. Причем MarketsAndMarkets рассчитывает, что на долю именно технологии распознавания лица в 2019 году приходится 3,2 миллиона долларов, а в 2024 году цифра увеличится до 7 миллионов долларов. Актуальность распознавания лиц компьютерным зрением и рост его использования признается рынком технологий безусловно.
Есть два понятия в распознавании лиц: идентификация и верификация.
Идентификация отвечает на вопрос: “Ты кто?”
Верификация отвечает на вопрос: “А тот ли ты, кем себя называешь?”
С точки зрения монетизации выгоды коммерческие компании все больше интересует именно верификация. Она позволяет контролировать конкретных сотрудников на работе, узнавать в лицо VIP-клиентов или наоборот персон нон-грата на входе, обеспечивать автоматический допуск в места ограниченного доступа.
И хотя на практике технологии распознавания лица еще сбоят на близнецах и детях, в некоторых случаях AI оказывается намного более способной, чем человек. Например, для интересующихся на хабре есть пошаговая статья по обучению нейронки узнавать в лицо и различать между собой актера У.Феррелла и рок-музыканта Ч.Смита.
Обученная на скорую руку нейронная сеть показывает впечатляющий результат — алгоритмы не сбить с толку одинаковой одеждой, акцентами речи и повадками.
Где используется биометрия сегодня
Технология распознавания лица активно используется в государственном секторе, медицинских компаниях, сфере безопасности и многих других. Помните, как вас просят посмотреть в камеру при кредитных операциях в банках?
В Китае сотни тысяч камер контролируют жителей города, обеспечивая безопасность и формируя социальный рейтинг — это когда “карма” человека уменьшается с каждым его переходом дороги на красный свет. Система видеонаблюдения позволяет находить потерявшихся пожилых людей, предотвращать похищения детей. Журналист BBC провел эксперимент. Попросил внести себя в базу преступников и опасных лиц, чтобы узнать, за какое время по лицу его найдет полиция. Понадобилось 7 минут.
А в Нью-Йорке вора смогли поймать и вовсе по чужой фотографии - преступник был очень похож на известного актера Вуди Харрельсона. Качественные фотографии актёра были, а преступника - нет. Вот и использовали для поиска альтернативный вариант. Главное, результат положительный.
В России технология обеспечения безопасности на основе определения скелета человека и его лица также не в новинку. Например, на производстве или строительных площадках видеоаналитика определяет человека по ключевым узлам, находит лицо и руки, чтобы затем проконтролировать — а есть ли там защитные очки, каска и перчатки. Другая российская разработка позволяет контролировать работоспособность и физическое состояние человека.
В сегменте ритейла и вовсе пошли дальше: определяют не только лица, но и 7 базовых эмоций. С 2017 года если камеры Walmart обнаруживают покупателя с несчастным лицом, подается сигнал сотрудникам магазина. Так работают на повышение лояльности клиента. А в английском пабе система распознавания лиц установлена около барной стойки. Зона её ответственности — разобраться в толпе, кто за кем подошёл, проставив по лицам очередь обслуживания барменом.
Индия, Китай, США, а в этом году планирует присоединиться и Англия с Хитроу — используют систему распознавания лиц в аэропорту, чтобы ускорить процессы регистраций и досмотров.
Распознавание лиц машинным зрением используется даже в сфере искусства. На 58-ой церемонии “Грэмми” Леди Гага украсила своё выступление в память о Дэвиде Боуи живым гримом — узнаваемой огненной молнией на лбу и щеке. Искусственный интеллект определял лицо певицы в движении и проецировал на найденные части лица заданную картинку: лаву в движении, бегущего паука и другие элементы. Позже был снят ролик о том, как работали над этим эффектом:
Самое привычное распознавание лиц для нас сегодня — это разметка фотографий в социальных сетях. Facebook отдельным видео рассказал о том, как работает распознавание лиц на фото в социальной сети и как защищаются и используются персональные данные.
Вместо заключения
Распознавание лиц вызывает большое количество споров: этических, юридических, финансовых. Растут в количестве как сторонники, так и противники использования технологии, случаются забастовки с использованием лазеров и собираются подписи под петициями. Власти трех городов США официально запретили распознавать лица людей на улицах. За 10 дней июля приложение FaceApp заработало более миллиона рублей на желающих увидеть себя в старости глазами нейронных сетей. Несложно посчитать, сколько лиц было добровольно загружено в 2D базу приложения, требующего доступ в Интернет. Если спросить этих же людей, хотят ли они использовать своё лицо для контроля жизни повсеместно — энтузиазма, вероятно, будет меньше.
Распознавание лица, хотим мы этого или нет, уже прочно вошло в нашу жизнь. Другой вопрос, что всегда за нами остается решение, как использовать этот инструмент уместно и во благо.
интересно распечатать свое лицо на 3D за 50 лет до старости :)
Главное с ним в темноте спросонья ночью не встречаться :)))))
с гагой интересное применение :)
Слава богу с этим уже успешно справляются