Не дать AI себя распознать, селфи «без рук», алгоритмы для ловли тунца, ошибки, ошибки, и другие новости AI этой недели

Привет, меня зовут Леша, я занимаюсь исследованиями ИИ в топ-лабе Facebook AI Research, и мне не нравится читать новости от тех, кто не понимает о чем пишет. Поэтому я стал освещать самые и не самые важные события из мира AI сам. Фидбек приветствуется!

Алексей Сидоров, Facebook AI Research

Не дать AI себя распознать

Пример  adversarial example OpenAI
Пример  adversarial example OpenAI

В интернете становится все сложнее и сложнее спрятаться от сбора и анализа своих данных, но надежда сохранить хоть какую-то приватность остается. На этой неделе много писали о Fawkes, алгоритме из Чикагского универа, который позволяет налаживать специальный шум на фото, из-за которого внешне фото не меняется, но вот алгоритмы распознавания лиц уже его не распознают. Я не разделяю всеобщего восторга, просто потому что подобные алгоритмы существуют уже много лет, обычно их называют «adversarial attacks/examples», и очередной такой же инфоповода не заслуживает. Вот например запись в блоге OpenAI за 2017 год, когда уже таким никого было не удивить. А потом уже и одежду печатали с подобным шумом, и как только не развлекались.

Изображение до и после обработки. Да, разницы нет, вы только что посмотрели на одно и то же фото дважды.  Fawkes
Изображение до и после обработки. Да, разницы нет, вы только что посмотрели на одно и то же фото дважды.  Fawkes

«Смотри, без рук могу»

Приличные, казалось бы, люди из Адоби (да, так он правильно произносится, теперь будете знать) и Беркли, забыли за что им платят, и начали … алгоритмами убирать руки с селфи! Причем с технической стороны подошли оригинально: извлекают позу с помощью DensePose, задают новую позу, налаживают человеческую текстуру на новую позу, и зарисовывают пробелы.

Самое интересное, это как они обосновывали свою мотивацию, ведь бесполезный алгоритм без применения никто не опубликует, «… However, in selfies, constraints such as human arm length often make the body pose look unnatural.» Да ладно, а ваши сгенерированные дистрофики с вывернутыми плечами выглядят natural, ага, держите в курсе.

Пример работы алгоритма Liqian Ma, Zhe Lin, Connelly Barnes, Alexei A Efros, and Jingwan Lu
Пример работы алгоритма Liqian Ma, Zhe Lin, Connelly Barnes, Alexei A Efros, and Jingwan Lu

К слову, в основе лежит тот же алгоритм, который вышел пару лет назад и позволял переносить любые танцевальные движения даже на самое неповоротливое бревно (вроде меня). Это выглядело так забавно, что они даже сделали на этом стартап. Можете попробовать сами: getsway.app.

Демо статьи с названием «Everybody dance now!»

Лососни тунца

Казалось бы, для ИИ уже сложно найти новые применения. Но тут рассказали о японской сети ресторанов Kura Sushi, которая использует (AI-)приложение TunaScope для того, чтобы оценить качество тунца по его фото в разрезе. Примечательно то, что создатели натренировали сеть всего на 4000 изображениях (что есть ОЧЕНЬ мало), и получили точность около 90%. Много это или мало сильно зависит от метрики, а какая она у них там я, честно, не знаю, но, думаю, что их самих это не сильно волнует, потому что продают они этот тунец потом под лейблом «AI Tuna», и расходится он быстрее, чем Regular Tuna.

Маркетинг — двигатель прогресса.

Если вы думаете, что вы не очень умные, у меня есть для вас хорошая новость: всемогущий AI все еще глупее вас. Тут исследователи из CMU выкатили алгоритм под названием Probabilistic Neighborhood Components Analysis, который позволяет исследовать уверенность сеток в разных предсказаниях (explainable AI — это модно). Для примера они использовали COVID датасет с Kaggle, и показали как сетка неверно определяет котика как грудную клетку с COVID’ом.

В защиту алгоритма скажу, что это, вообще-то, out-of-domain data, и спрашивать такое у сетки — неприлично.

Ну похож ведь, нет? Ankur Mallick, Chaitanya Dwivedi, Bhavya Kailkhura, Gauri Joshi, T. Yong-Jin Han
Ну похож ведь, нет? Ankur Mallick, Chaitanya Dwivedi, Bhavya Kailkhura, Gauri Joshi, T. Yong-Jin Han

Этот пост — выжимка из новостей в авторском канале в Телеграмме. Там я пощу чаще, и в более свободном тоне. Присоединяйтесь!

33
10 комментариев

Ничего себе, 100% короновирусный котик

1
Ответить

Котика постигла незавидная участь :С

Ответить

АИ уже не торт

1
Ответить

Верни мне мой 2012 (AlexNet) 😂

Ответить

Читаю и аж злость берёт от того, сколько возможностей для заработка даёт ИИ (а я в нём ни в зуб ногой). Скрестив пальцы жду общедоступного ламер-френдли GPT-3🤞

1
Ответить

Так они уже очень юзер-френдли демку сделали, а API у них по идее будет очень похожим. Все ля людей, лишь бы пользовались и деньги платили.

Ответить

Налаживают или всё-таки накладывают? )
А новости интересные! Спасибо!

Ответить