Игорь Колебин

+10
с 2020
0 подписчиков
28 подписок

Данные – это новый мусор.
Объемы данных не дают стратегических преимуществ.
Китай и США сделали ставку на военные приложения ИИ. Причина этого кажется очевидной и политикам, и военным. Все они повторяют мантру из книги «Супердержавы ИИ» Кай-Фу Ли - «В век ИИ, когда данные - это новая нефть, Китай - новая Саудовская Аравия». Но реальность гораздо сложнее. Все далеко не так просто в обретении военного превосходства в ИИ-системах.
Новый отчет CSET не открывает новых истин, а всего лишь резюмирует – объемы данных имеют такое же значение для обретения военного преимущества, как объемы производимого страной мусора.
Кому придет в голову делать вывод о национальном технологическом превосходстве, если страна – мировой чемпион по мусору? А ведь с данными еще хуже, ибо данные грязнее любого мусора.
Отчет резюмирует.
1.
Объемы необработанных данных вообще не о чем не говорят.
2.
Ценность имеют лишь очищенные, преобразованные, маркированные данные, оптимизированные для обучения конкретными алгоритмами машинного обучения.
3.
Коммерческие данные из п. 2, хотя и полезны, но мало актуальны для военного оперативного ИИ. Данные подбираются под конкретные задачи, а ценность коммерческих данных и моделей машинного обучения для военных приложений крайне мала.
4.
Синтетическая генерация данных (типа той, что делал DeepMind для триумфа AlphaZero в настольных играх), будучи сделана с умом, в тысячу крат ценнее, чем горы данных, произведенных 1.4 миллиардом китайцев, звонящих по телефонам и оплачивающих покупки онлайн.
Ключевой вывод в том, что будущее ИИ (и в том числе военного ИИ) не в больших данных.
А политикам, военным (да и бизнесменам) пора понять – «супердержавой ИИ» станет не страна с горами мусорных данных. А страна, что научится превращать их в еду, питье, энергию и стратегическое военное преимущество.
Китай и США в этом пока не сильно преуспели. И в этой игре никто не проиграл, пока никто не выиграл.

10