Приемы вуалирования смысла от алгоритмов
Захотелось составить список о том, как люди привыкли обходить алгоритмы распознавания текстов и смыслов. Пока что это достаточно легко делать, но в контексте AI Пушкин или Bert уже становится игрой для ума.
Итак, список:
- Транслит - использование транслита вроде "podstrahui moi huawei" самый, наверное, очевидный прием, который мог применить человек, чтобы обойти самый, наверное, первый фильтр мата.
- Запикивание визуальное — использование знаков вместо букв: Обл@сти т*мы тр%ль смотр$л все три #асти.
- Падонкаффский язык — каким-то образом ставший частью обычной речи настолько, что даже при написании этого текста браузер не подчеркивает слово падонкаффский: "ФогтИЧЕзки, йЕто уЖос из дветЫщинулЁвых".
- Смена положений букв — В прочме это можте быть и протсая ошбика, котраоя звучти, как полський или сребский язкы.
- Замена по внешнему виду — достаточно смекалистая манипуляция, которую мог бы применить человек, чтобы передать слово другому человеку, но не быть замеченным машиной: |-|а }{абре 0н }{оте/\ бь|ть pо>|<ден.
- Все согласные - "Кр. - сстр. тл."
- Удвоение букв - техника вроде бы не сложная, но алгоритмы заставляет напрягать, если к нему не подключен словарь всех слов или такое слово составное. Дело в том, что алгоритм еще может увидеть трии подддряд идущие буквы, но он не очень понимает лишняя две или одна. Следовательно нужно подключать дополнительные алгоритмы, например, вычисление приставки, части речи и так далее или сравнивать по словарю.
- Комбинация всех вариантов - самое страшное, что может произойти при соединении всех способов: 0днаD>|<ь| Zг@йнеД pг|d#т. Самое страшное не в смысле страха, а в смысле достижения пределов адекватности.
Предел шифрования обычным человеком (не шифровальщиком) сообщения обозначен лишь способностью понять смысл получателями. Очевидно, что этот предел очень близко. Когда он будет достигнут и повсеместно преодолен, то не останется причин использовать вуалирование.
Пишите ваши варианты в комментариях.
Начать дискуссию