Улыбаемся и машем: как и зачем наши ученые сгенерировали больше 1000 документов со счастливыми лицами?
Хвастаемся крупнейшим датасетом ID-документов и другими научными достижениями
В нашей компании 30% сотрудников являются счастливыми обладателями ученых степеней кандидата и доктора наук, а остальные – к этому стремятся. Поэтому по окончании каждого года мы традиционно подводим итоги не только нашей коммерческой деятельности, но и научной работы.
За 2022 г. сотрудники Smart Engines подготовили 65 научных работ – это на 20% больше, чем в 2021 г.. Из них:
– 13 были представлены докладами на конференциях в области ИИ, компьютерного зрения и обработки изображений;
– 20 были напечатаны в сборниках конференций;
– 32 были опубликованы в самых престижных научных журналах. Они индексируются крупнейшими в мире базами данных научных статей Web of Science (WoS) и Scopus.
Нужно уточнить, что среди индексируемых научных журналов есть те, которые считаются особенно престижными — журналы Q1, первого квартиля. Они пользуются большей популярностью и обладают наивысшим уровнем цитируемости. В таких журналах мы за прошлый год выпустили 10 статей.
Некоторые из этих научных публикаций создали заметный резонанс в СМИ и соцсетях. О них мы и расскажем далее.
Мы обучили нейросети распознавать многослойные микроструктуры человеческого мозга*
Наши специалисты по искусственному интеллекту совместно с коллегами из России, Италии и Германии в своей статье в журнале Tomography рассказали, как первыми в мире построили 3D-модель обонятельной луковицы человека. Это небольшой (около 0,5 см) участок мозга, имеющий сложную слоистую структуру. До недавнего времени эта и подобные ей микроструктуры мозга исследовались либо в низком разрешении методом МРТ, либо с разрушением образца по результатам гистологии.
Теперь же коллективу ученых и специалистов по искусственному интеллекту удалось построить 3D-модель обонятельной луковицы в высоком разрешении без разрушения образца. Результаты эксперимента помогут в исследованиях нейродегенеративных состояний и в установлении причин ухудшения обоняния при коронавирусе COVID-19.
Мы продемонстрировали, как нейросети могут вводить в заблуждение врачей**
В журнале Mathematics мы рассказали о том, как нейронные сети могут вводить в заблуждение врачей при диагностировании заболеваний с помощью томографических снимков.
В отдельных случаях искусственный интеллект может дорисовывать на снимках несуществующие опухоли, ложные поражения в результате COVID-19 и другие ошибочные признаки заболеваний. И наши ученые предложили новый метод оценки устойчивости нейросетей к подобному “обману”.
Другими словами, мы создали инструмент, который перед непосредственным применением нейросетей позволяет их оценить и выбрать наилучшую, наиболее подходящую для реального использования. Это важный шаг на пути к внедрению нейросетей в медицину, которая, будучи весьма консервативной, пока с недоверием и опаской смотрит на инструменты машинного обучения.
Мы создали крупнейший датасет документов, удостоверяющих личность***
В 2022 году исследователи Smart Engines опубликовали статью в журнале Computer Optics, описывающую уникальный датасет MIDV-2020 для машинного обучения. Это крупнейший общедоступный набор данных. Он включает в себя 1000 искусственно созданных ID-документов, 2000 сканов, 1000 фотографий и 1000 видеоклипов - всего 72 409 размеченных изображений и видеокадров.
В этой статье мы представили базовые оценки методов анализа ID-документов – обнаружение и определение местоположения, идентификация, распознавание текстовых полей и распознавание лиц. О том, как датасет создавался, мы во всех красках рассказали в нашем блоге на Хабр.
Кстати, один из комментаторов Хабра приметил, что все лица на опубликованных фотографиях выглядели "слишком радостными и красивыми". Еще раз отметим, что мы на это никак не повлияли. Искусственно сгенерированные изображения лиц для каждого документа мы взяли на Generated Photos Service. Для генерации имен и адресов мы использовали открытые базы данных существующих имен (такие как "Википедия") и онлайн‑генераторы адресов/имен.
Это исследование мы провели в сотрудничестве с коллегами из французского университета Ля Рошель.
Мы полагаем, что собранный нашими учеными набор данных ненастоящих документов пригодится для разработки и оценки методов компьютерной экспертизы документов, обнаружения атак и других подходов к проверке подлинности.
Мы находимся в числе компаний-лидеров по научной работе
В 2021 г. сотрудники Smart Engines написали в совокупности 41 работу, в 2022 г. - уже 65. Smart Engines является в России одной из компаний-лидеров по числу опубликованных сотрудниками научных статей, оценивает CEO Smart Engines к.т.н. Владимир Арлазаров.
Мы рады, что бизнес и наука в нашей компании гармонично сосуществуют и стимулируют взаимное развитие, о чем свидетельствуют финансовые показатели. Именно твердая приверженность принципу Science First (наука на первом месте) позволяет нам постоянно расширять перечень предлагаемых решений и совершенствовать их.
*По мотивам статьи: Meshkov, A.; Khafizov, A.; Buzmakov, A.; Bukreeva, I.; Junemann, O.; Fratini, M.; Cedola, A.; Chukalina, M.; Yamaev, A.; Gigli, G.; Wilde, F.; Longo, E.; Asadchikov, V.; Saveliev, S.; Nikolaev, D. Deep Learning-Based Segmentation of Post-Mortem Human’s Olfactory Bulb Structures in X-ray Phase-Contrast Tomography. Tomography 2022, 8, 1854-1868. https://doi.org/10.3390/tomography8040156
**По мотивам статьи: Smolin, A.; Yamaev, A.; Ingacheva, A.; Shevtsova, T.; Polevoy, D.; Chukalina, M.; Nikolaev, D.; Arlazarov, V. Reprojection-Based Numerical Measure of Robustness for CT Reconstruction Neural Network Algorithms. Mathematics 2022, 10, 4210. https://doi.org/10.3390/math10224210
***По мотивам статьи: K.B. Bulatov; E.V. Emelianova; D.V. Tropin; N.S. Skoryukina; Y.S. Chernyshova; A.V. Sheshkus; S.A. Usilin; Z. Ming; J.-C. Burie; M. M. Luqman; V.V. Arlazarov; MIDV-2020: a comprehensive benchmark dataset for identity document analysis. Computer Optics 2022, Vol. 46 (2), DOI: 10.18287/2412-6179-CO-1006