OpenAI представила нейросеть Point-E для генерации 3D-моделей по текстовому запросу

В компании признают, что она менее совершенна по сравнению с другими подобными технологиями, но позволяет значительно быстрее получить результат.

Компания опубликовала открытый исходный код нейросети Point-E на Github, пишет TechCrunch. Согласно данным OpenAI, на графическом процессоре Nvidia V100 она способна создавать модели за «одну-две минуты».
Point-E состоит из двух моделей: первая генерирует простое изображение на основе текстового запроса, а вторая — преобразовывает его в 3D-модель. Для этого она создает облака точек в пространстве, которые повторяют трёхмерную форму объекта.
Чтобы нейросеть могла работать с мелкими деталями, разработчики создали дополнительную систему для преобразования облака точек в сетку — набор вершин, рёбер и граней, необходимых для детализации объекта.
По словам исследователей OpenAI, нейросеть обучалась на базе данных из «нескольких миллионов» 3D-моделей и связанных с ними метаданных. При этом компания в своей публикации не упоминает об авторских правах и художниках, чьи работы использовались для обучения.
Создатели также отмечают, что Point-E менее совершенна по сравнению с другими современными технологиями, но позволяет получить результат значительно быстрее. Они предполагают, что со временем нейросеть можно будет использовать в анимации, разработке игр, а также 3D-печати.

#новость #opeai