OpenAI представила нейросеть Point-E для генерации 3D-моделей по текстовому запросу

В компании признают, что она менее совершенна по сравнению с другими подобными технологиями, но позволяет значительно быстрее получить результат.

Изображение OpenAI<br />
Изображение OpenAI
  • Компания опубликовала открытый исходный код нейросети Point-E на Github, пишет TechCrunch. Согласно данным OpenAI, на графическом процессоре Nvidia V100 она способна создавать модели за «одну-две минуты».
  • Point-E состоит из двух моделей: первая генерирует простое изображение на основе текстового запроса, а вторая — преобразовывает его в 3D-модель. Для этого она создает облака точек в пространстве, которые повторяют трёхмерную форму объекта.
  • Чтобы нейросеть могла работать с мелкими деталями, разработчики создали дополнительную систему для преобразования облака точек в сетку — набор вершин, рёбер и граней, необходимых для детализации объекта.
  • По словам исследователей OpenAI, нейросеть обучалась на базе данных из «нескольких миллионов» 3D-моделей и связанных с ними метаданных. При этом компания в своей публикации не упоминает об авторских правах и художниках, чьи работы использовались для обучения.
  • Создатели также отмечают, что Point-E менее совершенна по сравнению с другими современными технологиями, но позволяет получить результат значительно быстрее. Они предполагают, что со временем нейросеть можно будет использовать в анимации, разработке игр, а также 3D-печати.
36
92 комментария