カーネギーメロン大の研究グループが新しいAIモデルを報告しています。
そのAIモデルとは、簡単な線を元に3Dコンテンツを生成する機能を持つもの。生成された3Dコンテンツは画像としてだけでなく、VRやAR用のファイルとしても使用可能とのことです。

驚くべきデモ動画
研究グループは実装コードの保管場所であるGitHubページにて、以下のデモ動画を公開しています。動画を見ると分かるように、簡単な線を与えるとAIが3Dモデルを生成します。ユーザーは、線の一部を消したり書き加えたりすることで、3Dモデルを編集することができます。
3Dコンテンツを作成するためにユーザーが描くのは、(専門的な用語ですが)「セグメンテーション」と「エッジマップ」と呼ばれるもの。セグメンテーションとは、画像をいくつかのオブジェクトに分割するしるしです。エッジマップとは、その名の通り画像における物体のエッジ(端)を示す図です。

将来展望
研究グループによると、今回の技術がもたらす影響は以下のようなものです。
これまでに比べて、初心者がより簡単に3Dコンテンツを作成できるようになります。そして出力された3Dコンテンツは、写真編集ソフトだけでなくARやVRのアプリケーションにも直接使用できます。
また、次のステップについては以下のように述べています。
現在のところ、この技術は画像内に含まれる一つのオブジェクトに対して有効なため、今後は複数のオブジェクトが含まれるより複雑なシーンに対応することが期待されています。また、生成されるコンテンツはデータセットの偏りによって左右されてしまうため、今後はより多様なデータセットでトレーニングすべきだとしています。
なお、論文はPDFで公開されています。Google翻訳によって機械的に日本語訳したファイルを下記に置いておきます。
参照論文情報
- タイトル:3D-aware Conditional Image Synthesis
- 著者:Kangle Deng, Gengshan Yang, Deva Ramanan, Jun-Yan Zhu
- URL:10.48550/arXiv.2302.08509
プロジェクトページ:cs.cmu.edu/~pix2pix3D/
GitHub:github.com/dunbar12138/pix2pix3D
関連研究
まるで写真のようにリアルな3Dの人間モデルをポーズ指定で作り出すGANが開発されている
Googleの研究チーム、手描きの簡単な絵で関連する画像を検索できるAI技術を開発
言葉で指示を与えるとその通りに3D人間が動くAIモデルが公開
1枚のスケッチから世に無い新しい写真を作り出すことが可能に(AI論文解説)
(メディア会員システムのご説明)
当サイトの会員は、過去記事をすべて閲覧できるほか、自らの課題に特化した文献調査をリクエストしたり、広告掲載をオーダーしたり、AI開発に関するコンサルティングを申し込んだりできます。会員からは、「AIに関する情報収集を効率的に行うことができている」「非常に素晴らしいサービスだ」と好評を頂いています。
会員登録は無料、文献調査や広告掲載などのオプションは有料です。今ならディスカウントにも対応しています。
毎月対応できる顧客の数には限りがあり、会員登録が早い方はオーダーのご対応がスムーズに行えます。ぜひ早速ご利用ください!
会員登録はこちら
なお、本メディアの読者が交流を行うサークルをOPENしました!ぜひご参加ください!
※この記事では、Twitterで反響があった話題に対して詳細や補足をまとめています。
オリジナル記事の新着はSNSから