2D映像が、そのまま3Dになる。 3DGSで、写真を立体空間へ。
「3DGS」とは?
3DGSは、平面の画像をもとに立体的な3D空間を再構築する最新のAI技術です。 映像の中の「奥行き」や「形」をAIが自動で読み取り、光と透明感を持った無数の光の粒(ガウス)を使って立体を再現します。 従来の3Dスキャンよりも手軽かつ低コストで仕上がるのが特長です。
「3D Gaussian」って?
「中心位置(x,y,z)」、「形状(3軸方向のスケール)」、「回転(3D の姿勢)」、「色(RGB)」、「透明度」を持つ楕円形の光の粒です。 この光の粒を無数に集めると、まるで粘土で盛り付けたような立体的シーンが構成されます。
3D再構築の新スタンダード 3DGS
従来のNeRFの弱点である「重い」「遅い」を克服した、実用性の高い次世代技術です。
空間をガウスの粒で直接表示
点群レンダリングで超高速
品質と軽さが両立◎
3DGS
特長
リアルな立体感
高速処理
特別な機材不要
多分野に対応
use cases
利用シーン
不動産
物件の室内を3Dで内覧体験
観光
名所をバーチャル空間で再現
シミュレーション
ロボットの空間シミュレーター
災害対応
災害時の即時状況把握
エンタメ
映像・ゲーム・メタバースの世界づくり
導入のメリット
高速・低コストで3D化を実現
従来のフォトグラメトリ(写真測量)や3Dスキャンでは、高価な機材と時間が必要でした。
3DGSなら一般的なカメラ映像だけで3Dモデルを生成できるため、撮影からデータ完成までのコストを大幅に削減できます。
撮影環境を選ばない柔軟性
屋内・屋外、ドローン空撮、スマートフォン撮影など、さまざまな撮影条件に対応。
ビジネスの差別化につながる体験価値
お客様に「見る」から「体験する」へ。
3DGSによって、従来の写真や動画では伝えきれなかった空間の臨場感やスケール感を伝えられます。
写真が空間になる。体験がひろがる。
FAQ
よくあるご質問
3DGS はリアルタイムで動きますか?
はい、動きます。3DGSの大きな特徴のひとつが、推論(表示)が非常に軽く、リアルタイムで滑らかに動作することです。WebブラウザやVR環境でも高速に表示でき、インタラクティブな3D体験に向いています。
ただし、学習(最適化)プロセスは計算負荷が高く、時間がかかる点は変わりません。リアルタイムで動くのはあくまで「表示」であり、「学習」は重い処理になります。
3DGSは室内シーンや建物の再構築に強いですか?
はい、非常に強いです。3DGSは、壁・床・天井などの平面構造が多く、模様や質感といったテクスチャ情報が豊富な室内空間や建物シーンと非常に相性が良い技術です。
一方で、透明素材(ガラス)、強い反射面、鏡面仕上げ、模様の少ない無地の物体(低テクスチャ)などは情報が不足しやすく、NeRFやフォトグラメトリと同様に再構築が難しくなることがあります。
高品質な3DGSを作るために、撮影時に気をつけるポイントはありますか?
3DGSの品質は「どんな映像・写真を用意するか」で大きく変わります。
以下のポイントを意識して撮影すると、より精度の高い3Dモデルを作ることができます。
- カメラをゆっくり、滑らかに動かす
- 動画の場合は 30〜60FPS が理想
- ピントが安定していること
- 明るい環境で撮影する
- 屋内なら照明が均一だとベスト
最適化のメモリ消費はどれくらいですか?
最適化時のメモリ消費は、基本的に「ガウスの数」に比例します。
1つのガウスは、位置・色・透明度・スケールなど複数の属性を持つため、1ガウスあたり数十〜数百バイト程度のメモリを使用します。
シーンが大きくガウス数が増えるほど、最適化に必要なGPUメモリも増えるため、再構築する対象の規模に応じて余裕のあるGPUを使用することが重要です。
カメラポーズ推定が悪いと何が起こりますか?
カメラポーズが正確に推定できていないと、3Dモデルの形が歪んだり、表面が二重に見えたり、テクスチャがぼやけるなどの品質低下が起こります。また、ガウス点の配置が乱れて穴が開いたりノイズが増えるため、全体の再現性が大きく損なわれます。高品質な3DGSを作るには、正確なカメラポーズ推定が欠かせません。
Gaussian(ガウス点)の数はどのくらいで、どのように決まりますか?
Gaussian(ガウス点)の数は、対象の大きさ・撮影範囲・ディテール量によって変わります。
一般的な目安としては、以下のようなガウス数になります。
対象ごとのガウス数の目安
- 小物(商品・小型オブジェクト):50,000 〜 200,000 個
- 部屋(室内空間):500,000 〜 1,500,000 個
- 建物スキャン(外観・大規模構造物):1,000,000 〜 5,000,000 個
※ シーンの複雑さや撮影枚数により変わります。
ガウス数の決め方
- 最初は「点群の数」から
学習開始時のガウス数は、Structure-from-Motion(SfM)で生成された点群の数=初期ガウスの数になります。 - 学習中に不足している場所に自動的に増加(densification)
学習が進むと、AIが「密度が足りない」「もっと細かい情報が必要」と判断した箇所にガウス点を 自動で追加(densification)します。 - GPU・シェーダーが耐えられる範囲まで増加
ガウスの数には明確な上限はなく、GPU性能やシェーダー処理の限界まで増やすことが可能です。 - 不要なガウスは削除(pruning)
必要ないガウスは学習中に自動で削除され、最終的に 20〜30%ほど削られることも あります。
3DGSの学習はどのように行われますか?
3DGSの学習は、簡単にいえば「写真や動画をもとに、空間の形や質感を理解し、無数の“ガウス(点の粒)”として再構築するプロセス」です。
学習は以下の手順で進みます。
- カメラの位置と向きを推定
撮影された画像から「どの位置・角度で撮られたか」をAI(COLMAPなど)が推定します。 - 点群データを作成
複数の画像から空間の特徴点を取り出し、ざっくりとした3D構造(点群)を生成します。 - 点群を初期モデルに変換
それぞれの点に「位置」「色」「大きさ(スケール)」を持つ“ガウス”を割り当て、初期の3Dモデルを作ります。 - レンダリングして誤差を計算
ガウスから描画した“仮の画像”と、実際の撮影画像を比較して、どれくらい違うか(誤差)を計算します。 - ガウスを最適化
ガウスの位置・色・透明度・大きさを少しずつ調整し、実際の画像に近づけます(AIの最適化)。 - 足りない部分はガウスを増やす / 余分な部分は削除する
必要なところはガウスを増やし(densification)、不要な部分は削除します(pruning)。 - この処理を数千〜数万回繰り返す
繰り返すことで、細部まで再現された高精度な3Dモデルが完成します。
