WirelessWire News The Technology and Ecosystem of the IoT.

by Category

ポリゴン AI ヒューマン イメージ

PS5のデモで見えたAIのキラーコンテンツ

2020.05.14

Updated by Ryo Shimizu on May 14, 2020, 12:24 pm JST

20時間ほど前に公開されたPS5上で動作するゲームエンジンUnreal Engine 5のデモは、世界中に衝撃を与えた。

数千億ポリゴン(ポリゴンは多角形の意味)で構成された超複雑なシーンを易々と描画する驚異の性能。
人物以外はほぼ実写映像にしか見えない。

というのも、そもそも最近の映画はCGがかなり多く活用されているので、我々が普段「実写だ」と思ってみている景色でも、実はCGでした、ということがけっこうある。

映画の世界では実写ではないものを実写に見せる技術、いわゆる特撮技術が昔から発達していて、例えば背景を絵で描くマットペインティングなんかも「実写ではないが実写に見せる」ための技術である。

ところが今回のデモでは、実写そのもののように見える背景がすべて精緻に作り込まれた、あるいはキャプチャーされたデータだったことで、ゲームコンソールの技術的な進歩に目をみはる一方、常に次世代ゲーム機開発者たちを悩ませてきた共通の問題を想起させることになった。

それは、「データ量が爆発すると、開発費が爆発する」問題である。

当然ながら、精緻なデータを作るのと、実写の背景をひとつ撮影するのではレベルが違う作業量になる。
信じられないことに、PS5世代のハードの能力を最大限引き出すためには、これまで以上の作業量が必要になる。つまり性能を限界まで引き出すには、映画並かそれ以上の手間を書けなければならないということになるのだ。

最近のゲームはただでさえ開発費が高騰している。昔は数百万円の予算で作れたものが、今は数億から数十億の予算が必要になっている。スマホのゲームでさえ、今や数億円の開発費と宣伝費がかかるのが普通になってきた。

ただでさえ最近のゲーム業界は制作費の高騰によって新作の開発ペースが遅れているのに、これ以上データ量が増えるとしたら技術以前に人手が間に合わなくなるし、予算も高騰してしまう。

そこで活用が期待されるのが、「実写を撮影するかのようにポンと撮影して、そのままゲームに使える」ようなキャプチャ技術だ。このキャプチャも真面目にやると手間がかかるのだが、そもそもゲームの世界というのは、現実に存在しない世界であっても全く問題ないので、現実に存在しないけれどもそれっぽい世界を自動生成するのが最も効率的ということになるだろう。

以前からゲーム、およびCGの分野では自己相似図形(フラクタル図形)を用いた自然物の自動生成手段があるにはある。
あるのだが、どうしてもフラクタル的な図形だけに頼ると、全体的なバランス感の調整が難しかったり、場所によって異なるディティールを調整する必要があり、省力化には限界があった。

たとえば、樹木はフラクタルで生成するのが一般的だが、木の形や葉の付き方まではフラクタルで生成できても、葉脈の様子とか、幹の節とか、樹皮などはそれぞれ別々に調整する必要がある。フラクタルによる支援は、アーティストの手間をあまり減らしてくれないのだ。

筆者はもともとゲームエンジニア出身だが、今はAIを専門とする研究者になっている。その筆者から見ると、PS5世代やそれ以降の世代(仮にPS6世代と呼ぶことにする)で実現するハードウェアのパフォーマンスを最大限に引き出したコンテンツをある程度の現実的な予算で作るには、クリエーション部分にAIを活用するのが最適解のように思える。

例えば、PS2以降の世代では、数多くの作品が「実写並」の画質表現を目指したが、そのほとんどは失敗した。
有名俳優を起用したり、町並みを作り込んだりしても、どうしても「よく出来た人形」のように見えてしまう。それは表情、動き、歩き方などすべてに及ぶ。

残念ながら今回のUE5(PS5)のデモでも、主人公である少女の描写には不自然さが多く残っていた。背景が実写に近づけば近づくほど、キャラクターの違和感が増大するのである。これを専門用語で「不気味の谷」と呼ぶ。

最近のAIは、わずかな情報から有る種の「翻案」をすることが得意になっている。
たとえば昨年末に発表されたU-GAT-ITは、顔写真からイラストを作り出すことができる。

または、今年公開されたFirst-Order-Modelは、一枚の写真を与えるだけで、動きのある映像を生成することができる。

したがって、データを作り込むよりも、AIによる「翻案」をうまく活用して「不気味の谷」をなくしてこんどこそ実写に限りなく近い役者を登場させるゲームを作ったり、人手では到底不可能なほど作り込んだ街を表現したりすることができるのではないだろうか。

PS5世代はほぼ現行ハードの延長上なので変えられないだろうが、PS6世代ではAI専用のチップがGPU(グラフィック処理ユニット)とは別に搭載し、通常のゲーム処理とは全く並行して、「ゲーム画像の翻案」を担当するようにさせるだけでゲームの可能性はさらに広がるはずである。

もちろんこれは今の段階では筆者の妄想に過ぎないが、こうした機構を入れるだけでゲームの可能性が広がることは確実で、確実である限り誰かがやるのは時間の問題だろう。たとえば最初はPCで、GPU2枚刺しの状態で実験することも簡単にできるし、実際にGPUの最大手であるNVIDIAはこれに近いアーキテクチャのデモを作ったことがある。

現在のGPUはグラフィックスとAIの両方に使われているため、効率をいろいろと犠牲にしている部分も少なくない。しかし、翻案に使われるニューラルネットワーク(AIの根幹部分)は比較的軽量で構造が単純なので、家庭用ゲーム機向けにはGPUを2つ搭載するよりも、GPUとは完全に独立・並行的に動く専用の半導体を実装するほうがコストを抑えることができるはずだ。

もちろん、GPUが一つのままでも、描画能力を犠牲にすればAIに割り当てることもできるが、今後AIがプレイヤーの動きや表情といった表現手段にも活用されていくことを考えると、専用回路があったほうが都合がいい。

ゲームAI開発の大家である三宅陽一郎氏によれば、今のところ、ゲーム業界におけるAIの活用は、キャラクターの動作やテストプレイなど限定的にしか使われていないそうだが、最も効果的な表現手段であるグラフィックスによりAIを活用することができるという認識に変化すれば、ゲームの表現は次の次元へと高めることができる。

実際にNVIDIAのTuring世代のGPUでは、通常では膨大な計算量になるレイトレーシング法の計算を省き、AIで補完(翻案)させることによって高解像度のレンダリング画像を得ることができるようになっている。

GPUの能力、そしてゲームエンジンの能力が飛躍的に向上したことで、データ量の爆発が起こり、PS5ではデータ量の爆発に対して、超高速な大容量SSD(ソリッドステートドライブ)を配置することで対応している。

PS5のSSDは「ハイエンドPCよりもはるかに優れている」とEpic CEOがコメント

インタビューによれば、PS5のSSDは、秒間5GBのデータ転送が可能だそう。ハイエンドのM.2接続のNVMEが3.5GBpsくらいだから、1.5倍程度のスピードがあることになる。

扱うことのできるデータ量が増えると、それを埋めるためのコストが別にかかってくる。
いままでも限定的な領域では地形などの自動生成は活用されてきたが、これからはその傾向がさらに加速されるだろう。

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら

清水 亮(しみず・りょう)

新潟県長岡市生まれ。プログラマーとして世界を放浪した末、 '17年にソニーCSLとWiL LLC.とともにギリア株式会社を設立し、「ヒトとAIの共生環境」の構築に情熱を捧げる。 '17年より東京大学先端科学技術研究センター客員研究員を兼務。著書として「教養としてのプログラミング入門(中央公論社)」「よくわかる人工知能 (KADOKAWA)」「プログラミングバカ一代(晶文社)」など。

RELATED TAG