アニメーションとプラモデル、そしてコンピュータグラフィックスとAI

2020.11.13

Updated by Ryo Shimizu on November 13, 2020, 10:38 am JST

スネ夫や矢吹ジョーのヘアスタイルは、立体化しようとすると矛盾する、という話がある。

実際に矢吹ジョーのようなヘアスタイルの人間というのはいないだろうし、それを真面目にトレースしようとするとギャグになる。たとえば稲中卓球部では井沢というキャラクターが、矢吹ジョーに憧れて同じ髪型を再現しようとするがヘアスプレーを大量に消費するという設定になっている。

しかし、「あしたのジョー」で描かれる作品世界においては、矢吹ジョーは現実感のあるキャラクターであり、だれも髪型に対して違和感を唱えたりしない。

こうした、漫画的表現、漫画的キャラクターというのは一体なんなのだろうか。

筆者は長いあいだコンピュータグラフィックスのプログラミングを専門にしてきた。会社の研究機関として、コンピュータグラフィックスに関する研究所を設けたこともある。なぜコンピュータグラフィックスを大事にするのかといえば、現代のコンピュータの進歩は、視覚性を獲得してから飛躍的に向上したからだ。

1960年代のJCRリックライダー、そしてダグラス・エンゲルバートの時代から、視覚性の獲得こそがコンピュータと人間との共生を実現するもっとも重要なポイントの一つだった。それまでのコンピュータには、人間と直接やりとりをする視覚装置がなかったので、人間にとってコンピュータとは、クリーニング屋さんのようなものだった。つまり、朝一番に出かけていって紙のカードにパンチしたプログラムを預け、翌日の夕方に結果を紙テープで受け取る、という具合だ。

ディスプレイが発明され、コンピュータがインタラクティブなものになっていくと、必然的に人とコンピュータの関係性は大きく変化することになった。

なぜ人はそれほどまでに視覚に心を奪われるのだろうか。

それは多くの人と生物にとって、視覚とは生きるために重要な役割を果たすためだと考えられる。つまり、敵と味方を区別し、食べられるものと食べられないものを区別し、好ましいものと好ましくないものを区別するのに視覚ほど便利なものはないからだ。視覚が発達した結果、文字が生まれ数式がうまれ、人は正確に時間や空間を超えて考えを伝えたり遺したりできるようになった。

したがって、情報を「どう見せるか」というコンピュータグラフィックスの分野は、計算機科学全般の研究分野の中でも特別なものだと考えている。

その、コンピュータグラフィックスの分野には、昔から「名画風フィルタ」というジャンルの研究がある。
たとえばモネっぽく見せたり、ルノアールっぽく見せたりするフィルタの研究だ。

有名画家のタッチの特徴を掴んで、それを写真から再現するというものである。
近年は同じようなものが、ディープラーニングの応用題材として度々登場する。

しかし、コンピュータによって写真から生成される「モネ風」だったり「ルノアール風」だったりする絵には、常にどこか空々しさがつきまとう。

これはかなり重要なポイントだ。

素人目に見ても、明らかにそれが偽物だとわかってしまうのである。
これはディープラーニングを使ったものでも変わらない。

なぜそういう錯誤が起きるのか。

根本的な違いは、たとえば写真をベースにしているところにあるとも言える。
写真からモネ風にする、というフィルタだと、どうしても対象を切り取る人の能力、つまりこの場合は写真を提供する人の能力によってそもそもモチーフが変わってしまう。

名画というのはただ絵に描かれたものではなく、「なにを書くか」「書きたいか」という情念から生まれているものだから、その肝心の出発点が素人になるだけで全体が台無しになる、というのはありそうな話だ。

次に、そもそも「対象がどんなものであるか想像できていない」という問題がある。
つまり人間であれば、それがたとえ写真から起こすものであれ、対象がどんなものか想像して描くことになる。

絵が下手な人は、写真をそのままトレスしたりして絵を描こうとするのだが、それでうまく描ける絵というのはかなり限られる。

絵が上手い人は写真をそのままトレスしたりは決してしない。それでは線が死んでしまう。
「面倒だから」やらないのではなく、「間違っているから」やらないのである。

以前、仕事であるCGアニメ監督の人と話をしたとき、「怒っている演技のときは、輪郭線をもっとガッツリ太くしたいのだが、今のCGではそれが難しい」というようなことを仰っていてなるほどと思った。

それが柔らかいものなのか、硬いものなのか、場合によっては、怒りや悲しみや絶望や歓喜といったものを表現しようとするとき、CGというのはどこまでいっても不便なのである。

自分自身が長い間CGを仕事にしてきたものだから、モノのカタチには正解があるとずっと思い込んでいたのだが、アニメ関係の人達の話を聞けば聞くほど、それこそが間違いであると気付かされるのである。

以前、仕事でアニメ関係の現場にただ張り付いている時期があった。
そのとき、監督がときおり「それじゃあプラモデルだ」と怒る場面を何度か目撃して、「プラモデルでは駄目だ」ということがどういうことなのか、そのあと何年も考え込んで、最近自分なりに仮の結論を出した。

簡単に言えば、プラモデルとは、そのカタチに、図面化できるような正解があると考えることだ、と思い至った。
人間は、いつも忘れてしまうが、たとえば定規やメジャーで長さを測れるとき、その長さによって作られているものがカタチだと錯覚してしまう。その錯覚はかなり便利なので、普通に暮らしていくぶんにはその錯覚を持ち続けていて何の問題もない。

ところがひとたび表現者の世界にやってくると、そうした錯覚は邪魔になる。すべてのモノをプラモデルのように、「カタチの正解」があるかのように表現しようとしてしまう。

もしも仮に、すべてのものがプラモデルのように表現可能なものだとすれば、そもそも絵描きなど必要なくなってしまう。
絵描きの仕事の真髄は、心象を表現することだ。心に浮かんだことを絵として表現して、それが絵にしか作れない魅力や迫力につながるのである。

なぜ子供はアニメが好きなのか。それは、子供にもわかるように情報が整理されているからだと考えられる。認識能力が低い子供にとって実写の映像は情報量が多すぎる。だから線を少なく整理したものが子供にとって心地よくなるのだろう。

筆者は先日、福島県須賀川市にオープンした「特撮アーカイブセンター」の落成式に行ってきた。

そこには特撮関係の人達が大勢いたのだが、宴席である人が、「CGで描いたロボットはなぜだかおもちゃが売れない」という話をされておられた。「理由はわからないんだが、とにかく売れない」という話である。

具体的にどの作品のどれがそうだったのか、ということまでは聞けなかったのだが、これもなんとなくわからなくもない気がする。

一時期遊んでいたゲームが、女子高生の忍者が20人くらい水着で水鉄砲を打ち合うという世紀末的な内容のものだったのだが、そのゲームにVRモードが搭載されたということで、ワクワクしながらVR画面で対面すると、全く同じキャラクターなのに受ける印象が全く異なるのである。

簡単にいえば、そのゲームではすべてのキャラクターが3Dモデルで動いているコンピュータグラフィックスだった。キャラクターを平面の画面で見ていたときには違和感も特に感じず、「可愛らしい」と思っていたキャラクターが、いざVR空間で全く同じモデルと対面すると、なにか等身大のフィギュアがそこにあるような奇妙な感じがするのである。

その等身大のフィギュアが、柔らかくグネグネ動くので、なにか化け物めいたものと対面している気持ちがしてゾッとしてしまった。

もちろん、シチュエーションやらなんやらはあるのだと思うが、この違和感がなかなか拭えなくて、結局、平面の画面に戻ってしまった。

これはもはや不気味の谷、ではない。
もっと決定的ななにかだ。

以前ならば、「そんなことは解決できない」と投げ出したようなこと、もしくは気づかないふりをしていたことが、一度気づいてしまうとどうしても頭を離れなくなってしまう。

特にAIがこれだけ発達してくると、いつか人間と同じような「プラモデル的ではない表現」の域に到達できるのではないか、という夢さえ見てしまうのだ。これをあるアニメ監督は「身体性」と呼ぶので、この言葉を使わせていただくことにしよう。

逆説的に最大のヒントとなったのは、プラモデルである。
それもミリタリーのスケールモデルだ。

実はプラモデルというのは、スケールによって解釈が違う。
特撮映画監督である樋口真嗣に言わせれば、「まずマスキングテープで仮組みして、全体のプロポーションを掴む。この時点で、どこかに違和感がないか、自分なりに考えて、それから全体の計画を立てる」のだという。

この「違和感」というのは人に聞いたら意味がない。自分の内なる印象から、実際に実物を見たときの印象と、プラモデルを仮組みしたときの印象の「差」を感じ取る感性を磨かないと永久に違和感など出てこない。だから、ミリタリーのスケールモデルがいい、というのは、実物を見ることができ、その印象とプラモデルを見たときの印象の「差分」を感じ取りやすいからだ。自動車のスケールモデルという手もあるが、自動車のプロポーションをじっくり見る機会というのはあんまりない。自分で持っている車ならいいのだが、プラモデルでキット化されている自動車は基本的に高級車が多い。

プラモデルが都合がいいのは、削ったり盛ったりなどの加工がしやすいからだ。つまりキットというのはあくまでも表現のための土台であって、目的地に向かうための補助線に過ぎないという考え方である。

そして「リアル」であることに本当に意味があるのか、という問いかけでもある。
「リアル」であることと「リアリティ」があることは違う。

これが、「プラモデルか、そうでないか」の差でもある。

「素組のプラモデル」は「リアル」であるかもしれないが、「リアリティ」が薄まっている。
なぜなら大きさが違うという時点で、既に印象の面で大きな差があるからだ。

小さくなっても、大きさを感じるようなもの、つまりリアリティを感じるようなものであるべきで、それを極限まで突き詰める必要がある。

遠回りのようでいても、それが表現者という「知性(Intelligence)」に対するもっとも確実なアプローチなのではないかと思う。

AIによって様々な表現が実現しそうだからこそ、我々AIの研究者や開発者はむしろ「表現」の本質に注目し、自らの感性を磨き上げる必要がある。そうしなければ、「モネ風」のフィルタでわかった気になっているのと何も変わらない。あくまでも「風」であってモネの贋作にも劣る表現しか今のところはできていないのだ。

その差を埋めるにはどうすればいいか考えることは、ひょっとすると、プラモデルの素組からプロポーションの印象の違いを見つけるのと同じことかも知れない。