WirelessWire News Technology to implement the future

by Category

無価値だった検索と今無価値に思える作画AI。その先にある行動の生成

2022.10.29

Updated by Ryo Shimizu on October 29, 2022, 07:51 am JST

過日、幕張メッセで開催された「AI・人工知能EXPO」内のブースでコネクトームデザイン社の佐藤社長と対談する機会があった。
その時、佐藤社長から出された問いが、「検索から生成、そして創造とはどういうことか?」という最近の筆者の提言に対するシンプルな疑問だった。

人前で話をするというのは面白いもので、こういう問いかけを受けると、その場でそれまで自分が思いもしなかったような答えが出てくる。
知性が単独では存在意義を持たず、複数の知性が考えをぶつけあって思想が育つ、まさにその瞬間に出くわした。なかなか久々の感覚である。

かつて、検索は無価値だった。
いまだに「検索」にお金を払う人はいない。

検索は、データベースの必須機能でありながら、価値があるのはデータベースであって検索機能ではないと長らく考えられて来た。
1990年代のGoogleが、まだGoogleと呼ばれるようになる以前、検索はサイトの滞在時間を伸ばすため、来訪者に「迷い」を与えるためのギミックであり、速くて正確な検索は、かえってサイトの滞留時間を減らしてしまい、サイトの価値を毀損すると考えられていた。

不思議なことに、今のAIによる画像生成は、生成と銘打ってはいるが、実際には特徴空間内の検索である。
ただしその特徴空間にあるはずの情報は、どの人間も過去に目にしたことがないもので、だから人間からみればそれは「生成」に見える。

「おそらく今現在、検索と呼ばれている行為は、生成のサブセットまたは前身と見做されるだろう」

筆者は直感的にそう答えた。
根拠があるわけではないが、生成の実態が特徴空間の検索であるとすれば、いまの(レガシーな)検索というのは、所詮は人間のちっぽけな想像力が生み出した極めて疎な隙間だらけの空間に過ぎない。

検索が生成へとトランスフォームするのは時間の問題で、興味深いことに、検索にお金を払う人は一人もいなかったが、生成にお金を払う人は世界中にいることがStableDiffusionとMidjourneyによって証明された。

といってもまだこれは「興味本位」の段階を出ていない。筆者はすでにこうした記事(もちろん原稿料が発生する)や講演のスライド(もちろん講演料が発生する)を書くために作画AIを使うことが日常的になっている。

筆者くらいの泡沫ライターともなると、原稿料は安過ぎて本来ならイラストレーターに挿絵を発注する金額は出ない。
しかし、作画AIなら瞬時にたくさんのアイデアを出して来て、それを選ぶだけでいい。生成コストは一枚あたり0.1円もしない(これは自作しているからだが)。

そして作画AIを使ってふんだんに挿絵を入れた原稿と、全く挿絵のない(この記事のような)原稿では、読者の食いつきや理解度が格段に違う。
つまり、作画AIはおそらく初めて、一般(に近い)の人がマネタイズ可能なAI実装と呼ぶこともできる。

今後、作画AIを駆使した漫画や同人誌などが山ほど出てくるだろう。今年の冬のコミケがどうなるか、今から楽しみである。

その一方で、「今の所生成では対応できず検索するしかないもの」もあるにはある。たとえば、「こんなものが食べたい」と言った時に、存在しない店を生成されても困る。
だから生成が次世代の検索としてメインストリームになったとしても、本質的に検索するしかないものは残るだろうと考えていたのだが、この時のディスカッションでそうでもないことがわかった。

「今はUberEatsで何を食べたいか検索して、与えられた選択肢の中から選ばなければならないが、いずれ、食べたいものをAIが生成して複数のお店のメニューを合成するなどして提案してくれるようになるだろう」

こんな言葉が自分の口から出て来たときは、まったく目から鱗だった。
でも確かに、筆者は毎朝のように「今日は何を食べるべきか」ということに悩む。

吉野家は昨日行ったし、松屋のカレーは一昨日食べた。CoCo壱はまだ開いてないし、近所のやよい軒は少しイマイチである。
こんなときに、「コンビニで冷凍餃子を買って家で焼いて食べる」という選択肢がもしも浮かんだなら、それほど冴えた解決策はない。

この程度の悩みを人々は常に抱えているはずだ。
食べ物がわかりにくいのであれば、洋服のコーディネートでもいい。

たとえば筆者は最近、デモ用にドスパラの16インチ液晶搭載ハイエンドGPUゲーミングノート(3080 Laptop搭載で30万円という破格の安さ)を買ったが、これが入るちょうどいいバッグがない。

バッグを買えば、それに合う服も欲しくなる。そうした人間の購買行動そのものも「生成」できるようになるだろう。

「生成」というと、まるで「この世に存在しないものを作り出す」というイメージがあるが、実際に行っているのは、「現実と現実の間」を特徴空間から検索するということなので、それほど突拍子もないことを提案されることもないはずである。

旅行プランも、デートプランも、結婚式のプランも、およそ「プラン」と呼ばれるものはすべて生成できるようになるだろう。事業計画や広告企画などもおそらく例外ではない。

人工知能研究者にとってこの話が面白いのは、「人間のように考える機械を作ろう」というひとつの出発点から、記号処理的AIと、機械学習AIの大きく二つに分かれ、それがぐるっと大回りしてから同じゴールに辿り着いたように見える点だ。

記号処理的AIの世界では、ずっと前からエキスパートシステムや論理プログラミング言語Prologのように、「知識を記号的に教えれば必要な知識を推論から検索できる」と考えられてきた。この方法はかなりうまくいく。たとえばグラフ理論の四色問題のように、人間だけでは証明するのが難しい問題を鮮やかに解決することができる。日本人なら毎日当たり前に使っているかな漢字変換(IME)も、WWWも、ある種の記号論的な人工知能研究の延長にある。

記号処理的AIの限界は、明らかに知識の入力が完全には自動化できないというものだった。
そもそも「正しい知識」というのはあり得るのか。たとえば事実として、「2021年1月20日にジョー・バイデンがアメリカ合衆国大統領に就任した」という知識は入力できたとしても、「トランプ政権より良くなった」か「悪くなった」かは、主観的情報であって「知識」ではない。

この区別をしながらこの世の全ての知識のデータベースを構築するのはなかなか難しい。
また、このやり方だと、どこまでいっても、人間の把握している範囲の知識しか学ぶことはできない。

記号処理的なAIは、「自動車」と「りんご」の間を想像することはできない。その二つは全く異なる概念であり、共通点は「モノ」である点と「曲面」を含む点くらいだろう。

今も記号処理的AIはあちこちで使われていて、都会で住む人々には乗り換え案内がそれであると言うとわかりやすいだろうか。

機械学習的なAIは、とにかく闇雲に知識を詰め込み、なんとかAIが自分の中で分類し、AI自身の頭の中の特徴空間にマッピングしていく。こうして全体としてアナログ的な広がりを持ったもやもやとした知識空間ができあがる。

記号処理的なAIでは、たとえば「モノ」→「道具」→「乗り物」→「自動車」や、「モノ」→「植物」→「果物」→「りんご」のように、フォルダ分けに近い形で知識が格納されるが、機械学習的なAIは、ぼんやりと「このへんが自動車」で「このへんがりんご」と、同じ空間に配置する。

こうした特徴空間はかなり疎(スパースという)であるが、メリットもある。
たとえば「自動車」と「りんご」の共通点を探そうとしたとき、記号処理的なAIでは共通点を見出そうとすると分類に依存するが、特徴空間では、たとえば「赤い自動車」は「レモン」より「りんご」に近いと判定できる。

特徴空間は数百から数千次元の高次空間で、人間が直感的に把握するのは難しいが、同じ特徴空間上にあれば、どんなにかけ離れた概念であっても「距離」を計算することができ、空間上の二点が決まれば直線が、三点が決まれば平面がそこに現れる。

「自動車」と「りんご」を結ぶ直線から、その中間だけを求めると、たとえばこんな画像が得られた。

たしかにりんごのように丸い形で、りんごのように赤い自動車のイメージが得られる。

これは記号処理的AIでは絶対に出てこない「検索結果」である。

さらに「フルーツ」という項目を加えるとこうなる。

インターネットにロボット型検索エンジンが登場した時、夢中になってネットのあちこちを「冒険」してみたことを思い出す。今、なぜ作画AIに熱中する人たちが後を絶たないのかと言えば、まさに巨大な特徴空間を探索することそのものが面白いからだ。

メディア論的に言えば、作画AIは、「次に何が起きるかわからない」というクールさを備えているのである。

画像は常にわかりやすい例だ。
これまで同じようなことは自然言語や数値上の操作でできていたのだが、人間に最もインパクトを与えるのは音でも言葉でもなく画像である。

AIの世界ではつねに繰り返されて来たが、画像に対してできることは、何に対しても適用できる。

すでに動画生成は試みが始まっているし、音楽や分子構造の生成にまで応用が検討されている。

しかしおそらく本当に価値を生むのは、広告を超え、ユーザーの求める結果(アウトカム)を得るための行動を生成するAIになるだろう。

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら

清水 亮(しみず・りょう)

新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。

RELATED TAG