WirelessWire News Philosophy of Safety and Security

by Category

検索から生成へ AI時代のフォークロア

2022.09.08

Updated by Ryo Shimizu on September 8, 2022, 20:07 pm JST

MidjourneyやStableDiffusionといったいわゆる「絵を描くAI」の隆盛が始まって三週間ほどが経過した。
筆者が書いた「Midjourneyをうまく使うためのヒント」という名前で始まったNote記事は、100万円以上の売り上げとなり、それはそのまま、StableDiffusionやそれを用いた派生サービスの活用ノウハウとして進化を重ねて行った。

これは一体今、何が起きているのだろうか。
AIが絵を描き始めたのは、何も先月が初めてではない。

そもそもディープラーニングブームの端緒であるオートエンコーダでは、人間の書いた手書き数字を画像的に再現できるかというところから研究が始まっていたし、その後、革命的なブームとなった畳み込みニューラルネットと、その応用である敵対的生成ネットワーク(GAN;Generative Adversarial Network)では、人間の顔や動物の写真といったものを見事に学習し、描写してみせた。

にもかかわらず、これが「すごい」という印象論だけで終わっていたのは、結局のところ、「ふつうのひと」からみて、この「本物そっくりの写真を再現するAI」のうまい使い方がわからなかったからではないか。

2020年には、自然言語AIのために開発された技術であるTransformerを画像に応用しようという流れが生まれ、これが恐るべき成果を出した半年後に、満を辞して発表されたOpenAIのDALL-Eは、まさに神業のような絵を生成する機械として人類全体・・・は言い過ぎとしても、すくなくともAI研究者コミュニティには大いに衝撃を与えた。

また同時に、本来、非営利の研究機関だったはずのOpenAIは研究のための大量の計算リソースを確保するための多額の費用をスポンサーを得て賄うように変節していった。現在、OpenAIの最大のスボンサーはMicrosoftであるとされ、OpenAIの大規模言語モデルはMicrosoftによって囲い込まれた。

当然、DALL-Eのようなめざましい成果が生まれたとしても、それを「無償かつ自由」なオープンソースソフトウェアとして流通させるよりも前に、Microsoftは投資を回収しようとし始めた。

この動きに呼応して、逆にオープンソースコミュニティは「これほどまでにすごい可能性を秘めたAIを、自分達の手に取り戻す必要がある」と考え、無数の開発者たちが協力しあう体制が素早く構築された。

AIを学習させるために必要なのはまずデータセットであるため、まずオープンソースのデータセットLAIONが開発され、これが英語と画像の組み合わせ20億(2B)、英語以外の言語と画像の組み合わせ20億(2B)、そして英語の中でも美しい画像と英語の組み合わせ10億(1B)をあわせて50億(5B)という途方もない数のデータを集め、学習させることに成功した。この学習には、一説によればシステム費用だけで2億円程度かかっているという。

こうした膨大な努力の末に開発された作画AIを、全く無償で、しかも商用利用可能な状態で、オープンソースとして頒布するという試みが行われたのは約2週間前で、それはStableDiffusionと名付けられた。

今はまだ「面白い」だとか「意外と扱うのが難しい」だとかという、表層的な感想を抱く人が大多数だが、StableDiffusionの無償公開という英断は、20世紀末から始まった「検索革命」の終焉と、新たな可能性の展望が拓けたことを意味している。

筆者は常に未来予測をする際、歴史的流れから次の予兆を探ることにしている。これが最も確からしい方法だからだ。
とすれば、検索革命以前、20世紀末の情報社会まで遡ってみよう。

今では信じられない話だが、1994年に筆者が大学に入学し、学内のECC(教育コンピュータセンター)に出入りできるようになった頃、インターネットはまだ一般の人々がおいそれと手の届くものではなかった。

Windowsへの移行は進んでいたが、まだバージョン3.1であり、Windows3.1には、OSレベルでTCP/IPプロトコルに対応しておらず、TrumpetWinsockというシェアウェアを購入する必要があった。そう。インターネット(ここでは面倒くさいのでWWWのことをインターネットと呼ぶことにする)は明白に「有料コンテンツ」だったのである。

次に、Webブラウザも、大学にいけばMOSAICというフリーのブラウザを使うことができたが、自宅ではNetscapeNavigatorというブラウザに5000円程度払って「買う」のが当然だった。我々貧乏学生は、インプレスの「インターネットマガジン」あたりの付録CD-ROMに入っている、「60日無料体験版Netscape」を二ヶ月に一回インストールしたり、PCのシステム時計を誤魔化したりという姑息な手段でなんとかタダでインターネットを使おうと必死だった。

ちなみにこの時、まだ「検索」は存在していない。

インターネットにどのような情報があるのか、知るためには、NTTの誰か個人のページに行く必要があった。たしか「NTT Directory」みたいな名前だったと思う。誰かがまとめたそのページには、NASAだのホワイトハウスだのスタンフォード大学だのNCSAだのへのリンクが貼ってあり、そのリンクを辿るとそれぞれのページにたどり着いた。

この「Directory」はどんどん長くなり、長大な一ページとして存在していて、新しいページが追加されるたびに学生だった筆者はワクワクしながらそのページに辿り着くのだった。

この頃、検索は存在していないので、ドメイン名やフォルダ名が大事だった。
たとえば、学生のメールアドレスはg9401572@なんとか.ac.jpだったり、学籍番号がそのままメールアドレスで、自分のWebページはhttp://なんとか.ac.jp/g9401572みたいな、かなり機械的なURLが割り当てられていた。

インターネット商用化の波は、まずは「わかりやすく覚えやすいURL」を獲得するというところから始まり、つかさのウィークリーマンションは完全な語呂合わせでURLを作ってCMで宣伝したりしていた。

ところが大学に通い始めてすぐに、インターネットマガジンで「Yahoo!(ヤフー)」というサイトが立ち上がっていることを知る。
Yahoo!はインターネット上のWebサイトをカテゴリー別に集めた極めて便利なサイトで、自分のWebページを申請しておくと、Yahoo!の「ネットサーファー」なる人物が自分のページをチェックしにきて、十分有用だと判断したら、Yahoo!の一覧(ディレクトリ)に載せてもらえるという仕組みだった。

実際、Yahoo!は数千人ともいわれるネットサーファーを雇い、日夜Webサイトを追加していった。
やがてYahoo!には画期的な機能がついた。それが検索ボックスだ。

Yahoo!の一覧(ディレクトリ)は、ただでさえカテゴリーごとに分かれていて便利だったのだが、「検索ボックス」の登場によって、いちいち「あのページはゲームのカテゴリだっけ、エンターテインメントのカテゴリーだったっけ?」と思い出す必要がなくなった。

検索革命の始まりである。

さて、Yahoo!によって始まった「検索革命」は一大ムーブメントとなった。
Yahoo!の株価は鰻登りになり、「ネットサーファー」の数も飛躍的に増えて行った。
しかし、それ以上に、Webサイトの数が爆発的に増えた。

検索不可能な状態から検索可能な状態に移行したことで、Webサイトはそれまで以上の猛スピードで造られることになった。
これが人間のネットサーファーによる目視のチェックでは立ち行かなくなることは火を見るよりも明らかだった。

1998年。筆者はまだできたばかりの株式会社ドワンゴに、学生のまま「出入り業者」という身分で入り浸り始めた。当時の筆者の主な任務は米国大手OSメーカーの仕事を一手に引き受けることだが、まだ5,6人しかいなかった頃のドワンゴで、同世代の若者たちが集まっていれば、自然と世間話やゲームを遊んだりして盛り上がるのだった。

当時のドワンゴは、ネットワークゲームサーバーをゲーマーたちに無償解放していた。それだけでなく、Microsoftの「Age of Empire」という大ヒットゲームの大会を勝手に開いて賞金まで出していた。ドワンゴとは、もとともはDial-up Wide Area Network Game Operation(DWANGO)を略した頭字語であり、ネットワークゲームに特化したソリューションカンパニーとして売り出し中だった。

あるとき、社長が「なぜうちのサイトはYahoo!に載っていないんだ」という話をし始めた。
誰も考えてなかったが、確かにネットゲームに特化したソリューションカンパニーが、日本の、いや世界のネットサービスの名簿であるYahoo!に掲載されていないというのは随分奇妙な話だ。

その頃にはとうにネットサーファーの仕事量はパンクしていて、とにかく申請して何ヶ月たっても掲載されないし、掲載されるかどうかすらわからない有様だった。

この頃、「相互リンク」というのがやたら流行っていた。
あるページからリンクを貼るから、お返しに自分のページにもリンクをして欲しいというお願いをすることだ。

当時のWebサイトのほとんどはリンク集であり、何か意味のある内容(コンテンツ)を発信しているサイトは全体の1%もなかった。

そのあとなにをどうしたのか知らないが、やっとドワンゴがYahoo! Japanのディレクトリに掲載された頃には、時代は既に次の革命へと移っていた。
ロボットである。

人間のネットサーファーを使わず、ソフトウェア的に造られた自動機械、つまりロボットによってWebサイトを勝手に徘徊し、勝手にキーワードを抽出して検索可能にする仕組みである。

AltaVistaやInfoseek、日本で言えば千里眼といったロボット型検索エンジンは、登録の手間もなければ新しいサイトを公開してからものの数分で検索可能になるので新鮮な情報を獲得するのに非常に便利で普及した。

それをみて慌てたのは当のYahoo!で、これはいかん、と従来のネットサーファーによるディレクトリ型検索と、ロボット型検索を組み合わせたハイブリッド検索エンジンとしてリニューアルを果たした。

これでロボット型検索エンジンへと流出していた人流は再びYahoo!に滞留し始め、このころソフトバンクがYahoo!を傘下に収めたと思う。
ソフトバンクは駅前で、デパートで、田舎のショッピングセンターで、とにかくADSLモデムを無料で配り続け、「インターネットならYahoo!」というイメージを刷り込んだ。

とにかく手っ取り早く「インターネット」が欲しければ、駅前にいけばADSLモデムと回線契約がすぐにできたのである。

なぜ昔話をしているか。
筆者はこの当時のことを克明に覚えているからだ。

そしてこの当時の筆者には、「いろんなサイトをカテゴリー別に一覧できるディレクトリとしてまとめてまとめること」も、「ソフトウェアロボットによってページを辿って行って勝手に検索可能にする」ことも、まったく思いつかなかったからだ。考えも及ばなかかった。それどころか、それを自分の仕事にしようなどとは、まったく、夢にも思わなかったのである。

先日、京都で開催されたIndustry Co-Creation Summit Kyoto2022の最終日に筆者と一緒に登壇した、人流AIソリューション企業Uneryの内山社長は、その当時、ミシガン大学で人工知能の研究をしていたという。

そこに大学の先輩がやってきて、得意げに見せたサービスに、「なんて典型的なダメなサービスなんだ」という感想を持ったという。

「これは他のやつと何が違うんですか?」

と内山社長が聞くと、

「他の検索より速いし、何より検索結果の精度が高いんだ」

と先輩は語ったらしい。
「これは絶対に失敗する」と当時の内山社長は思ったそうだ。

そのシステムは、「バックラブ」と呼ばれ、当時のロボット型検索エンジンの中でも異彩を放つものだった。
しかし、さっぱり売れなかった。AltaVistaやExciteなど、一年半に渡りさまざまな企業に売り込んだが、その全てが契約に至らなかった。
実に興味深い話だ。

エキサイトの担当者は、バックラブの検索結果のほうがエキサイトの検索結果より優れていると認めた上で、こう考えた。

「エキサイトの価値は、滞在時間だ。バックラブによる検索では、あまりにも早くユーザーは目的とするページを認めてしまう。エキサイトの利益を最大化するためには、敢えて検索エンジンの能力を80%程度にしておくべきだ」

あまりにも売れないので、もっとマシな名前が必要だということになって、バックラブは、「巨大な数」を意味する言葉に変わることになった。
ただしタイプミスで、oがひとつ多かった。それが我々が今日知るGoogleという名前の誕生である。内山さんの先輩は、名をラリー・ペイジと言った。

西暦2000年まで、つまり創業してから2年、バックラブの開発から4年ほどはGoogleは全く報われない会社だった。
その頃、Yahoo!は、検索エンジンの開発に熱意を持っていなかった。数千人を超える社員の中で検索エンジンを担当するのはわずか数名だけ。さらにもう一人を雇うことすらできず、やむを得ず外部の検索エンジンを採用することにした。色々みて回った挙句、Googleがよさそうだということになった。Yahoo!における検索エンジンチーム以外の人たちが何をしていたのか。諸説あるが、Yahoo!はブランドの構築にエネルギーを注いでいた。しかしそれは、Yahoo!を実際に使うユーザーの方を向いていなかった(注:日本ではYahoo! Japanは未だGoogleを圧倒するトップサイトである)。

2000年にGoogleは歴史的な契約をものにしていた。Yahoo!の検索エンジンを全てGoogleが握り、それだけでなくGoogleのロゴをYahoo!の検索結果ページに表示できるようになったのだ。まさに「巨人の肩に乗る」ことが、Googleの成功の始まりだった。そしてやがてGoogleがYahoo!と決別したあと、日本はともかくとして少なくとも米国では、Yahoo!よりも遥かにGoogleが使われるようになった。ユーザーはYahoo!が大金と数千人の社員を投じて必死で構築したブランドではなく、Googleの提供する体験を選んだ。

さて、それから20年経った時代に生きる我々はなにを学び取るべきだろうか。
まず第一に、検索が登場した時、そしてそれがロボット型検索に移行した時、最後にロボット検索の覇者が大資本をバックとしたAltaVistaでもInfoseekでもExciteでもなく、スタンフォード大学の教員が大学の設備の中でスタートしたものだったこと。そしてその価値を、大資本は大資本であるがゆえに採用することができず、唯一Yahoo!だけが、苦し紛れに採用したことで爆発的に成功したこと。

この話が「絵を描くAI」にどう繋がるのか、この記事のテーマを思い出して頭にたくさんの?マークが浮かぶ読者の顔は想像がつく。
でも敢えて想像してみて欲しい。それが1995年にGoogleを見た人たちの多くが感じた感想である。

破壊的テクノロジーというのは、それほどまでに破壊的で、破壊的であるがゆえに普通の人はもちろん、かなり優秀な人、飛び抜けて優秀な人にもすぐには理解できない。

しかし、「絵を描くAI」と「検索」は機能的にはほとんど同じものである。

20世紀最後の発明が「検索」だったとしよう。
検索とはこのようなものである。

検索エンジンが「検索」可能なのは、当然ながら既に存在している情報だけだ。
その「情報」はWebページだったり画像だったり動画だったりするが、検索エンジンができることはあくまでも「どこかにある情報」を持ってきて示すことだけなのである。

ところが現代においてはWeb検索は死にかけている。
SEOが蔓延り、正しい情報とそうでない情報、むしろ混乱させることを目的とする情報が溢れすぎていて、これには検索エンジンの覇者であるGoogleでさえ手を焼いている。

たとえば「絶対成功する投資案件」で検索した場合、絶対に正しい答えは出てこない。
そんなものは存在しないからだが、「絶対成功する投資案件」で検索すると「絶対成功する投資案件はありません」といったページが出てくる。

これはこれで正しいのだろうが、そもそも「絶対成功する投資案件」を検索しようとしたユーザーは、本当はどんな答えが欲しかったのだろうか。
急にお金が必要になったのか、それとも急に将来に不安を感じて眠れなくなったのか。少なくとも「投資案件」を探しているということは、今この瞬間が貧乏ということはなさそうである。

本来であれば、「絶対成功する投資案件」で検索するようなユーザーには、「どうしたの?何か困ってることがあるの?」と聞いてあげるのが本当に必要な対応だろうし、飲み屋で「絶対成功する投資案件」を聞かれたら、きっと誰もがそう答えるだろう。

ところが検索というのは、どこまでいってもそのニーズを満たすことはない。
ネットに公開されている情報は、多かれ少なかれコストがかかっており、公開する側の動機は、自分の商品を買って欲しいか、自分の顧客の商品を買って欲しいか、それとも自分を買って欲しいか、そのどれかでしかない(この記事も例外ではない)。

だから検索エンジンを使うことで人類は多少は知識を補えるようになったかもしれないが、人類全体を見ても全体的に知性があがったわけではない。
むしろ少しでも知性的に劣る人、自信がない人を全力で騙そうとする勢力と検索エンジンとの戦いが常に行われており、再び「もはや検索は機能しない」と言われる時代に逆戻りしつつある。

たとえば、画像検索が実装された時、これは便利だと思った。
企画書を書いたりするときなんかは、「東京駅」といえば東京駅の写真が出てくる。こんなに便利なことはない。

筆者は2003年に独立して、サラリーマン時代から付き合いのある相手先の企画書を書く仕事をしていたのだが、あるとき、国民的歌手のモバイルサイトの企画の仕事が来たことがある。

独立してからの初仕事ということで、張り切って企画書を書いた。
この頃、企画書にネットで探してきた写真を貼り付けるというのはそこまで問題視されることもなく、筆者は当然のようにネットで検索した国民的歌手の写真を表紙に使って「内部資料」としのて企画書をしたためた。

その企画書はクライアントに非常に高く評価され、そのクライアントのクライアントにも非常に好評で、ついにその国民的歌手の所属事務所にまで拙作の企画書がプレゼンされることになった。

ところが、企画書の表紙を見た所属事務所社長の第一声は予想外のものだった。

「なあ、これ、うちの○○じゃなくて、○○のそっくりさん芸人なんだけど・・・」

国民的歌手ゆえのアクシデントである。

閑話休題。
検索というのは、所詮は手段にすぎない。
また、どういう手段かといえば、「サグラダファミリアってこんな感じの塔だよ」とか、「ハモってこんな魚だよ」とか、知識を確認したり、相手に説明したりするための手段である。

しかしこのような検索の使い方は、検索の本来の目的、つまり図書館情報学でいうところの「検索」の本当の目的とはかけ離れている。
「検索」の本当の目的は、たくさんの有用な情報を集めて、要約し、自分なりの論点を整理したり、新しい発想を得ることにある。

つまり、検索というのは、本来は人間の思考プロセスのほんのはじまりにすぎない。
筆者自身、この原稿を書くためにたくさんの文章を検索しながら書いているが、本来の検索のありかたというのは、さまざまな情報を集積し、それを個人の体験や思考と掛け合わせることで新しい独自の視点を得るために行うのだ。

ネット上にある情報が瞬時に検索でき、有用性の順に並ぶのは確かに素晴らしいが、いつまでもそれが最先端というわけではない。
昨日新しかったものは、明日には常識になる。その意味では、Google的な検索は、もうとっくに常識になっていて、2000年以降に生まれた世代、すなわち今の新卒世代以降にとっては、当たり前の「自然物」に近い。

一方で、「絵を描くAI」に自分の思い通りの絵を描かせようとする行為は、一見すると検索と真逆なようでいて、実はAIが内在する特徴空間内の検索作業である。

たとえば、検索では、「アメリカ大統領」という検索キーワードと、「黒人」というキーワードをあわせてオバマ大統領を見つけることはできる。
しかし、それは単なる事実であって、もしも「アメリカ大統領」と「アジア人」というキーワードで検索したら、答えはかなりナンセンスなものになるはずだ。

試しにやってみると、こうなった。

この情報から読み取れるのは、「アジア系のアメリカ大統領は過去に例がなさそうだ」ということだけだ。
でも本当にこのキーワードで検索したユーザーが知りたかったことはなんだろうか。

「どうしてアジア系のアメリカ合衆国大統領がいないのか」「どうすればアジア系がアメリカ合衆国大統領になれるのか」と言ったことではないだろうか。

しかし、そんなことは誰も書いてない。誰にも方法がわからないからだ。
これが検索というものの限界である。

しかし、StableDiffusionやMidjourneyという「生成するAI」に、「アジア系のアメリカ合衆国大統領」と聞けば、どんな人物なのかイメージしたものが出てくる。

もちろん出てくるのは一種類ではないが、黒髪で、ニコニコ笑っているというのが定番だ。
これはMidjourneyやStableDiffusionがネットにある50億の画像と文章を読み漁った挙句の、社会が抱く「偏見(バイアス)」をそのまま出力したものなのである。

もしも物語を作る立場なら、こうした生成AIによって「アジア人のアメリカ合衆国大統領」に対して一般の欧米人が抱くイメージを先回りして知ることができるし、それを敢えて裏切るために、「敢えて若くて幼く見える女性をアジア人のアメリカ合衆国大統領にしてみよう」と考えることができる。

AIというのは、学習したものを忠実に反映する。それが内在的に持つ偏見さえもが、AIの内部にある特徴空間として再構成されてしまう。
AIは、人類の心の内面を映し出す鏡なのである。そう、闇夜に輝く月がどれだけ眩しくても、それは太陽の光を月が反射しているに過ぎないのと同じように、だ。

その意味では、検索では不十分なのである。
今は画像だが、画像にできることは必ず他の形態のデータに対しても起きる。

かつてWebサーバーのライセンスはとても高額だった。
数千万円という金額をかけて、Webサーバーのライセンスを購入し、毎年数百万円の保守費用を払う必要があった。
その後、Apacheというオープンソースプロジェクトが登場してから、Webサーバーに値段をつけて売る人はいなくなった。
Webブラウザも、かつては買うものだったが、いまどきWebブラウザを買うといったら、「どういうこと?」と混乱さえするだろう。

AltaVistaもInfoseekもExciteも大資本をバックとして成長してきた会社だった。今は見る影もない。
唯一、大学の寮でレゴブロックで組んだボロボロのサーバーでスタートしたGoogleだけが、検索エンジンの覇者となっている。

これは単なる美談の類なのだろうか。
松下幸之助は東芝や日立といった大資本が幅を利かせる中で二又ソケットという、非常に取るに足らない器具、しかし当時の家庭にとって絶対に必要だった器具を作って財を成した。スティーブ・ジョブズは実家のガレージで創業し、ビル・ゲイツは飛行機の中で最初の製品のプログラムを書いた。本田宗一郎は戦後の瓦礫の中で自転車にエンジンを付け、井深大は電気座布団と炊飯器からソニーを作った。

これは単なるおとぎ話(フォークロア)のはじまりなのだろうか。
僕にはそうは思えない。

むしろそのすべては、必然なのではないか。
もしも伝説を作る人間になろうとすれば、伝説そのものをなぞることが必要なのではないか。

こうした、見すぼらしい始まり方には、必然的に研ぎ澄まされた何かがあるのではないか。
検索から生成へと移行する今の時代は、僕にはインターネット(繰り返すが本稿では分かりやすさを優先してWWWをインターネットと呼ぶ)の始まりと奇妙に重なって見えるのである。

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら

清水 亮(しみず・りょう)

新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。

RELATED TAG