AI業界というのはいまだに非常に狭い業界だ。
これは、あまりいいことではない。
AIの応用範囲はとても広く、最低でもコンピュータの適用範囲と同じくらい、最終的には、紙やホワイトボードが使われるような場面はすべてAI化されると考えられる。その広大な市場を切り開いていくためには、業界全体がレベルの底上げをしなければならないし、AIの活躍する場面が、あらゆる分野に及んでいかなければならない。
今のところ、AI業界と呼ばれる業界は、アカデミズムとかなりかぶっている。ところがアカデミズムにおいても、AIは新興勢力のように見える。というのも、ほんの十年前まで、たいていの人々が見向きもしなかった分野だからだ。もしもAIに関する学位または博士号を持っているという人が現れたとしても、非常に注意深く相手を観察するべきである。なぜならAIに関する学会は非常に長い歴史があり、長い歴史の中では間違った事実が真実だと信じられていた時代もあり、また、最新の新興的なAIは、今度は新しすぎて、やはり間違っていた事実を真実だと勘違いした状態で与えられた学位の可能性がある。
これはどういう状態かと言うと、自然科学の歴史に例えれば、プラトンの時代からアインシュタインの時代まで、2400年ほどの時間があるが、これくらいの進歩をわずか30年、多めに見積もって100年でこなしてきたのが現代のAIなのである。ざっくり言って、自然科学と比べて進歩のスピードは20倍程度ある。
したがって、たとえば30年前にAIの学位を授与されたとすると、それはプラトンのアカデメイアの卒業証書を持っているに等しい。権威はあり、尊敬されるべきだが、論じられている内容は重いものの方が早く落ちるだとか、イデア界という世界があるとか、とにかく今の常識では明確に否定されているようなことである可能性が高い。
この、猫の目のようにクルクルと認識が変化(あるいは進歩)するところが、まさしくアカデミズムにこの分野が嫌われている理由でもある。じっくり腰を落ち着けて研究するということが難しいのだ。ある仮説が唱えられてから、自然科学では30年から100年かけて検証されたり否定されたりするのだが、AIの世界では1年かそこらで同じようなパラダイムシフトが起きてしまう。これはしんどい。
下手をすると、指導教官よりも学生の方が最新の理論に精通していることはしょっちゅうである。
似たようなことは産業化の過程でよく起きる。たとえばマイクロコンピュータとコンピュータゲーム産業だ。
コンピュータとゲームが最初に結びついたとして知られるのはマサチューセッツ工科大学の研究室だった。
しかし実際にそれがマイクロコンピュータになり、コンピュータゲーム産業が巨大化する過程で最も活躍し富を築いたのは博士号を持つ学者たちではなくヒッピーやティーンエイジャーたちだった。今、AIにおいても似たようなことが起こりつつある。
「幸いにして」まだAIに使うコンピュータは少し高価で、普通の人には手が届かない。
だからまだティーンエイジャーでバリバリAIを操る人というのは少ない。が、これは時間の問題で、コンピュータはどんどん安くなり、パパがマイクロソフトフライトシミュレータをやろうと思って買った高スペックPCに飽きて子供にお下がりして、子供がゲーミングPCにUbuntuを入れてTensorFlowを走らせる時代の到来まであと少しだろう。Google Colabなら、昔でいうナイコン族(コンピュータは持ってないけど知識だけはある人たち)のような、要はGPUマシンは買えないけれども知識だけはあるという人たちが実践経験を積むには持って来いだ。そんな子供がいるわけはないと思うかもしれないが、そんな子供が日本に一人でもいたら儲けもんである、くらいの心構えでいなければならない。日本に一人でもそんな子供がいたら、その子が未来を変える。
さて、そうしたまだ見ぬAIネイティブ世代の出現を夢見ながら、最新の技術トレンドにふるい落とされないためにこの業界の人が毎日欠かさず行っているのが、paperswithcodeというサイトを定期的にチェックすることだ。これをしていない人はモグリと言ってよい。AI業界人を名乗る資格がないからだ。
paperswithcodeは、その名の通り、「コード付きの論文」を紹介するサイトである。
最新のもの、トレンドのもの、その時点で最も優れているもの、という分類でまさしく猫の目のように変化するAI業界の最先端の風に触れることができる。これでも足りないという人は、筆者が開発・運営しているarxiv-vizを見るといい。最新論文の図だけを抜き出して一望できるようになっている。
paperswithcodeを眺めていると、毎日のように新しい話題が出てきて飽きない。
そして当然、「コード(実装)」がついているので、ほとんどの論文はすぐに手元で試せるというところが魅力だ。
先日筆者の目を引いたのは、Recipes for building an open domain chatbotという論文で、これの実装がいくつか公開されていた。
「オープンドメインチャットボット」とは、通常のチャットボットがシナリオ式である特定のタスク、例えばFAQに答えたり売り場の案内をするだけに対し、オープンドメインでは、ごく普通の会話を行う。会話でどんな展開になるか予想もつかない、というところが魅力だ。
この「オープンドメインチャットボット」でよく知られたAIは、blenderbotという、複数の会話を総合的に学習したものだが、Microsoftが作ったDialoGPTというものもあり、こちらはOpenAIのGPT-2をベースとして7億6千2百万パラメータで学習させた大規模なものである。
これとの会話をブラウザ経由で手軽にできる実装が公開されていたので試しにやってみた。
AIは自然科学の研究に限りなく近いため、論文だけ読んでもだめで、実験をセットで行わなければならない。下手をすると、実験のほうが大事かもしれない。というのも、論文にされた段階でほとんどのニュアンスは失われ、単に「正答率」とかそういう尺度でしか見られないのだが、実験をしてみると全く異なる感覚、つまり「実用的かどうか」という知見が得られるからだ。
まずはBlenderbotと会話してみる。ちなみに以下の会話は、読みやすくするため、英語で会話したものをGoogle翻訳が自動的に日本語に訳したものである。
最初、Blenderbotとの会話は快調にスタートしたように見える。
でもそれが見せかけに過ぎないということは、週末の予定に話題が移ったことによってすぐに露呈する。
映画が好きだという割には、どんな映画が好きか答えられない。
どういうことかと思ってコマンドラインを見ると、完全に混乱しきっていた。
「通信エラー」と出るのは、内部的にエラーを吐いてるのが原因らしかった。しかもどうやら辞書にない単語で語り掛けたのが問題らしい。
気を取り直して、DialoGPTのlargeモデルを試してみる。
今度の出だしは快調だ。
そっけないやりとりだが、むしろリアリティがある。
通常、よく知らない相手との会話はこういう感じになりがちだ。あんまり情報を出しすぎてもうまくいかない。
映画の話題になったので、ターミネーター2の話題を振ってみた。
このAIはターミネーターに出てくるSkynetというAIの存在を肯定しているようにも見えるが、どうでもいい相手のどうでもいい会話をしているようにも見える。
あまり情報を出さないようにすると、見かけ上、賢い可能性を否定できなくなり、賢そうに見えるというパラドクスがある。
しかし、このAIもすぐにおかしくなってしまう。
AIがSkynetに同意してしまったので、筆者はあわてて話題を変えた。
ビデオゲームの話題はどうだろうか。
すると今度はAIは暴走し、「あなたを愛しています」しか言わなくなってしまった。
この実験からなにがわかるだろうか。
ちなみに、何度か会話をリセットして繰り返したものの、しばらくすると「愛しています」しか言わないAIになってしまった。
筆者の英語が悪い可能性ももちろんあるが、英語が通じない相手にはとりあえず「愛してます」と畳みかけるのもなにか間違っているという気がする。
このことから何か教訓めいたものを得るとすれば、単に人間同士の会話をひたすら学習させていくという方法論には限界があるのではないかということだ。
当たり障りのない会話ができるようになるかもしれないが、引き換えに会話の目的そのものを喪失している気がする。
最近、雑談ロボットへの注目が高まっていて、雑談のコンペティションというものも開催されている。ただ、これもおかしな話だ。人間に雑談のコンテストが用意されないのは、「よい雑談」という定義がハッキリしないばかりか、相手によって変化するからだ。
たとえば、大学教授との雑談は、研究者同士にとってはとても有意義だが、一般の人にとっては退屈だったり刺激的ではあるけれども難しすぎて途中でついていけなくなってしまうことも珍しくない。
雑談の価値や、そもそも雑談の「雑さ」といった事柄は、とてもではないが定量的に測れるものではない。
そうした知見を得るには、やはり実際にAIと雑談を試みてみるしかないのである。
筆者にとって今のところ、雑談ができるAIというのは、まだまだ悪い冗談のように思えるのだ。
おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)
登録はこちら新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。