original image: © Sergey Nivens - Fotolia.com
第二世代人工知能の亡霊がもたらす"AIの冬"
AI Winter is coming!!
2016.11.21
Updated by Ryo Shimizu on November 21, 2016, 15:49 pm JST
original image: © Sergey Nivens - Fotolia.com
AI Winter is coming!!
2016.11.21
Updated by Ryo Shimizu on November 21, 2016, 15:49 pm JST
日立が公開した「汎用人工知能」のプロモーションビデオが日本のAI業界で悪い意味での注目を集めています。
[youtube https://www.youtube.com/watch?v=gapHaWwtGnM&w=560&h=315]
このビデオでは、日立は自社で開発したAI技術「H(エイチ)」を、「汎用人工知能」と自称しています。
しかし、「汎用人工知能」は、通常、AGI(Artificial General Intelligence)の訳とされ、人工知能研究のメインストリームでは、GoogleやFacebookなどを含めて「まだ世界の誰も開発に成功していない」ものとされています。
ビデオに登場する株式会社日立製作所、研究開発グループ技師長の矢野和夫氏によれば、このH(エイチ)は、「(カスタマイズなどの必要がなく)汎用的に使える人工知能」ということで、このビデオの中では「汎用人工知能」という言葉が連呼されていますが、こうした言葉の濫用に、眉をひそめる業界人も少なくないようです。
こうした日立の勇み足に対し、国内でディープラーニング技術のトップ企業とも言われるプリファードネットワークス社の丸山宏氏はFacebookで公開コメントをしています。
昨今、ディープラーニングを契機としてAIが急激に注目を集める中で、こうした言葉の濫用により、現在の人工知能技術に過度の期待を集めることで、逆に再びAIに対する深い失望による投資意欲の後退を意味する「AIの冬(AI Winter)」の到来が懸念されています。
既に国際会議では、早くもこうした言葉の濫用に警鐘を鳴らすべきかどうかという議論に発展しています。
日立製作所としては、「汎用的に使える」「人工知能技術」ということで、略して「汎用人工知能」と呼んでいるという主張なのだと思いますが、「汎用人工知能」では全く意味が異なってしまうため、濫用は避けるべきです。
同様の懸念として、IBMが提唱する「コグニティブコンピューティング」という言葉もあります。
イエール大学の人工知能学者、ロジャー・シャンクは「THE FRAUDULENT CLAIMS MADE BY IBM ABOUT WATSON AND AI.(IBMのWATSONとAIにおける詐欺的主張)」というエントリーを公開しています。
シャンクによれば、シャンクは「Watsonは詐欺であり、コグニティブコンピューティングは誇大広告に過ぎない。今すぐ彼らをやめさせる必要がある」と主張しています。
実際に、Watsonを使おうとすると、あまりにも断片的なものしか用意されていなくて驚きます。
実のところ、筆者も一度はWatsonを試そうとしました。
しかし、それは失望と呼ぶしかないものでした。
WatsonのAPIとして提供されているものは、「自然言語分類」「検索およびランク付け」「文書変換」「会話」「音声認識」「音声合成」といったもので、これは基本的にはディープラーニングとは無関係な、既存技術の寄せ集めに過ぎません。もっというと、Watsonを有名にしたはずの、クイズに正解する機能すらありません。少なくとも汎用的は皆無です。
ひとまずWatsonが提供している会話エンジンを、筆者も試してみました。皆さんもすぐ試すことが出来ます。
まず、会話のデモに行くとWatsonが軽妙な台詞で出迎えてくれます。
やあ、今日はご機嫌なドライブだね。なにかして欲しいことはあるかな?
Hi. It looks like a nice drive today. What would you like me to do?
いきなりドライブしてる設定なのが意味不明ですが、ここは目をつむりましょう。
とりあえず、眠いとでも言ってみましょうか。運転中に眠くなるなど言語道断ですが、普通はそれくらいの会話から始まるものです。
眠い
I'm sleepy
おっと君の言ってることがわからないよ。別の言い方で質問してくれるかな?
I am having trouble understanding you. Try asking your question in a different way.
既にこの段階で怒りに手がプルプルと震え始めました。
21世紀に、この程度のものをコグニティブコンピューティングだとかいうんでしょうか。
あなたの会社の社長の名前は?
What name is the president of your company?
そんなこと知らないよ。君が言って良いのは、「ライトを付けて」とか、「音楽を流して」みたいな感じだけだよ
I'm not sure about that. You can say things like "Turn on my lights" or "Play some music."
既にSiri未満ということがハッキリしていますが、仕方がないので「ボブ・ディランが聞きたい」と言ってみましょうか。
ボブ・ディランの音楽が聞きたい
I want to listen the music of Bob Dylan
もちろんだよ!どんなジャンルがいい?ジャズなんかオススメだよ。
Sure thing! Which genre would you prefer? Jazz is my personal favorite.
これでAI、そしてコグニティブコンピューティングで何十年とやってきたシャンクが怒らないわけがありません。
会話が噛み合ってないのです。
そして「ジャズでいいからディランをかけてよ」と言うと、「じゃあ適当なジャズを流すね」と返します。ディランのことなど完全に忘れたようです。
これがIBMが世界に誇る人工知能、Watsonの正体です。
あまりにも予想の斜め下をいく酷いデモだったので、おもわずソースコードを調べてみました。
そしてこんなものをよくも天下のIBMが堂々と公開しているものだと、驚愕しました。
サンプルのソースコードはGithubで公開されています。
まずは、IBMが先端技術と考える、その素晴らしい"コグニティブコンピューティング"のソースコードを御覧ください。
わかりますか?
このファイルに記述されたのは、Watsonの「会話プログラム」が反応できる、全ての語句です。
逆に言うとここに書かないとどんな質問にも答えられません。
「help」「help me」「How are you going to help me」「how can you help me」「need help」・・・ってhelpだけで何パターンあるんでしょうか。質問を受け付けるだけで全ての会話パターンを書き出さないと使えないのです。
ふつう、会話プログラムをAIが支援すると聞いたら、最低限の会話はできるようになっていて、その上で多少のカスタマイズをすれば目的の会話や知識を実装できる、と考えがちですが、どうやらWatson先生の前では、そういう考えは「甘え」のようです。
しかしまさか、21世紀に80年代の人工無能ゲームの、そのなかでもとりわけ出来が悪い部類のものを見る羽目になるとは思わず、あまりのショックに原稿を一度書いたあと、風呂に入って、再び出てきてソースコードを確認したほどです。筆者のショックの大きさわかるでしょうか。
想像の遥か斜め下を行く出来ばえに、怒りを通り越して悟りを開く勢いです。これをみたらシャンク先生でなくても詐欺だと言いたくもなるでしょう。
いいでしょうか、このプログラム(というか設定ファイル)には、全く、知性の欠片すら、その片鱗さえも入っていないのです。
昔と違って、PC部門を中国メーカーに売り飛ばしてしまったIBMには、もう研究者はもうひとりもいなくなってしまったのでしょうか。きちんとしたプライドをもったプログラマーなら、こんなものをAIとミスリードさせるようなことには耐えられない気がするのですが。IBMでプログラマーとして働く人達が気の毒でなりません。
ちなみにこれを利用するのにAPIコールが最大1000コールまで無料だそうです。素晴らしいですね。きっとWatsonの提供するAPIを使わずにRaspberry Piで自分で書いた方がもっといいものが作れそうですね。
GUIによる開発環境がついてくるらしいので、これを使えば、誰でもWatsonを使った会話プログラムを構築することができます。
[youtube https://www.youtube.com/watch?v=tEz8e6Koctg&w=560&h=315]
このビデオを見たとき、もの凄い感動がありました。
まるきり80年代そのままの世界観です。タイムスリップしたかのような衝撃です。
これは第二次人工知能ブームが終焉する直前にほとんど同じような、いやそれでもこれよりは随分マシな開発環境とプログラミング言語があった気がします。
まあプログラムが全く出来ない人にとってはいいのかもしれませんね。
ただ、筆者の知る限りこれは昨今話題になっている人工知能ではありません。
強いて言えば、第二世代人工知能の亡霊です。
そしてそれは、機械学習を除いてほとんど完璧に停滞していた技術なのです。
そして第二世代人工知能は、できることがあまりにも少ないのに、なんでもできるようなミスリードを引き起こしたことで自ら「AIの冬」と呼ばれる、AIへの失望期を引き起こしたトリガーになりました。
昨今話題を集めているのはあくまでも機械学習の一部のジャンルである深層学習が、それまで不可能と言われていた数多くのタスクで劇的な性能向上が見られたことで、それ以外の分野、つまり第二世代人工知能の分野ではほとんど特筆すべき技術革新は今のところ起きていないのです。
しかし今、第三世代のAIと呼ばれているものは主に深層学習を活用したものだけであり、AIが注目されると同時に、かつて権勢を誇った第二世代AIの亡霊たちが再び蘇ってくるのはある意味で宿命といえるかもしれません。この亡霊を倒すことができなければ、せっかくの第三世代AIもとばっちりで再び「AIの冬」を引き起こす可能性がありますから、こうした過去とは明確に訣別すべき必要があるのです。
Watsonを構成するAPIの多くは、何十年も前に進化がほとんど停滞してしまった第二世代人工知能の塊のように見えます。もしかすると、音声認識では深層学習の成果を利用しているかもしれませんがそれだけです。これ全体をして「最近流行の人工知能でございます」は明らかにミスリードです。
ただ、Watsonの場合は、「汎用」とまでは言っておらず、少し詳しい人からみたら、実際にはなんの革新性もないことがgithubで露呈しているのでむしろ良心的と言えます。Webのデモを試し、「私の目的にはこれで十分だ」と思えば、その人は堂々と使えば良いのです。
日立の自称「汎用人工知能」は、Webで動くデモすらありません。ですから技術的に主張されていることが本当なのかウソなのかということも判別できません。
日立の提供する「汎用人工知能」H(エイチ)に関して言うと、仮にも(IBMのコグニティブコンピューティングよりも遥かに意味として強い言葉である)「汎用」人工知能を名乗るなら、Siriよりマシな会話ボットをWebでデモしてくれてもバチは当たらないと思います。少なくともビデオやWebを見ている限りは、既存技術の焼き直しと寄せ集めに見えて、あまり「汎用っぽさ」は伝わってきません。
そもそも、なにをもって「汎用」と呼ぶのか。ビデオの中では「プログラミングが必要ない」というようなことを仰っていましたが、それを言ったら既に主流であるCaffeやmxnet、CNTKだって設定ファイルだけで勝手に学習して使えるわけだから「汎用人工知能」だと言えます。そんな誇大広告は誰も望んでないので誰もその言葉を使っていないだけです。誰もいろんなものを留めることに使える輪ゴムを「汎用の輪ゴム」とは呼ばないのと同じように、機械学習はいろいろなことに適用できるのがむしろ当たり前だからです。
こうなると、むしろフレームワークのソースコードを公開してるGoogleやMicrosoft、Amazonといった企業がむしろ善良にさえ見えてきます。特にMicrosoftのAPIは完成度が高く、すぐに実用的に使えそうな勢いです。
ちなみに、今世の中にあるたいていの深層学習技術を集めてAPI化した「Algorithmia」というサイトが既にあります。
筆者からすれば、こちらのほうがよほど汎用性が高い深層学習APIに見えます。
ここでは、AIを開発した開発者はここでクラウドAPIマーケットプレイスに自分のAIを置くことができ、また、利用者はAPIを使用してここに公開された様々なAIやアルゴリズムを手軽に利用することが出来ます。
ビジネスとしてどこまでうまくいくかは未知数ですが、早速面白い試みが行われているなあという感想です。
おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)
登録はこちら新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。