スクリーンショット 2015-07-22 7.34.15

人工知能はサイドキックの夢を見るか?

Do AIs Dream of Sidekick?

2015.07.22

Updated by Ryo Shimizu on 7月 22, 2015, 10:41 am JST

ナイトライダーというアメリカのドラマがあります。

1980年代のドラマで、主人公、マイケル・ナイトが人工知能を搭載したスーパーカー「ナイト2000」とともに数々の難事件を解決する一話完結のドラマです。

ナイト2000ことK.I.T.T.(Knight Industry Two Thousand)は、人間と音声で会話し、自動走行する人工知能を搭載するだけでなく射出式座席や車をジャンプさせるターボブースト、オイルを撒いて後続車を滑らせるオイルスリック、などなどの特殊機能を装備している。

さらに2008年に続編が制作され、日本では「ナイトライダーNEXT」というタイトルで2012年にフジテレビで日本語吹き替え版も放映されました。

Huluでこのナイトライダーの続編「ナイトライダーNEXT」が公開されていたので懐かしい気分になって久しぶりにこの作品を見てみると、現代の第三次AIブームを生きるためのヒントが隠されている気がして見入ってしまいました。

劇中、ナイト3000(ことK.I.T.T.;Knight Industry Three Thousand)は西部劇を見て人間関係や友情について学ぶというシーンが出てきます。

任務の途中で友人を亡くし、失意の主人公マイケルとK.I.T.T.はこんな会話を交わします。

「また西部劇か」

「魅力的な物語です。笑いあり、サスペンスあり、そして英雄的です」

「面白そうだ」

「沈んだ顔ですね。マイケル」

「彼は友達だった」

「友情の複雑さは学習中ですが、あなたの友になれれば光栄です」

「あらゆるカウボーイには愛馬(サイドキック)が必要だ」

「ご心配なく。あなたは馬以上の存在ですよ」

サイドキックという言葉は、あまり日本語では聞きなれません。

直訳すれば、相棒、親友とでも呼べばいいでしょうか。

等身大のヒーローが多く登場する欧米では、ヒーローには必ず相棒というか補佐役となる副主人公が登場します。それがサイドキックです。

日本の仮面ライダーは、基本的に単独で行動するヒーローでした。

欧米の場合、サイドキックが重要な役割を果たします。

ナイトライダーという作品の場合、明らかにK.I.T.T.はマイケルのサイドキックです。

時にはマイケルのピンチを救い、また時にはマイケルがK.I.T.T.のピンチを救う、そういう共生関係によって数々の荒事をこなしていくわけです。

さて、経営者のサイドキックといえば秘書です。

パーソナルアシスタントとしての秘書の機能を機械化するときに、例えば現状存在するソリューションであるSiriやCortanaのようなAIは、機能として不十分であることを以前にも述べました。
例えばSiriも、車の運転中など手が離せない時に「Hey Siri」と音声で呼びかけ、「明日の12時に会議の予定を入れてください」と話しかけると、「はい。会議を明日に設定します。スケジュールに登録してよろしいですか?」と応対し、「はい」と答えるとスケジューラに登録されます。

Siriが便利なのは、料理の時などに「6分後にアラーム」と指示するとアラームを自動的に設定してくれたり、「明日七時に起こして」と指示するとやはりアラームを設定してくれたりする機能です。メールなども頼めますが音声認識の精度や入力速度を考えるとあんまり効率的とは言えません。

ただ、これはやはり片方向からの入出力(マスターユーザとAIの入出力)だけを支援してるに過ぎず、本当に秘書機能として果たして欲しい、反対方向からの入出力(AIとマスターユーザ以外との入出力)は果たしてくれません。

しかし現実の人間の秘書は、例えば凄まじくややこしくながいメールを「月刊○○から取材依頼が来ております。来週は予定が立てこんでおりますがお引き受けしますか?」と要約しつつボスの予定状況を含めた最低限の情報を提示し、最終的に「Yes/No」の回答だけで済むように簡略化するのに対し、現状のAIアシスタントはここまで高度なことはできません。

しかしAIがサイドキックとなるためには、外界とのやりとりのインターフェースになることは必須とも言えます。

たとえばSiriは、知らないことを聞かれるとすぐにWebで検索します。
しかしこのWeb検索というのは、ユーザからしたら「ハズレ」です。もっと高度なことを期待しているのに、自分でもできることをされてしまっては興ざめではないですか。

たとえば人間の秘書に、「○○商事について調べておいて」と頼む場合、「○○商事のURLはこちらです」というメールが返ってきては困ります。

「○○商事は老舗の衣料品専門商社で、過去五期の業績は増収増益。売上高600億円、営業利益55億円、従業員5000人超の優良企業です」

「経営者は?」

「社長の山田一郎は85年入社の48歳。東大法学部卒でハーバード大学への留学経験あり。同社内での評価も高く、45歳で社長を引き継ぎ、現在三期目です。趣味はゴルフで、なかなかの腕前のようです」

「どうしてそんなことがわかった?」

「2013年に雑誌プレジデントのインタビューを受けています。こちらがその記事のコピーです」

短時間にここまで調べられると、かなり優秀な秘書です。
しかしこの程度の要約なら、人工知能になぜできないのでしょうか。

実のところ、現在のAIはまだまだ自然言語(人間が普通に話したり書いたりするのに使う言葉)の意味を正確に解釈したり、文脈を読み取ったりということは苦手です。

この分野は自然言語処理という専門領域で、まだまだ専門的な内容を手短に要約するというのは難しいのです。もちろんいろいろな手法が気の遠くなるような回数に渡って試みられていますが、自然言語は意味を取り違えるとまるで逆の意味になってしまう場合もあるため、クリティカルな業務には不向きです。

たとえば英語では凄く太った人を「スリム」と呼んでからかったり、凄く煩く騒ぐ人に「静かにしてくれてありがとう」と皮肉を言ったりする場面が日常的にあります。文脈を正しく掴めば、それが皮肉だと解るのですが、それはAIにはまだまだ難しい分野だと言えます。

ですから日本語以上に、意味が真逆に取られる可能性があるのです。

日本語の自然言語処理が難しいのは、品詞がスペースで区切られていないからです。
言葉のどの部分で区切るのが正しいのか、機械的には判断が難しいのです。

たとえば風の谷のナウシカという映画がありますが、このように続けて書くとどこが品詞の区切りなのか人間でもわかりにくくなります。

先の文を「たとえば風(ふう)」の「谷のナウシカ」などと解釈する人はいないと思いますが、「風の谷のナウシカ」という映画の題名を知らなければ誤読する可能性は高いでしょう。

こうした問題を解決するために品詞の関係を導き出す仕組みを形態素解析と呼びますが、英語にも日本語にも形態素解析エンジンというものが提供されています。

有名なのはオープンソース・ソフトウェアのMeCabなどですが、商用でもいくつか提供されています。

しかし形態素解析までならともかく、文章を自動的に要約する、いわゆる自動要約という分野になるととたんに難しくなります。

この分野はかつてはDocument Understanding(文章理解)と呼ばれていましたが、最近はText Analysis(文書解析)と呼ばれるのが一般的なようです。

人間の秘書とAIの秘書のギャップの最大の部分は、この文書解析に掛かっています。
理想を言えば、文章を完全に理解できる人工知能が生まれれば、それを要約したり、また逆に意図的に嘘を混ぜたりすることもできるはずです。

しかし残念ながら、今のところ文章を完全に理解できる人工知能は生まれていません。

Siriは文章を理解しているように見えますが、実は特定の文法に反応しているだけです。

Watsonはそれに比べると文章をより正確に理解していると言えますが、あくまでクイズの問題文だけです。

この辺りはDeep Learningが登場したことによって世界中で多くの研究者がディープラーニングと文書理解(文書解析)を組み合わせて本当の意味で文書が理解できるAIが作れないか模索している段階です。

たとえばトーマス・ミコロフのWord2Vec(https://code.google.com/p/word2vec/)という手法では、単語レベルで意味を理解させ、「king-man+woman」を入力すると「queen」という出力を得ることができます。

自然言語が論理的な関係を表現するのに不向きなのに対し、数式のような人工言語は論理的な関係が明確化されているため、コンピュータが処理しやすいようです。

ただ、残念ながら目下のところメールの内容を要約してYes/Noのレベルまで希釈するのはAIにはとてもむずかしい仕事であると言えます。

個人的には、社外に対しては使いにくいものの、社内に対してはコンピュータの自然言語処理に期待するのではなく、むしろ自然言語処理はそれが得意な人間にまかせてしまって、人間側で要約した内容のメールを書く仕組みを整備したほうが効率的なのではないかと思います。

というかその段階ではもはやメールとは呼ばれないのかもしれませんが。
例えば以下の様な感じです。

 

スクリーンショット 2015-07-22 10.29.31

このように、人間側が予めメールの論理構造を明確化しておけば、コンピュータに高度な知能がなくても内容を要約してある程度の優先度を判断しつつボスに報告することができます。

人間に対しては不躾のようですが、社内で上役に対してのみ使うなら、もしかしたら利便性が高いかもしれません。

どちらにせよ、少し不便な仕組みになってしまいそうですが、本来はこのくらい明確化されていたほうが、メールを出す側の人間(この場合は部下にあたる人々)も上役に気を使っていろいろ言葉を選ぶよりも便利なのではないでしょうか。

と言ってる傍から作りたくなってきてしまいました。
しかしこんな細かいものを自分で作っているといくら時間があっても足りません。
休暇を利用して作るか、新人に練習課題として投げるかしかなさそうです。
プログラマー経営者というのもなかなか難しいものです。

ところでこの連載の読者の皆様ならもしかしたらご興味を持たれるかもしれない本が明後日発売になります。

プログラマーの思考様式を一般のビジネスマンが活用するにはどうすればいいか、ということを解説した本です。

題して「最速の仕事術はプログラマーが知っている」です。

Kindle版、書籍版ともに24日からとなっております。
もしご興味があればぜひ書店でお手にとっていただければと思います。

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら

清水 亮(しみず・りょう)

ユビキタスエンターテインメント代表取締役社長CEO。1976年新潟県長岡市うまれ。6歳の頃からプログラミングを始め、16歳で3DCGライブラリを開発、以後、リアルタイム3DCG技術者としてのキャリアを歩むが、21歳より米MicrosoftにてDirectXの仕事に携わった後、99年、ドワンゴで携帯電話事業を立上げる。'03年より独立し、現職。'05年独立行政法人IPAより天才プログラマーとして認定される。

RELATED TAG