スクリーンショット 2015-05-29 8.57.19

AI秘書 vs 人間秘書 またはヒューマンエージェントの憂鬱

Ms. Strangelove or: How I Learned to Stop Worrying and Love the Artificial Intelligence

2015.05.29

Updated by Ryo Shimizu on 5月 29, 2015, 10:02 am JST

ヒューマンエージェントインタラクション(HAI)という研究分野があります。

これは専門の学会もあるほどに人気のある分野です。

ヒューマンエージェントとは、人間、または擬人化されたインターフェースを指し、人間とコンピュータの間を仲立ちする存在となります。

 

大半の読者の皆さんにとって最も馴染み深いHAIは、iOSに搭載されているSiriでしょうか。

NTTドコモ製の携帯電話に搭載されている「ひつじの執事」もHAIの一種です。

 

iOSに搭載されたSiriはまるで人格があるかのように振る舞います。

「明日の天気は?」などのごく普通の質問に答えるのはもちろん、「妖怪ウォッチ」などの時事ネタにも反応します。

もちろんこれは裏側に運営スタッフが居て、こういうネタをせっせと仕込んでいるわけですが、特に作りこみが激しいのが恋愛に関する機能です。

 

Siriに「愛してる」と語りかけると、「またまた、ほかのApple製品にもそう言ってるんじゃないですか」と返されます。

 

上手い返し方です。

スクリーンショット 2015-05-29 9.05.41

「寂しい」と語りかけると、「私でよかったら、いつでも話しかけてくださいね」と慰めてくれます。

 

Siriに搭載されたさまざまなジョークやユーモアは、しかし残念ながら"彼女"が自分自身で考えたものではなく、あくまでも仕組まれたものです。

 

こうしたデジタルアシスタントというコンセプトの起源をどこに求めるか、というとなかなか難しいですが、古くはテレビ映画「スター・トレック」の宇宙戦艦エンタープライズ号に搭載されたコンピュータ、「スター・ウォーズ」のアストロメックドロイドのR2-D2、通訳ロボットのC3-POあたりかもしれません。

 

宇宙戦艦エンタープライズ号のコンピュータには固有の名前がなく、登場人物は単に「コンピュータ、自爆装置をセットしてくれ」などと語りかけます。

 

実はこの程度の音声認識は22世紀を待つことなく、かなり初期のAI(人工知能)研究の途上で実現しました。

 

ところが問題は、音声を認識することではなく、言葉(人間が自然に話す言語を情報科学では自然言語と呼びます)の意味を認識することでした。

 

自爆装置のような目的が明らかなものはともかくとして、コンピュータに語りかけた時に、コンピュータはどのように情報を調べ、返すのか、という部分が最大の課題でした。

 

Siriは、音声認識そのものというよりも、そのバックエンドとしてインターネットを活用した膨大な知識の検索が可能になったことで初めて実現できたと言えます。

 

MicrosoftはWindows10にSiriと同様の機能としてCortana(コルタナ)というヒューマンエージェントを導入する予定です。

 

CortanaはSiriよりさらに進んで、ユーザーが見ているWebページを分析し、ユーザーが好むと思われるWebサイトを自動的に推薦する機能まで搭載する予定です。

 

しかし、CortanaにしろSiriにしろ、あまり長期的に使うイメージがなかなか湧きません。

 

なぜだろう?と考えると、やはり煩わしさが目立つ気がするのです。

映画「スター・ウォーズ」において、R2-D2やC-3POなどのドロイドは頼もしい味方です。

しかし同時に愛着が沸きすぎて時には足手まといにもなったりします。

 

特に戦闘中はC-3POはほとんどものの役に立ちません。

というかそもそもC-3POが役に立つ場面というのはほとんど登場しません。

 

映画の中でのC-3POの役回りはいわば狂言回しですから、実際のところC-3POのような翻訳ドロイドは作られることはないでしょう。劇中でもしばしば「うるさい」と電源を来られてしまいます。

 

もしSiriがC-3POのように語りかけてきたら・・・うるさいですね、やっぱり。

 

この手のヒューマンエージェントを秘書(アシスタント)としてハッキリ定義した最初のコンセプトは、ジョン・スカリーが1987年に制作したコンセプトビデオ「ナレッジナビゲーター(Knowledge Navigator)」でしょう。

ナレッジナビゲーターは、当時AppleのCEOだったジョン・スカリーが「未来のApple製品はこうなる」と予言して作らせたコンセプトです。

詳しいことはビデオを見て頂くとして、下の画面の左上にいる人物が、「ナレッジナビゲーター」本人です。

スクリーンショット 2015-05-29 9.17.25

いわばSiriのご先祖様とでも言うべき存在といえるでしょう。

このビデオの中では、大学教授がナレッジナビゲーターと会話しながら仕事をする様子が描かれています。

また、SkypeやFacetimeのようなテレビ電話の機能も実現されています。

 

時は流れ、21世紀。

我々は現代のナレッジナビゲーターであるSiriとどのように接しているでしょうか。

とてもこのビデオのようには行きません。

それどころかSiriの存在すら、普段は忘れてしまっています。

 

先日、ジョギングしている最中にSiriがたびたび誤作動することがあって、とてもイライラしました。求めてない時にトンチンカンなことを言い出すからです。

 

 

 

このナレッジナビゲーターのコンセプトは、その後ズバリ「パーソナル・デジタル・アシスタント」と名付けられ、PDAという言葉が生まれました。

しかしいつのまにかPDAはデジタル・アシスタントというよりは、デジタル・ダイアリーでありデジタル・カレンダーである以上の機能を持たなくなりました。

 

このコンセプトビデオのナレッジナビゲーターとほぼ同じような会話をするAIを作ろうと思えば、今の技術で出来ないこともないと思います。

しかし、それが本当に求められているかというと非常に疑問です。

 

そもそも、人はなぜ会話をするのでしょうか。

人と人との会話には大きなロスがあります。

人間同士ですら、常に完璧に意思疎通ができるわけではありません。

また、この手のコンセプトにはそもそも秘書(アシスタント)という存在に対する理解が欠けていると私は思います。

 

私は仕事柄、秘書、またはアシスタントと20年以上一緒に働いていますし、また他の人の秘書とも接することがあります。

 

実際は秘書に求められる機能は、それを使う人(上司)によって驚くほど違います。

ある人は完璧なスケジュール管理を求め、ある人は自分のサイドキック(相棒)として意見を具申する役割を求め、ある人は自分の分身として多忙な自分自身が行けない場所に代理人として派遣するような機能を求めます。

 

経営者や政治家の秘書の場合、場合によっては後継者候補となることもあるでしょう。

 

「ひつじの執事」はコンシェルジュがコンセプトだったはずですが、執事(バトラー)とコンシェルジュは役割が大きく異なります。

 

一般にイメージされる執事とは、家内使用人の最高位であり、他の家内使用人を統べと一族の財産を運用する、いわば番頭的な役割の人物です。

 

そんな大事なことをAIに任せることはまだ出来ません。

一方、コンシェルジュは、あくまでも相談係としてホテルなどに設置された役職です。

 

「近くに美味しいお店はない?」などと聞くと教えてくれたり、「あの劇が見に行きたいんだけど」とお願いするとチケットを手配してくれたりするのがコンシェルジュです。

 

クレジットカード会社でも一部の会員はコンシェルジュサービスを受けることができます。

 

コンシェルジュサービスを最初は面白がって使ってみるのですが、すぐに飽きてしまいます。

というのも、大半のコンシェルジュサービスは、Google検索以下の情報しか持っていないからです。

 

それでもコンシェルジュがSiriなどのHAIよりもマシなのは、予約までとってくれるところです。

 

今のSiriにしろ羊にしろ、提案はしてくれるものの、実際の行動は自分が起こさなければなりません。

 

でも大半の秘書の役割というのは、ボスと接するよりはボス以外と接するためのインターフェースなのです。

スクリーンショット 2015-05-29 9.37.51

忙しい上司の代わりに電話を受けたり、アポイントの調整を行ったりするのが重要な役割です。

ところが現状のヒューマンエージェント(HAI)はそのようなことはできません。

スクリーンショット 2015-05-29 9.38.36

むしろ逆にユーザがHAIにお伺いを立てて、実際の予約やアポ調整は自分でしなければならないのです。

これは秘書とは呼べません。

そして秘書は時にはボスに頼まれて買い物に行ったり、煩雑な行政手続きを代行したり、車を運転したりします。

そのどれも、Siriにはできません。

 

人間は秘書を持つと自分の時間を節約できます。

だから秘書という仕事が必要なのです。
しかし今のところ、HAIを使っても時間を浪費するだけで節約することはできません。

だからいまひとつSiriのようなHAIは作られたとしても利用されるシーンが数少ないのではないかと思います。

 

最近、筆者は新技術が受け入れられるかを評価するひとつの尺度として、「ヒューマンエンハンスメント(能力拡張)」という視点を導入しています。

ある新技術や新機能が出た時、「それはヒューマンエンハンスメントだろうか」という観点からその技術の有用性を測るのです。

 

ヒューマンエンハンスメントであるかどうか、というのは微妙です。

技術的には全く同じものであっても、ヒューマンエンハンスメントであるかどうかは変化します。

たとえば最も原始的なヒューマンエンハンスメントである「武器」について考えてみましょう。

棍棒の発見は、原初の人間にとって非常に重要なものでした。

スクリーンショット 2015-05-29 9.44.05

棍棒を持つことによって、素手で殴りあうのに比べ、より長いリーチと棍棒自身の質量による打撃力の向上が期待できます。

これは人間の持つ打撃能力を直接拡張するので、ヒューマンエンハンスメント技術と呼ぶことができます。

では反対に、自分が打撃を与えるのではなく、より強い存在、たとえばライオンやゴリラを連れてくるというのはどうでしょうか。

スクリーンショット 2015-05-29 9.50.38

これがヒューマンエンハンスメントになるためにはいくつかの前提条件が必要です。

たとえば、使役関係はどこまで強固かということです。

猛獣は扱い方を間違えれば、外敵だけでなく自分にも歯向かってくる可能性があります。

その可能性がある限り、完全なヒューマンエンハンスメント(能力拡張)とは言い切れません。

むしろ猛獣を従わせる力を持つ人、たとえばサーカスの猛獣使いなどは、拡張された能力を持つ人間と言えます。

 

猛獣そのものはヒューマンエンハンスメントにはなりませんが、猛獣の扱いを覚えることはヒューマンエンハンスメントになりえます。

例えば、猛獣使いのムチです。

ムチは実質的には武器ですが、猛獣を従わせるのに使うことが出来ます。

万が一猛獣が歯向かってきても、ムチで対抗することができます。

つまりムチはヒューマンエンハンスメントですが猛獣はヒューマンエンハンスメントではない、ということです。

 

翻って考えると、現状のSiriやこれから搭乗するCortanaは、ムチよりは猛獣に近い存在と言えます。

というのも、扱いに苦労するからです。

身体能力の直接的な拡張ではなく、"彼女"が聞き取りやすいように発音に配慮する必要がありますし、それを活用するにはより多くの想像力を必要とします。

 

仮にSiriが有料アプリだとしたら、これほど多くの人が使おうとしたでしょうか。

 

おそらくSiriが提供する機能に比べて、大変の人がそれに見合う対価を設定するのはほとんど不可能に近いのではないかと思います。

もしかするとそれがウェアラブルで多少は変わってきているのかもしれませんが、現状でそれがとても役に立つのだ、という場面をあまり見たことがありません。

 

Siriはあくまでも「おまけ機能」だから意味があるのです。

とりあえず今のところは。

 

SiriのようなHAIが実際の人間の秘書の機能をオーバーテイクするためには、まずボス(ユーザー)ではなくて、ユーザー以外の存在と会話できるようにならなければなりません。

むしろSiriは高度な留守番電話になるべきです。

ボスが忙しい時に変わりに電話をうけて要件を聞くようにするだけで、コミュニケーションはだいぶ楽になると思います。

また、お店に予約の電話をかけたり、助けを呼んだりということができるべきです。

技術的にはそんなことも実現可能なのですが、まだそこまで踏み込む覚悟ができてないのかもしれません。

 

電子秘書ではありませんがHAIの観点から非常に面白いのが数年前のマッシュアップアワードで受賞した1Click飲みです。

 

これは、ユーザからのインタラクションは「人数」のみです。

ですからコレを見てHAIだと思う人は少ないかもしれません。

しかし実際には、これはヒューマンエージェントとしてユーザにではなくお店の方に電話を掛けます。

本来、ヒューマンエージェントとの会話は不愉快なものですが、お店としてはお金を払ってもらえる可能性があるので敢えて音声に従うモチベーションが生まれます。

これは非常に良い例だと思うのですが、HAI分野ではもっとこの手の応用法を模索していくべきではないかと思うのです。

これはHAIはHAIでもきちんとヒューマンエンハンスメントになっています。

本来なら自分でお店を探しまわらなければならなかったところを、コンピュータ(HAI)がかわりにお店を見つけてくれるからです。

 

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら

清水 亮(しみず・りょう)

1976年新潟県長岡市うまれ。6歳の頃からプログラミングを始め、16歳で3DCGライブラリを開発、以後、リアルタイム3DCG技術者としてのキャリアを歩むが、21歳より米MicrosoftにてDirectXの仕事に携わった後、99年、ドワンゴで携帯電話事業を立上げる。'03年より独立し、現職。'05年独立行政法人IPAより天才プログラマーとして認定される。

RELATED NEWS