ホログラフィー イメージ

HoloLens ✕ AI で実現する知能サイボーグ的未来

Hello J.A.R.V.I.S.

2017.01.25

Updated by Ryo Shimizu on 1月 25, 2017, 07:38 am JST

 MicrosoftのHoloLensがついに日本でも発売され、大きな話題を呼んでいます。

 筆者は毎日HoloLensを持ち歩き、あちこちで色んな人にHoloLensを体験してもらっています。

スクリーンショット 2017-01-25 6.34.56

 いろいろな人や初対面の人にHoloLensを体験してもらうことは、単なる買い物自慢の減価償却にとどまらない意味があります。

 まずHoloLensを自分が使ってみせ、次に連れ合いにやらせて見せ、興味を持ったお店の人にやらせて見せて、同じお店に居合わせたほかのお客さんにもやってもらったりします。

 いろいろな人に体験してもらって、それから「これは30万円するんですよ」と伝えると皆一様に「エッ」と驚きます。

 そのあと「買おうかな」とつぶやく人と「それは高い」という人に別れます。

 それも当然で、実際、筆者は誰か知り合いにHoloLensを買うべきか聞かれたら、相手によって明確に返事を分けます。

 基本的には、作り手側に居る人に対してはYES、見る側に居る人に対してはNOです。

 ただし、今の段階のHoloLensは、アメリカだけで発売されたときのiPhoneに似ています。
 できることがなにもないということです。

 HoloStudioとか、いろいろ頑張ってるものはあるのですが、いかんせん操作が大変なので、横で教えるのも一苦労です。

 なにせ本人以外には画面が見えてないので、その人の視界に何が映っているのか想像しながら横から指示をだすのです。これはなかなか高度な作業です。

 また、AirTapというジェスチャーを多用するのですが、慣れるまでこれがなかなかうまくいきません。
 その上、AirTapがうまくいったかどうかというのは本人にしかわからないので二重に大変なわけです。

 こういう状況を解消するために、とりあえずおまけでClickerというツールも同梱されてきます。
 これはBluetoothでHoloLensと接続され、機械的なスイッチでクリックできるツールです。

 けれども根本的に、画面の真ん中にあるカーソルを動かしてなにか小さいものをポイントしてクリックするという動作そのものがおそろしく筋肉に負担がかかる気がします。

 HoloLensのキーボード入力は一言で言えば地獄です。
 最初のセットアップ時のMicrosoftアカウントの入力で文字通り何度も挫折しそうになりました。大文字小文字と数字が交じる複雑なパスワードを(Microsoftアカウントは常に複雑なパスワードを求めます)、首の動きだけで入力しなければならないのです。

 このあたりがMicrosoftという会社のもっとも悪いところと言えるでしょう。
 

 Windowsと名のつくものには杓子定規になんでもかんでも同じアカウント管理を提供しなければならないというある種の強迫観念に囚われているのです。そもそもシングルユーザーを想定したデバイスでアカウントの入力が本当に必要なんでしょうか。せめてストアを使う時にログインが必要、というくらいで十分ではないかと思います。

 実際問題として、一度起動に成功してしまうと、次からはパスワード入力なしで(たぶんHoloLensの開発者もそんなことは望んでなかったからでしょうが)、ログインできてしまいます。

 しかし考え方によってはこっちのほうがよっぽど危険です。
 Windowsと名のつくものが、ユーザー認証なしで、まがりなりにも特定ユーザのふりができるわけです。

 まあそれはMicrosoftという会社の問題にすぎないので、ここでは深追いしません。

 閑話休題。
 HoloLensを体験した筆者の一番の変化は、ユーザーインターフェースというものに関する認識です。

 HoloLensの提供するプレゼンテーション、すなわち現実空間に張り付いたかのようなAR/MR的演出というのは、圧倒的なインパクトがあります。

スクリーンショット 2017-01-25 6.52.14

 オフィスが一瞬にしてサイバー世界と接続されます。

 残念ながら今のバージョンでは複数のHoloLensが空間を共有した時にうまく動くのか不明です。動かないような気がしています。
 けれどもそれはソフトウェアの改善によってなんとかすることができます。

 HoloLens、作り手か受け手か、ということもそうですが、さらに、作り手の側でも反応が2つに別れて、Aグループの場合、「よくわからないが凄いしこれで何か作りたい」という反応になるのですが、Bグループの場合は「凄いけど、これに何の意味があるの?」と聞いてくることが多かったのです。

 とてもおもしろい違いだなあと思いました。
 

 筆者の感覚にしてみれば、今までに出来なかった全く新しいことができる道具がそこにあって、しかもそれは自分たちにしか使えなくて、そこでなにか作れば簡単に世界の最先端に立てるチャンスがあるものに強く興味を惹かれます。アメリカで発売されたばかりのiPhoneのようなものです。スマートフォンになにか意味があるかどうかは関係なく、それまでできなかったこと(この場合はマルチタッチ)ができる機械の上で、それにどんな意味があるのか考えることこそが面白いと思うのです。

 ところがBグループはその「意味」を考えることにはあまり興味を惹かれないようです。誰かがその「意味」を考えていて、とりあえず答えがあるなら手っ取り早くそれを知りたい、というような反応でした。

 そして、作り手の女性のほぼ100%はBグループに属する反応を見せました。もしかすると男女の知能の感じ方や捉え方の差がでているのかもしれません。筆者の周囲にいる女性は新しいものに関してはやや保守的な反応を示す傾向があるようです。

 つくり手でない人たちは、男女ともに、素直にHoloLensを面白がりました。けれども、つくり手ではないので、買おうとはしませんし、筆者も買うことはお薦めしません。いまのところ、これでなにかを作り出したいという人のためのオモチャです。

 しかし筆者は同時にHoloLensとAIを組み合わせることで、これまで想像もできなかったようなことができるのではないかという新しい期待を感じています。

 HoloLensの凄いところは、実はユーザーの視点から見たカメラを内蔵しているところです。
 さらにカメラの情報と別にかなり正確なデプス(深度)情報も取れるようです。

 ということは、HoloLensを装着した状態で、カメラ情報とデプス情報をサーバーに送り、サーバー側でディープニューラルネットワーク(DNN)を動かしてそのユーザーが見ているものをリアルタイムに分析し、さらにはそのユーザに対して「今そこにあるそれは○○である」という情報を視覚的・空間的に提示することができます。

 ナビゲーションも劇的に改善される可能性があります。
 いまのところHoloLensは室内使用を前提としているのですが、たとえば室内に限定したとしても、図書館などで「○○についての本はどの棚にあるかな」という質問に対して立体的なナビゲーションを提供できます。

 人間が無意識のうちに見ているものをAIが読み取り、映像をAIが解析し、立体的な視覚情報として現実世界にオーバーラップする形でユーザに対して情報掲示することが可能なのです。これは視覚野が無意識のうちに拡張されているのとほとんど同じことです。

 たとえば工場などで小刻みに震えている機械の振動その他の情報をDNNが解析してグラフにして表示したり、異常検知や作業支援には大いに役立つと思います。

 このサイズのままではあんまり実用的とは言えませんが、対面した相手の心理状況を推定するAIを使えば、営業マンや経営者にとっては非常に強力なツールとなるはずです。

 人は、けっこう、相手の表情を読み取ることが苦手です。
 そのときにAIが「相手の緊張度は50%、幸福度は20%」のような情報をさりげなく伝えてくれたり、「さっき興味を持っていた話題は家族のこと」などのようにアシストしてくれたりするとコミュニケーションがもっとスムーズになります。

 ナンパの達人は、歩いている女性の服装を見るだけでナンパできそうかできないか判別できるそうです。
 そんなことは相当な手練でもない限り無理なのですが、もしHoloLensとAIの組み合わせでそれが解決できるならば、チャンスを逃して女性の顰蹙を買ってしまう男性がおおいに減ることになります。

 世の中の悩みの多くの部分を占めるのは男女関係のことである、と言ったら言いすぎかもしれませんが、「どうもうまく相手をデートに誘えない」「たとえデートに誘ってもその先に進めない」という悩みはあちこちが聞きます。まあ商談でもいいんですけど、実際に商談をしてる人なんてそうそう多くありませんから、やはり男女関係の話のほうが身近でしょう。

 女性をデートに誘うのは、とても難しいことです。
 若かりし頃のある日、筆者がとある飲み会に参加しているとむかしから知っていた女性が酔った勢いで絡んできたことがあります。

 「なんで私をデートに誘ってくれないの?」

 筆者はそんなことを考えたこともなかったので、ビックリしてグラスを落としそうになったことを覚えています。
 その他にも、女性と雑談していると、「気になる人がいるんだけど、デートに誘ってもらえない」という嘆きが意外に多いです。

 「自分から誘えばいいじゃない」と言うと、「そんなこと自分からは言えない」と返ってきます。女性は男性に誘われるのを待っているものだということをその時初めて知りました。

 一方、男性はと言うと、「デートに誘いたいんだけど切り出し方がわからない」とか、「デートはできたんだけど、手をつなぐことが出来ない」とか、まあ率直にいってヘナチョコな人が多いわけです。

 こりゃ日本は少子化するわけです。要するに世界的に言われているように、日本人は感情をあまり表情に出さず、それを読み取るのが極端に難しいのではないかと思います。

 表情を読み取るのが難しいので、ある意味でかなり鈍感な人しかグイグイ女性に迫ることが出来ず、鈍感な人は鈍感であるがゆえに最終的には女性に嫌われてしまう、というパターンが少なくないのではないかと思うのです。

 しかし、仮に「デート支援AI」があって、軽量化したHoloLensがあれば、相手の表情や声から相手の感情を読み取って「ここで手を繋ぐ!」とか「キスする」とかの指示が出され、男性が勇気をもってそれに従うと、もしかすると少子化傾向に歯止めが掛かるかもしれません。

 また、逆に女性からしてみれば、「へんな男に騙される」ということが減っていくのではないかと思います。
 女性用デート支援AIは、「チャラそうだけど実は真面目な男」と、「真面目そうだけど実はチャラい男」を見分けてくれます。もちろん、「本当に真面目な男」も見分けることが出来るかもしれません。おそらくある程度は相手の年収も推定できるようになるでしょう。男性用AIは、デート相手が浪費家かどうかわかると助かるかもしれません。

 要点をまとめると、こうです。

 HoloLensはヘッドマウントカメラと3Dスキャンを組み合わせるとかなり高度なことができるということを証明してくれました。
 その代わりと言ってはナンですが、まだまだ実用的に使うには課題の多い機械です。だからソフトウェアを作るつもりがない人たちが買うことはお薦めしません。

 HoloLensの将来は、Google Glassのように軽く、小さく、スタイリッシュになることが期待されます。
 まあMicrosoftがやらなくても、中国メーカーが本気出してどんどん軽くて小さい類似品が出て来るかもしれません。

 ですが、HoloLens的世界観の行き着く先は、AIと人間との融合です。
 卑近な例としてデート支援AIを出しましたが、人間が目で見てある程度判断できることならAIの支援は強力なものになる可能性があります。数式を見るだけで解いてしまうとか、野球を見るだけでボールの球速や球種がわかるとか。これはやや反則な気もしますけどサッカー選手が装着すると、ボールの軌跡やチームメイト、敵プレイヤーの動きがAIによって予測されたものが表示されるとか。

 囲碁や将棋であっても、AIの支援で「ここに打ったほうがいいんじゃないの?」という感じのことや、「ここに打とうと思ってるけど、そうなると勝率はどう変わる?」といったことがハイブリッドされるとチェスのように或いはAIに勝てる可能性も出てきます。これはぜひとも実験してみたいところです。

 同じ時代に成長する異なるテクノロジーはどこかで爆発的融合が起きる、というのはよく知られた法則のひとつです。たとえば半導体とコンピュータ、インターネットと携帯電話、などです。今は明らかにAIとVR(AR)が急成長しているので、この2つはいつか融合して半導体コンピュータ(マイコン/今のコンピュータ)や、スマートフォン(インターネット+携帯電話)に次ぐイノベーションとして結実するでしょう。

 それが一体何なのか、どのようなものになるのか、想像するだけで筆者はワクワクしてしまいます。

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら

清水 亮(しみず・りょう)

ユビキタスエンターテインメント代表取締役社長CEO。1976年新潟県長岡市うまれ。6歳の頃からプログラミングを始め、16歳で3DCGライブラリを開発、以後、リアルタイム3DCG技術者としてのキャリアを歩むが、21歳より米MicrosoftにてDirectXの仕事に携わった後、99年、ドワンゴで携帯電話事業を立上げる。'03年より独立し、現職。'05年独立行政法人IPAより天才プログラマーとして認定される。

RELATED TAG