WirelessWire News Technology to implement the future

by Category

イスラエル 眼鏡 空 イメージ

オーカムマイアイ開発者、ヨナタン・ウェクスラー博士に聞く

2020.06.23

Updated by Hitoshi Arai on June 23, 2020, 13:24 pm JST

オーカムテクノロジーズ(OrCam Technologies)」というイスラエルの企業名を聞いたことがあるだろうか?

2010年にアムノン・シャシュア(Amnon Shashua)教授とジブ・アビラム(Ziv Aviram)氏により設立された企業で、視覚障害のある方々の日常生活を助けるためのデバイス「オーカムマイアイ(OrCam MyEye)」を開発した(写真1)。

▼写真1
オーカムマイアイ開発者、ヨナタン・ウェクスラー博士に聞く

メガネに付けられるこの小型のデバイスは、指差した箇所の文字を読み上げたり、服の色や目の前の人の名前を教えてくれる。

オーカムの創業者2名の名前は、どこかで聞いたことがある人が多いはずだ。彼らは、自動車の衝突回避システムを開発、提供する「モービルアイ(Mobileye)」の共同創業者でもある。1999年に創業されたモービルアイは、独自のアルゴリズムによる衝突回避システムを開発し、世界中の自動車メーカーに採用されている。その名前を最も有名にしたのは、2017年にインテルにより153億ドル(1.7兆円)という驚くべき金額で買収されたことであろう。この巨額の買収は、数々のスタートアップがサクセスストーリーを作っているイスラエルでも、記録的な数字となった。

今回、ご縁があって、オーカムテクノロジーズの創業期から参画しオーカムマイアイの開発を主導してきたシニア・バイス・プレジデント兼研究開発責任者ヨナタン・ウェクスラー博士(Dr Yonatan Wexler 写真2)にZoom取材をする機会を得た。

▼写真2
オーカムマイアイ開発者、ヨナタン・ウェクスラー博士に聞く

オーカムマイアイという製品については、既に日本語Webサイトもあり、YouTubeビデオを見ればその機能や優れた点については一目瞭然なので、その裏にある開発者の思想を聞いた。


Q:博士は、マイクロソフトでも先端的な研究開発に携わっていたと思うのですが、何がきっかけでオーカムテクノロジーズに移ったのですか?

ウェクスラー博士:マイクロソフトに入る前は、私は学生としてヘブライ大学でアムノン・シャシュア教授の下で学び、コンピュータビジョンの研究をしていました。人間の視覚について興味があったのです。人間が何かを見てそれについて何かをいうのは、一体どういうことなのか。例えば、複数の人を見てその違いに言及するとか、農家が空を見て「今日は良い日になるだろう」と呟いたりするのをどのように説明できるのか、とても難しい問題なんです。そんな人間の認知能力について興味を持っていました。

アメリカのメリーランド大学へPhD取得のために移った後も、教授とはコンタクトを維持していました。教授は私のPhDのアドバイザーだったのです。数年後、教授からオーカムテクノロジーズを創業するという連絡があり、そのプロジェクトがとても興味深かったので参画することを決めました。

Q:その時、シャシュア教授は既にモービルアイを成功させていたと思うのですが、そちらへ入ることは考えなかったのですか?

ウェクスラー博士:オーカムテクノロジーズに入ることしか考えませんでした(笑)。私は車よりも人間の認知機能の方に興味がありました。こちらの方がよりエキサイティングだと思っていたのです。

Q:博士がオーカムテクノロジーズに入った時、既にオーカムマイアイの計画はある程度具体化していたのですか?

ウェクスラー博士:いや、会社のスタート時点から参画し、計画をスクラッチから作りました。コンピュータビジョンが人の役に立つ場所を見付けたかったのです。最初のターゲットを視覚障害を持った人に定め、彼らのためにできることを考えました。人間は誰もが「完璧」ではありません、どこかに課題を抱えています。それを助けることができるのは何なのか、いろいろあると思いますが、我々は「感覚入力(sensory input)」に焦点を定めました。

視覚に障害があると、まず困るのは文字が読めないということです。本が読めなければ退屈だし、脳は知識を求めているのに、勉強して知識を得ることも難しくなります。勉強することが難しいということは、その人の人生の進む方向が変わってくることを意味します。そこで、人々が学ぶことを助けようと考えました。何かを学ぶためには、まず自立する必要があります。そして、周りにいる人を認識しなくてはなりません。この人からであれば多くを学べそうだ、ということを判断できる必要があるのです。そのためには、人とのお付き合い(socialize)ができなくてはなりません。これはとても重要なことです。周囲を見て人を認識する「機能」が大切なのです。

Q:オーカムマイアイの技術的なことも質問させてください。このデバイスは、インターネットの接続があってもなくても動作するのですね?

ウェクスラー博士:私達は、早い段階でデバイスの基本機能にはインターネット接続を必要としない、と決めました。それには4つの理由があります。
まず、デバイスの「信頼性」をとても重視したことです。視覚が不自由な人に使ってもらうためには、突然使えなくなるということがあってはなりません。インターネット接続を必要とする場合、場所によっては繋がりにくくなることもあります。「常に動作するという信頼」を得られなければ使ってもらえないでしょう。

二番目の理由はプライバシーです。もしデバイスを使って何かの情報を誰かに送る時、それがハッキングされる可能性があれば、やはりそのデバイスを使おうとは思わないでしょう。例えば、守秘情報が含まれる資料を読む時、インターネット接続が不要であれば、あなただけがデバイスの助けを得て資料を読み、それが終われば何も残りません。我々が顧客(ユーザー)のプライバシーを尊重することで、顧客は安心してテクノロジーに頼ってくれるでしょう。

インターネット接続がない三番目の利点は、瞬時の反応が得られる、ということです。使ってもらえればわかりますが、反応がすごく速いのです。もし、操作して思った結果が得られなければ別の操作を試す、そういう使い方は即座にデバイスが反応するからできることであり、このインタラクティブ性があるからこそ、誰でもすぐに使い方に慣れることができます。

筆者注)
博士は画面の向こうで、実際にオーカムマイアイ2を使ってデモをしてくれた。博士がウエブサイトを開いて、それを指で指すとオーカムマイアイ2がテキストを読み上げた。とても自然である。画面の中に彼の顔写真があったようで、それを認識して名前を読み上げたのは、博士自身にも想定外のデモであった。利用者からのレポートもたくさん来ているようで、資料を自分で読むよりオーカムマイアイ2が読むのを「聞く」ことで読書に要する時間が1/3になり、考える時間が増えた、という学生のコメントもあった。

ウェクスラー博士:四番目の利点は、被爆(radiation)が少ない、ということです。健康への影響が懸念された携帯電話端末からの電磁波被爆の問題はご存知でしょう? インターネット接続の必要がないデバイスであるということは、その懸念もないわけです。

このように、安心して使えるプラットフォームなので、視覚障害のある方々にとって人生を変えうるもの(Life Changer)なのです。このような理由から、私達はデバイス単体で多くの機能を実現し、それらが信頼性を持って動作する、ことに力を注ぎました。

Q:このような機能やメリットをデバイスだけで実現するためには、大変パワフルなエンジンが必要だと思います。オーカムテクノロジーズは、そのチップ設計からすべて自ら行ったのですか?

ウェクスラー博士:似たようなプラットフォームは世の中には存在しません。光学部品も含めてすべての部品を自分で設計する必要がありました。しかし、私達の最大のアドバンテージは、私達にはAIのエキスパートが揃っていることです。どうすれば消費電力も最小にして必要な処理結果が得られるかが、分かっていました。バッテリーもアップルウオッチのバッテリーと同じサイズで大変小さいものです。

エッジ処理ではなくクラウドコンピューティングに依存すると、視覚障害者がコネクティビティを失うことで立ち往生する危険があります。例えば、他の視覚障害者向けシステムでは、位置情報の信号(ビーコン)を出し、スマホがそれを受けて位置情報メッセージを音声で伝えるものがあります。しかし、その信号情報が最新かどうか、誰も判断できません。オーカムマイアイは、今そこにある情報を読み上げるので、そういう問題に直面することはないのです。信頼性の高いサービスを提供するためには、エッジで処理することは大変重要です。もちろん、高度な問題を解決するためにはエキスパートが必要であり、クラウドのニーズもありますが、日常の課題についてはそうではないのです。

Q:オーカムテクノロジーズジャパンのWebサイトでは、バッテリーの能力は2時間と書いてありましたが、ちょっと短くないでしょうか?

ウェクスラー博士:それは、連続使用した場合のワーストケースです。例えば、文字の認識・読み上げを絶え間なく繰り返すような操作をすれば、バッテリーは2時間程度でなくなります。しかし、通常の利用であれば1日中利用できます。多くの顧客は夜に充電して、日中利用しています。

Q:最後に、博士はこのデバイスを通してどのような将来を見ていますか?

ウェクスラー博士:私達は、目の不自由な方々のために、このデバイスの様々な改良を考えています。その一つは、よりパワフルな日本語エンジンの開発です。日本語は、とても難しい言語ですが、より多くのテキストを読めるようにし、例えば縦書きにも横書きにも対応できるようにします。このエンジンは、すぐにリリースされるでしょう。それ以外にも、より複雑な機能を実現する計画です。「表を読み上げる」などがその一つです。

別の例としては、すべてのテキストを読み上げるのではなく、必要な箇所だけを認識して読み上げるような機能です。例えば、電話料金の請求書などは、合計の請求金額だけが知りたいのであり、それ以外の細かい箇所は不要です。そういった場合、「Find Total」と声に出せばデバイスが合計金額だけ見つけてくれれば良いのです。我々が新聞を読むときも、見出しだけざっと読み、興味があるところは記事をじっくり読むでしょう。そういった人間の自然な動作に合わせた日常での使い方ができるようにしたいと考えています。

また、新しいデバイスも開発しています。このデバイスは、音を聞いて人の口の動きも併せてモニターすることで、聞きたい人が話している音だけをフィルタすることが可能です。人間は、周囲の雑音の中から聞きたい人の声を増幅して聞いています。それと同じことができるのです。


30分程度の取材であったが、大変示唆に富む話しを聞くことができた。実は、取材の最中に筆者のPCが突然リスタートしてしまい、Zoomが中断してしまった。慌てて再接続して取材を再開・継続したのだが、まさにオンラインのリスクを実感させられた。エッジだけではなく、クラウドと組み合わせることでもっとパワフルな機能が実現できるのではないか、と考えていたのだが、そんな単純な話ではないことを具体的に理解することができた。仮に、視覚障害の方がインターネットを利用するデバイスを使って位置や環境を認識しているとすれば、突然コネクティビティを失い何の反応も得られなくなれば、大変危険な状況に置かれることになるのだ。

博士は、2カ月前に日本に来る計画があったそうだが、COVID-19のためにキャンセルされてしまったという。是非、近い将来に来日していただきたい。多くの日本人がリモートワークを経験し「オンラインでできること、オンサイトでなくてはできないこと」を理解しつつある。博士の専門である「認知機能」の観点からも、博士が異文化を「その場で体験」することで得られることはたくさんあるはずだ。ヨナタン・ウェクスラー博士のような「イスラエルの才能」が、日本という異文化の社会に触れ、その刺激からさらに新しい研究開発を展開していくことを大いに期待したい。

イスラエルイノベーション イスラエルイノベーション特集の狙い

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら

新井 均(あらい・ひとし)

NTT武蔵野電気通信研究所にて液晶デバイス関連の研究開発業務に従事後、外資系メーカー、新規参入通信事業者のマネジメントを歴任し、2007年ネクシム・コミュニケーションズ株式会社代表取締役に就任。2014年にネクシムの株式譲渡後、海外(主にイスラエル)企業の日本市場進出を支援するコンサル業務を開始。MITスローンスクール卒業。日本イスラエル親善協会ビジネス交流委員。E-mail: hitoshi.arai@alum.mit.edu