スクリーンショット 2016-07-05 10.30.03

深層学習のビジネス活用の鍵を握る学習データ収集

The Deep neural networks AI of Dawn

2016.07.09

Updated by Ryo Shimizu on 7月 9, 2016, 20:08 pm JST

 昨年から急速に注目を集めた深層学習が研究開発の段階から徐々に実用的な領域で使えそうな雰囲気になってきました。

 6月に北九州市で開催された人工知能学会の全国大会での北野宏明氏(ソニーコンピュータサイエンス研究所所長)の講演「グランドチャレンジの彼方へ」で提言された内容、すなわち「人工知能を知的発見の道具として活用できない研究機関は競争力を失う」という言葉は、我々一般のビジネスを扱う層にも非常に大きな驚きとして受け止められました。

 深層学習に関して様々な試みが行われ、次々と革新的な発見が見つかる一方で、ではそうして得られる知見をどのようにビジネスとして展開していくかという視点が次に重要になります。

 そうでなければ深層学習は、結局、研究室の中で巻き起こったブームのひとつになってしまうからです。
 
 深層学習を実用的に用いるという研究は、すでに多くの企業で始まっています。
 筆者らが開発・販売している深層学習ワークステーション「DEEPstation DK-1」は既に20以上の企業と5以上の国立大学、10以上の私立大学、そして5つの国立研究機関で使用されています。

 我々がまず最初にオープンソースのフレームワークとしての「DEEPstation」を開発し、次に深層学習ワークステーションを販売した主な動機は、深層学習をビジネスに転用しようと志す人々がどのような発想で深層学習を活用しようとするか知るためでした。

スクリーンショット 2016-05-06 16.39.14

 こうした活動を通して、様々な企業の悩みや深層学習への期待を耳にする機会も増えました。
 弊社の主催する深層学習セミナーの受講生同士のディスカッションでも、思いもかけないようなアイデアが交換されます。
 それくらい、深層学習は新しい領域で、ひとつの組織に収まっていては到底、全てのアイデアを網羅することは不可能です。
 我々が目標としていたことは、深層学習以後の世界のパースペクティブを誰よりも早く得ることでした。

 そして様々な企業の持つビッグデータを分析した結果わかったことは、これまでに得られたビッグデータでは、実際的に有意義な結果を出すことはかなり限定的であるだろうということです。

 ビッグデータと呼ばれるデータは無数にあります。
 しかし、実際のビッグデータは、深層学習の分野からすると、かなり限定的なことしかわかりません。

 かつて、ビッグデータとは、秘匿された巨大なデータを指していました。たとえばアクセスログやソーシャルグラフといったものです。これは巨大なデータでなければほとんど意味がなく、従って成功した企業だけが得ることのできる宝石のようなものでした。

 今から10年ほど前、Web2.0華やかりし頃、優秀な研究者と学生はビッグデータという宝石に触れることを求めてソーシャルネットワーク企業やIT企業に入社していきました。

 それから10年が経ちましたが、ビッグデータを活用しようとしていた人々はどうなったのでしょうか。
 

 実際の所、ビッグデータと呼ばれていたものは、当然のことが当然のようにわかるだけということが大半で、ビッグデータのみによって何か特別な知見が得られたり、ビッグデータを活用することによって利益が上がったりすることはほとんどなく、仮に合ったとしても、非常に限定的な領域での応用にとどまっているということです。

 深層学習はこれまでの人間の想像力を超えた力を発揮する可能性があります。
 その時に重要なのはビッグデータを所有していることではなく、深層学習するための学習データセットを作り出すことができるノウハウを持っているということになるでしょう。 

 これまで機械学習のための学習用データセットは、公的な研究機関などが公益を目的として研究用に無償公開されているものと、有償で公開されているものなどがありますが、基本的に既に公開されているデータセットは、実用的な目的に供するというよりも、機械学習の精度そのものを高めたりその性質を研究したりするために用意されています。

 たとえば、昨年「人間を超えた」識別率を達成したと言われる一般物体認識は、ImageNetというインターネット上の画像を分類した2万種類の画像が合計1400万毎もあるもののうち、わずか1000種類の画像について130万毎程度の画像で学習させるテストです。

 実用的に使うためには1000というのは多すぎも少な過ぎもしないのでかなり中途半端です。たとえば文字認識ならカタカナひらがなであわせて100文字、アルファベットをと数字を足して162文字、常用漢字プラスアルファで計3000種類の画像の分類をすることになります。深層学習によって人間が特徴量を指定しなくて良くなったのは非常に歓迎すべきことではあるのですが、実用的な目的に使えるデータという意味ではまだまだ苦しいというのが実情です。

 こうなると、強いのは単なる「ビッグデータ」を持っていることではなくて、深層学習の利用シーンや目的にあわせたデータを収集できる環境にいることの方が遥かに強くなります。

 というのも、たとえば1000クラス分類のImageNetでは130万毎という途方も無い数の画像を学習するわけですが、実際には1クラスあたり1300枚ずつくらいの画像で済みます。

 この程度の数の画像なら、環境によってはすぐに手にはいります。

 たとえば監視カメラで万引き犯を検知するシステムを作るとしましょう。
 監視カメラに写る万引き犯や万引きの犯行現場は1秒あたり30枚ずつくらいと考えられます。ということは乱暴にいえば40秒くらいですぐに1300枚に行きます。
 ただし、枚数だけあればいいと言うものではありません。

 実際には万引きの手口の数だけ学習用データセットが必要になります。
 とはいえ、万引き犯の動きや挙動、ひょっとすると表情みたいなものも読み取れる可能性があります。

 万引き犯を見分けるAIを作るには、過去の膨大なPOSデータをビッグデータとして持っていることではなく、店舗の監視カメラの映像と、万引き犯の映像がタグ付けされた映像を大量に持っていることです。

 また、万引きは、ある場面だけを見ても万引きとわからないこともあるはずなので、時系列の映像を、たとえば画面を4分割して数フレームおきに並べるなどの工夫も有効です。

 ということは、深層学習の世界においては、実はビッグデータを既に持っていることはほとんど意味がなく、これから目的に応じたビッグデータを収集する立場にあるかどうかの方が重要なわけです。

 なぜなら深層学習を前提とした学習データセットというのは今ほとんど存在していません。

 「機械学習」を前提としたものは数多くありますが、「深層学習」を前提としたものはないのです。もちろん機械学習用のデータが流用できる(というか深層学習が機械学習のいち分野であるから当然なのですが)から敢えて研究者レベルでは深層学習のためのデータセットを作るモチベーションがないのですが、機械学習のためのデータというのは、画像認識でいえば深層学習が生まれるまでは60%前後でウロウロしていたようなデータです。要するに最初から難しいと分かっている分野のためのデータセットなわけです。まさかこれが2020年になる前に97%の正解率になるとは作った人も思っていなかったでしょう。

 MicrosoftやGoogleが提供する深層学習APIが、表情分析や場面の説明に終始しているのも似たような理由です。
 とりあえずすぐに用意できる汎用的なデータセットというのは、喜怒哀楽や場面の説明といった、既に用意されているデータセットの学習結果です。イマイチそれがあったところで実用的な利用法を思いつかないというのは、もともと実用的な活用を想定して作られたデータセットではないのである意味で当たり前なのです。

スクリーンショット 2016-07-09 20.01.52
 
 要するにこの先重要になっていくのは、深層学習を何のために使うのか、どのような効果を期待して使うのか、ということです。
 

 目的を先に想定してからデータセットを集めるという発想が必要で、「今手元にこんなビッグデータがあるから、こんなことができる」というのではあまりにも狭い範囲の結果しか導けないのです。

 ということは、むしろIT企業がこれまで苦手としてきた領域にこそ、チャンスがあります。
 接客業や大量の人間をさばくような仕事、作物や動物と接するような仕事、要は今「どうしても人間でなければできない」とみんなが思い込んでいる仕事こそ、深層学習が最大限に活用できる可能性があるというわけです。

 この点に関してはベストセラーとなった「人工知能は人間を超えるか ディープラーニングの先にあるもの (角川EPUB選書)」を上梓した東京大学の松尾豊准教授「深層学習では、IT企業よりもむしろ第一次、第二次産業のほうが大きく変化する可能性がある」と指摘されています。故に松尾准教授は「深層ニューラル・ネットワークは1万年前の農耕革命以来の革新」と主張されているわけです。

 ディープラーニングブームの勃発から一年が経過しました。
 この一年間はディープラーニングというものが何であるのか、その可能性がどこまであるのか、いろいろな人が検証する段階でした。

 そして次の一年間は、実際にどのように深層学習を現実のビジネスに適用していくか考えていくフェーズになるはずです。
 勘のいい会社は既に水面下で次の展開に移っているはずです。

 そしてGoogleやFacebookに文字通り蹂躙された21世紀のインターネット企業の勢力図をひっくり返す可能性があるとすれば、私は深層学習をいかに活用するか、日本人ならではの緻密さと粘り強さでその使いみちを「発明」することにしか勝機はないのではないかと考えているのです。

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら

清水 亮(しみず・りょう)

ユビキタスエンターテインメント代表取締役社長CEO。1976年新潟県長岡市うまれ。6歳の頃からプログラミングを始め、16歳で3DCGライブラリを開発、以後、リアルタイム3DCG技術者としてのキャリアを歩むが、21歳より米MicrosoftにてDirectXの仕事に携わった後、99年、ドワンゴで携帯電話事業を立上げる。'03年より独立し、現職。'05年独立行政法人IPAより天才プログラマーとして認定される。

RELATED TAG