20万円台の投資で深層学習(ディープラーニング)を手軽に始めるためのパーソナル・ディープラーニング・コンピュータ
The Personal Deep learning Computer
2015.11.18
Updated by Ryo Shimizu on November 18, 2015, 09:23 am JST
The Personal Deep learning Computer
2015.11.18
Updated by Ryo Shimizu on November 18, 2015, 09:23 am JST
毎日のように深層学習(ディープラーニング)の新技術が発表された今年の6月頃に比べると最近はだいぶ落ち着いてきたと思ったら、GoogleからTensorFlow、MicrosoftからはDistributed Machine Learning Tookit(DMLT)というやや煮え切らない名前のツールが相次いでリリースされました。さらにMicrosoftは、写真から人物の感情を分析するツール「Project Oxford Emotion Recognition」の提供も開始しています。
特にTensorFlowは最後発なのもあってGUIも含めた機能が充実していて中々のものになっています。
ただし、TensorFlowにしろDMLTにしろ、その他のツールにしろ、今のところは全て、プロの研究者のためのものという感じです。
もう少し敷居の低い、プログラミングのごくごく基礎的なところはできるけれども、人工知能や深層学習に関しては素人、という領域の人向けの技術というのはいまひとつ活発ではありません。ニーズは確実にあるはずなのに、です。
そこで本日よりパシフィコ横浜で開催される「IoT Technology 2015 総合技術展」で、深層学習(ディープラーニング)専用のパーソナルコンピュータ「DEEPstation DK-1(以下、DK-1)」を発表することになりました。
このDK-1は、筆者の所属する株式会社UEIと、秋葉原のパソコンショップであり、PCメーカーとしても活躍されているサードウェーブデジノス社さんが共同開発したもので、ディープラーニング入門者が手軽に買える価格帯でありながら、長時間の学習にも耐える強力な電源(よく壊れます)と効率を重視したエアフローによる排熱設計を行った学習用マシンです。
最もコンパクトなモデルは非常に小さいので机の上に置いたりオフィスの隅に置いたりすることができて邪魔になりません。
ハイエンドモデルではTITAN Xを4枚SLIした高機能版も用意されています。この手のマシンは電源の選択をしくじると命取りになるので、予めパーツ同士の相性やエアフローを確かめて動作保証のあるマシンを買う方が結果的にはお買い得です。
付属ソフトDEEPstationは、国産のディープラーニングフレームワーク「Chainer」を使用したWebベースのGUI(グラフィカル・ユーザー・インターフェース)環境であり、これを活用することで初心者でも手軽にディープラーニングを始めることが出来ます。
NvidiaもDigitsという、カリフォルニア大学バークレー校が中心となって開発したCaffeを使用したWebベースのGUI環境を提供していますが、ローカル環境から操作しなければならないことがあまりにも多いため、シェルを使えないと実際には使うことが出来ないというものでした。
シェルまで降りることができる人は限られますし、基本的に画像分類問題の場合、画像の学習用データセットさえ用意できれば、プログラム抜きでも試せるようにするべきだと思います。学習用データセットを準備すること自体はそれほど難しくないですし、今のところ、いくら深層学習が注目されているからといって、「本当にどこまで画像を認識できるのか」「どんな学習データを与えたらより面白い認識結果を得ることができるか」ということに関しては、まだ手探りなわけです。
そこで我々は国内で急速に注目されてきたChainerをベースとして、完全にWebブラウザーだけで使用できる深層学習環境としてDEEPstationを設計しました。
一般物体認識でよく使われる、カテゴリごとにフォルダ分けされたzipファイルをWebブラウザからアップロードするだけで、自動的に展開されてデータセットが完成します。
このデータセットを作るところがNVIDIA-Digitsではわかりづらく、UNIX上のパスを直接指定しなければならないのでWeb環境だけで完結しなかったのが問題でした。
DEEPstationならば、ローカルのパスを一切意識することなくWebサービスを使うのと同じ感覚で深層学習をスタートできます。
また、一度アップロードした学習用データセットにカテゴリや画像を追加したり、個別に削除したりといった処理も全てGUIベースで可能なため、「あ、うっかりあのカテゴリをさっきのzipファイルに入れ損なった」という場合でも安心してあとから追加することができます。
さらに、Caffeでは非常に難解なprototxtを書かなければならないので、ニューラルネットワークのチューニングが専門家以外には極めてわかりにくいという問題がありました。
国産フレームワークであるChainerは、ニューラルネットワークを書きやすいことで有名です。
DEEPstationでは、Chainerのソースコードレベルでニューラルネットワークをチューニングすることができます。
研究ではなく実用的に深層学習を活用するためには、お仕着せのニューラルネットワークに学習させるだけでは不十分で、目的に応じて中間層を増やしたり、省略したりといった調整が不可欠になります。
DEEPstationはWebベースのUIのため、社内の複数のユーザが一台のマシンを共有することが可能です。
実際、弊社、UEIでは一台100万円程度のそこそこ高価なマシンを購入したら、それを社内で共有するということをやっています。
学習そのものにも膨大な計算時間がかかりますが、何もしていない時間があるともったいないので、空いたメモリーとCUDAコアを使って並行して別のことも学習させることができます。
つまり一台買っておいておけば、社内の色んな人が同時に使えるというのが特徴と言えます。
特に一般物体認識の分類器は面白いので、色々な使い方が考えられると思います。
また、DEEPstationそのものはPythonで書かれたオープンソース・ソフトウェアなので自分で使いやすいようにカスタマイズすることも可能です(来年1月中旬以降にGithubで公開予定)。
DEEPstationを使うと、全くの素人でも、たとえプログラミング経験がゼロの人であっても、学習データセットを作って(これはWindowsでフォルダに画像ファイルを放り込むだけです)、zipで圧縮して、アップロードして数クリックするだけでニューラルネットワークが深層学習を始めます。
出来上がったニューラルネットワークの性能も、Web上で「この画像ファイルをどう分類するか」という「Inspection」機能によって確かめることができます。
たとえば弊社では、為替の過去40年間の値動きを画像としてグラフ化し、あるグラフの動きの5日後に為替が2%以上変動している場所を認識できるようデータセットを作り、97%という正確さで的中させることに成功しています。
もちろんこれで即座に株の運用ができるというわけではありませんが、人間のテクニカル分析のプロが読み解くような勝負勘や知見を人工知能が学び取ることができるようになるかもしれません。
このグラフにも当然工夫がしてあって、それぞれの色が別々の株価と為替のグラフになっています。
ある時点での値動きは別の株や為替の値動きと連動しているという仮説をもとにしたものです。
こういうグラフを大量に用意するのはデータさえ手元にあればそれほど難しくありません。
あとはどういうネットワークをチューニングすれば求める結果が得られるのかトライ&エラーを繰り返すだけです。
DEEPstationはまだバージョン1ですが、今後も発展させていく予定です。
おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)
登録はこちら新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。