original image: © yonibunga - Fotolia.com
知的情報処理の最前線:初恋を忘れない人工知能?
AI loves First love?
2016.05.31
Updated by Masayuki Ohzeki on May 31, 2016, 07:00 am JST
original image: © yonibunga - Fotolia.com
AI loves First love?
2016.05.31
Updated by Masayuki Ohzeki on May 31, 2016, 07:00 am JST
機械学習技術を駆使して、データから世の中のことを学び、周囲の環境の変化に対応しながら自律した行動を決定することで、人工知能の一つの形が実現可能である。
データは現実に起こった事柄、経験である。データが多いほど、すなわち経験を積めば積むほど世の中のことを知り、うまく世の中に適応していくというのだから、人工知能の成長する様は人間に非常に近いように感じられる。
ビッグデータ時代と呼ばれて久しいが、大量のデータを取得することが比較的容易となり、そのデータを用いて、学習の糧とすることで、機械学習技術は飛躍的にその精度を引き上げてきた。
途中その学習に必要な計算技術には幾つかの工夫があり、計算機の性能の向上もそのブレークスルーに大いに貢献している。
今日は、その大量のデータの学習のさせ方についてのちょっと面白い話。
* * *
皆さんの初恋はいつですか?
初めて付き合った恋人はどんな人ですか?
全く覚えていないということはないだろう。きっとその人の人格形成に、人生の大きな経験として、多大に影響していることは間違いない。
その後、何人か気になる人とお付き合いを重ねて、自分というものを知り、他人というものを知り、そしてその後の人生について予想を立てる。最適な戦略として家族を設けるとか、独身を謳歌するとか仕事に没頭するとか趣味に目覚めるとか、判断を下すようになる。これも立派な人生経験であり、お勉強である。
実は機械学習においても、初恋があり恋を重ねている。
* * *
「大量のデータを考慮して、そのデータからはじき出される最適な戦略を探してきなさい」
これが前時代的な機械学習の方策であった。
とかくデータはその時はあまり多くはなかった。せっかく取得したデータを利用して、最適な戦略をなんとかしてはじきだそうと大規模な計算をしていた。
取得したデータ全てを一括して考慮する方法をバッチ学習と呼ぶ。一見、正しそうな方策である。
しかしながら自分の人生経験で考えてもらいたい。
データが「自分がアクセス可能なパートナー候補」だったとしよう。「それら全てを考慮して自分の人生に最高の利益をもたらす最良の人付き合いの仕方をしなさい」と言われたらどうだろうか。
「とてもじゃないが人生の間にすべてのパートナー候補を相手にするわけにはいかない」と思うだろう。
ということからわかるように、これは、実はとても時間がかかる方法である。実際、バッチ学習をさせると様々なデータを考慮するため、これを考慮するとあれがうまく反映されず、あれを考慮するとこれがうまくいかないという状況に多く遭遇して効率的な学習を行うことが難しくなる。
それに大量のデータを一気に計算機に読み込ませると、メモリがいくらあっても足りないという現実的な問題もある。デートの約束は1日に数えられる程度じゃないと無理だ。いや1度きりにしよう。
このバッチ学習に対して、オンライン学習と呼ばれる方式がある。データを取得するたびに、そのデータに基づいて学習を進めるのだ。それまでに経験したデータの効果は自分自身に残っているので、新しいデータが来るたび、それに合わせて自分をちょっとずつ変化させるというわけだ。
極めて現実的な学習方法であると感じることだろう。
使用するメモリも少なくて済むし、とりあえず新しいデータに向き合うだけだから、あっちのいうことを聞いてこっちの言うことが聞けないということはない。とにかく一人と一途に付き合うというわけだ。そして次から次へと新しいデータと向き合う…、あれ?浮気者っぽい?
こうすることで大量のデータを学ぶことがストレスなく可能となる。
現代の機械学習ではほとんどの場合、オンライン学習が実行されている。
新しいデータから学ぶことは多くあるかもしれないが、これまでの経験に基づく自分をすべからく変える必要はない。どれだけ新しいデータからの影響を受けるかという程度を徐々に弱めていくという戦略をとることが多い。
学習初期のデータを重要視しているのだから、「初恋」を大事にしている、というわけだ。
すでにたくさんのデータを取得している場合でも、どのデータを扱うかランダムに決め、その選ばれたデータと向き合い、次も再びランダムに選ばれたデータと向き合うということを繰り返す。
こうした方法を採用しているのが、「確率勾配法」と呼ばれるこの数年で中心的技術として見直された古くて新しい方法である。
一通りすべてのデータと向き合ったらまたランダムに順番を変えて今までの自分とデータの関係を振り返る。
まるでお見合いパーティーである。
* * *
こうして機械は様々なデータと向き合うことで世の中を知るのだ。
人間が人生の中で最適な戦略を選ぶために、学習を行う様子と何が違うのだろう。
機械を知ること、人工知能を知ることは、すなわち人間を知ることになっていることに気づくと、途端に人工知能に馴染みが出てくるのではないだろうか。
誰か恋の手ほどきをしてやってみてはどうだろうか。
新しい機械学習の方法論が眠っているかもしれない。
それとも人工知能に聞いてみようか。
明日のデートは誰としたら良い?って。
おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)
登録はこちら1982年東京生まれ。2008年東京工業大学大学院理工学研究科物性物理学専攻博士課程早期修了。東京工業大学産学官連携研究員、ローマ大学物理学科研究員、京都大学大学院情報学研究科システム科学専攻助教を経て2016年10月から東北大学大学院情報科学研究科応用情報科学専攻准教授。非常に複雑な多数の要素間の関係や集団としての性質を明らかにする統計力学と呼ばれる学問体系を切り口として、機械学習を始めとする現代のキーテクノロジーを独自の表現で理解して、広く社会に普及させることを目指している。大量の情報から本質的な部分を抽出する、または少数の情報から満足のいく精度で背後にある構造を明らかにすることができる「スパースモデリング」や、次世代コンピュータとして期待される量子コンピュータ、とりわけ「量子アニーリング」形式に関する研究活動を展開している。平成28年度文部科学大臣表彰若手科学者賞受賞。近著に「機械学習入門-ボルツマン機械学習から深層学習まで-」、「量子コンピュータが人工知能を加速する」(共著)がある。