20151208markov-ec

知的情報処理の最前線:人生そのもの「マルコフ連鎖モンテカルロ法」

2015.12.08

Updated by Masayuki Ohzeki on 12月 8, 2015, 09:00 am JST

人生は一度きり.

あんなことをしてみたい、こんなことも経験したい.しかし人生は一度きり.

色々試しては失敗して、成功の秘訣を探りたい.しかしその試す回数は、自分の人生においては限られている.代わりに多くの人の経験を聞いては、自分に吸収して行動基準に加える.現実の社会では、このような打開策を取ることが一般的だろう.

コンピュータ上でのシミュレーションではどうだろうか.

高速な計算処理能力のもと、様々な可能性について試すことを繰り返して最適な条件を探すことで「最適化問題」に解決を与えたり、あらゆる可能性を列挙して情報を収集する「サンプリング」をすることもできる.

あらゆる可能性を列挙するときに、ただでたらめにやるのではなく、少しだけ条件を変えつつ探索する方法を「マルコフ連鎖モンテカルロ法」と呼ばれる方法では採用している.森の中で遭難をしたとき、当てずっぽうに道を変えて進むのではなく、少しだけ向きを変えて抜け道を探るのだ.もしも怪しかったら前のところに引き返す.光が見えたならその進み方を信じると言った具合だ.こちらの方法は筋がよく、多くの情報処理の現場で利用されている.

つい先日、MIT(マサチューセッツ工科大学)からマルコフ連鎖モンテカルロ法の高速なアルゴリズムが発表された.今もなお改良が続けられるほどの必須技術となっている証だ.

現実社会から得られたあらゆるデータを説明するために、機械学習と呼ばれる手法が取り上げられる場面が多くなった.この技術においてもマルコフ連鎖モンテカルロ法は基本技術として利用されている.データが多くあれば、そのデータから読み取れる素性はより正確にはっきりと知る事ができる.例えば、10人の投票動向を聞いただけでは、結局どの政党や候補者が当選するかははっきりとは分からないという統計の原理と同様、10人の投票活動から社会的雰囲気を調べることは難しいことと想像できるだろう.

マルコフ連鎖モンテカルロ法を利用した機械学習では、そのデータを出発点として、仮説として採用した適当なルールで考えられる可能性をごく短時間だけ調べてみる.そこで得られたサンプリング結果がデータと矛盾していないかどうか調べるのだ.ぴったりあてはまることはないものの似た傾向があるのかどうか調べる.矛盾がひどければルールが間違っているということがわかり、ルールを変えてはデータのもつ性質に適合しているかどうかを調べる.こうすることでデータがもつルールを探り当てる事で、データの裏側に潜む素性を調べるのだ.例えば前回話題にした深層学習の基本であるボルツマン機械学習に利用される.深層学習で使われる隠れ変数有りボルツマン機械は、このマルコフ連鎖モンテカルロ法が利用しやすい工夫がされており、効率の良い学習方法が確立した.

しかし当然のことながら、あらゆる可能性を探索するためには高速な計算技術、高性能のコンピュータが必要であることは想像がつくだろう.

今回はソフトウェア的なアルゴリズムの工夫について紹介しよう.

マルコフ連鎖モンテカルロ法が、なるほど人生のようだなと思ったならしめたもの、より高速に様々な可能性をさぐるためには他の人の教訓を活かすというのが考えられる.異なる人生を歩んだ人と自分をいっそのこと交換することができたら、効率よく世の中のことを知ることができるのではないだろうか.実際このような方法論が存在する.「レプリカ交換モンテカルロ法」と呼ばれる方法がそれである.

最適な戦略を採用しようとして、二の足を踏む人がいる.そんなひとにはとにかく前に進めと言いたくなるだろう.スタンダードなマルコフ連鎖モンテカルロ法では、ちょっと試しては立ち戻るということを繰り返す.いっそのこと戻ることは許さず、一度決めたら前にどんどん進めという方法も存在する.「詳細釣り合いの破れ」と呼ばれる.この詳細釣り合いというキーワードは、マルコフ連鎖モンテカルロ法の教科書には必ず書いてある.ある意味"常識"とされるものである.しかしその常識を破ることで、高速なアルゴリズムが現在になって数多く登場している.常識の壁に超えて、新しい息吹をもたらすブレークスルーを求めるひとには、何とも嬉しい事実である.現代の基盤技術である機械学習にも利用されるメジャーな方法においてでさえも、まだまだ常識の壁があり、越えることで初めて見える地平がある.

まだまだきっと新しい手法が開発されるに違いない.そのときは新しい人生訓に対応していることだろう.逆に新しい手法を見いだすために、全く素人の、しかし経験豊富な諸先輩方の意見が役に立つかもしれない.

「急がば回れ」とか?

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら

大関 真之(おおぜき・まさゆき)

1982年東京生まれ。2008年東京工業大学大学院理工学研究科物性物理学専攻博士課程早期修了。東京工業大学産学官連携研究員、ローマ大学物理学科研究員、京都大学大学院情報学研究科システム科学専攻助教を経て2016年10月から東北大学大学院情報科学研究科応用情報科学専攻准教授。非常に複雑な多数の要素間の関係や集団としての性質を明らかにする統計力学と呼ばれる学問体系を切り口として、機械学習を始めとする現代のキーテクノロジーを独自の表現で理解して、広く社会に普及させることを目指している。大量の情報から本質的な部分を抽出する、または少数の情報から満足のいく精度で背後にある構造を明らかにすることができる「スパースモデリング」や、次世代コンピュータとして期待される量子コンピュータ、とりわけ「量子アニーリング」形式に関する研究活動を展開している。平成28年度文部科学大臣表彰若手科学者賞受賞。近著に「機械学習入門-ボルツマン機械学習から深層学習まで-」、「量子コンピュータが人工知能を加速する」(共著)がある。

RELATED NEWS

RELATED TAG