20151214cheating-ec

知的情報処理の最前線:「カンニング検出」という問いかけ

2015.12.22

Updated by Masayuki Ohzeki on 12月 22, 2015, 09:00 am JST

今年のセンター試験前日.朝日新聞の朝刊である.

「人工知能でカンニングを発見 京大などがプログラム開発」

という見出しで僕の研究が世の中に報じられた.非常に光栄なことである.

それ以来、僕に会う人会う人、「カンニング見ましたよ」というよくよく考えると不思議な日本語を発する.カンニングをしたわけではない.検出するプログラムを作ったのだ.

仕組みは簡単である、古くより試験内容の点検のために、問題の難易度を調べるために、そして被験者がどれくらいの理解をしているのかを調べる数理的な手法として知られていた項目応答理論をベースとして利用した.どうもこの理論を眺めてみると、機械学習で利用されるボルツマン機械学習とそっくりな形、いやもっと単純な格好をしているのだ.ボルツマン機械学習では、各項目毎の間の関係にまで踏み込む.例えば問題間の難易度の関係、被験者間の類似傾向、すなわち「カンニング」である.

ボルツマン機械学習は、元々は磁性体つまり磁石の性質を調べるために利用されてきたイジング模型をベースとしている.磁石の中身は、スピンと呼ばれる細かい磁石のもとでできており、それらがきれいに揃うことで強い磁石となったり、バラバラになることで磁石としての性質を失う.この細かい磁石の動きを上下だけに制限して単純化したものをイジング模型と呼ぶ.この細かい磁石の間に、揃おうとする傾向があるものを強磁性体、いわゆる磁石である.逆向きに揃う傾向のあるものも存在するし、その傾向が弱いものなど、物質によって色々だ.上向きに全体の向きをそろえる操作をするために、他の磁石を持ってくることもできるし、それぞれ好きな方向に細かく操作することもできる.

でも磁石は磁石だ.

磁石なんかに興味ない.それがこれまでの自分の研究内容を話した相手の深層心理だろう.これは認めざるを得ない.しかしその磁石の研究を通して見いだされた知見は、多くの科学技術に貢献していることを伝えたい.実はそれが機械学習に使われているのだ!と言葉で主張してもそれだけでは伝わらない.もっと感覚的に訴える、分かりやすい例えはないのだろうか.

そうやって生まれたのがこの研究である.磁石のもととなるスピンの上下の向きを、答案の正解・不正解に例えた.その向きを決めるのは被験者の能力と問題の難易度の関係だけだ.能力が上回れば正解になりやすいし、下回れば不正解になるだろう.これがちょうど項目応答理論と対応している.しかし更に踏み込んで、その能力と難易度だけでは説明できない関係性があるとしたら…?例えば細かい磁石の間で同じ方向に揃おうとする傾向が、磁石の中と同じようにあったら?

それは「カンニング」だ.

磁石の研究をしていたら、カンニングの研究に行き着く.なんという驚きのつながりだろうか?しかしそのアナロジーだけでは面白くない.さらにこのカンニングを検出する手法を作り出せたらどうだろうか.前回話題にしたスパースモデリングの方法を導入することで、少ないと期待される、スパースなカンニングを検出する方法を考えた.

カンニングのたとえは分かりやすい.しかし今度はスパース性を利用した検出方法をいかに伝えやすいものにできるかが問題となった.

スパース性を利用しない手法では、機械は平等に扱うためか、カンニングの疑いが全員にかけられる、いわば性悪説に基づく推定を行う.微妙に嫌疑をかけられたかわいそうなペアがいくつも生じるという問題点があった.一方、スパース性を利用した解析手法は、性善説をとる.基本的にはカンニングはないものだとして、疑いの低いペアについてはいつまでたっても疑わず、他の疑いが残るペアについて解析を続ける.次第に疑いの低いものを無罪放免にしていきながら、どれだけデータをうまく説明したかの度合いを注視して、そのうまくデータとの整合が取れなくなってしまったときに残ったペアをカンニングしているものとして結果出力する.なるほど、確かに実際にテストの答案をみたときのカンニングのあぶり出し方に似ていて、人間味の有る方法だな、とちょっと面白い気配がするではないか.そんな説明ができるいい例になっているなと実感したことから、世の中に伝える研究内容として放出した次第である.

そんな説明を調子にのって続けていたら、とあるテレビ局からの取材で言われてしまった.

先生、カンニングはスパースではありません.

インドでは!

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら

大関 真之(おおぜき・まさゆき)

1982年東京生まれ。2008年東京工業大学大学院理工学研究科物性物理学専攻博士課程早期修了。東京工業大学産学官連携研究員、ローマ大学物理学科研究員、京都大学大学院情報学研究科システム科学専攻助教を経て2016年10月から東北大学大学院情報科学研究科応用情報科学専攻准教授。非常に複雑な多数の要素間の関係や集団としての性質を明らかにする統計力学と呼ばれる学問体系を切り口として、機械学習を始めとする現代のキーテクノロジーを独自の表現で理解して、広く社会に普及させることを目指している。大量の情報から本質的な部分を抽出する、または少数の情報から満足のいく精度で背後にある構造を明らかにすることができる「スパースモデリング」や、次世代コンピュータとして期待される量子コンピュータ、とりわけ「量子アニーリング」形式に関する研究活動を展開している。平成28年度文部科学大臣表彰若手科学者賞受賞。近著に「機械学習入門-ボルツマン機械学習から深層学習まで-」、「量子コンピュータが人工知能を加速する」(共著)がある。

RELATED TAG