WirelessWire News The Technology and Ecosystem of the IoT.

by Category

脳 トレーニング イメージ

深層学習と筋トレ

2018.06.19

Updated by Ryo Shimizu on 6月 19, 2018, 17:38 pm JST

さて、一年前からパーソナルトレーナーをつけて筋トレに励んでいる。週に一回程度だが、筋トレはやればやるほど筋肉がついていくので面白い。

年を取ると週末やることがなくなるものだが、筋トレを趣味にしていると効率的に時間を消費できて、なおかつ反対に頭の中で内省する癖もついて一石二鳥である。

一年前、自重20kgのバーベルをベンチプレスで持ち上げるのもやっとだったのだが、先日、ついに50kgのベンチプレスに成功した。

トレーナーの先生によれば、ベンチプレスの重さを上げていくだけであれば簡単なのだという。それだけをやるのならばもっと早く習得できた。けれども、目的は重いものを持つことではなく筋力を上げることなので、筋肉だけが育ってもだめなのだと。筋肉の成長に比べて靭帯の成長というのはそれほど早くない。

したがって、筋肉が成長できたとしても、かなりの時間「待つ」ことが必要になるのだという。なるほどなあ、と思った。

先日、製造業の方々が集まる勉強会で人工知能と製造業について語って欲しいと依頼され、講演することになった。とはいえ、製造業は自動化の最前線であり、わざわざ僕がなにかを言わなくても、検品から梱包まで、自動化ができるところはすでにされているのが当たり前だ。

通り一遍の質問の中に、この商売をしているとつきものといった質問をされた。

「しかし深層学習というのは、なぜその結論に至ったかということが明かされない、いわばブラックボックスであるということが非常に不安であると我々は思うのです。積み上げ型の技術には、そうしたブレがない。論理的に正しいことを説明できるのです。それについて、あなたの立場からはどう思われますか?」

なるほど、よく聞く議論である。論理的に正しいかどうかを確かめたいというのは、技術者の常であると思う。もっと広く、科学に関わる人全ての本能といっても差し支えないかもしれない。

そこで私は常々、誤解を恐れずに「深層学習とは、要は直感の獲得である」と説明することがある。これは本職の人工知能の研究者の先生が聞くとだいたい激怒するような内容であるが、私はアカデミズムの世界で生きているわけではないので宗教論争に巻き込まれる筋合いはない。

それに、猫を見て猫だと判断する能力を「直感」以外のどんな二字熟語で呼べるのか。「認識」もまた直感であり、「認知」もまた直感的能力と言える。アルファ碁が強いのは直感力を身に付けたからだ、と言ったほうがわかりが早い。

かならず失敗する実験というのがある。

例えば、あなたが犬も猫も知らない人に対して、「犬と猫の見分け方」を論理的に説明しなければならないシチュエーションを考えてみて欲しい。鼻が黒くて耳が上の方に飛び出てて、目が二つ前向きについていて、髭があって、ふさふさした毛がある動物。

さて、これは犬にも猫にも両方あてはまる。実のところ、写真を見てそれが犬か猫か当てる研究というのは何十年も試みられてきた。しかし決定的な解決策が見つからないまま時間が過ぎていったのである。

犬と猫を論理的に見分ける方法がないため、機械学習が試された。そしてそれは実際に上手くいった。

犬か猫か見分けるためには、膨大な学習が必要である。その技術の発展していったものが、今日、深層学習と呼ばれるものなのだ。

つまり深層学習とは、根本的に説明不可能なものなのである。

普通の女子と女装した男子を見分けるのもこれと同じくらい難しい。化粧して女装した男子を男子と見破れなくても、知能が低いことにはならないだろう。

けれども、勘の鋭い人は見抜く。骨格や喉仏など、細かい変化に気づく人は気づく。

欧米では、相手がゲイかどうかを見分ける能力を「ゲイダー(gayder)」と呼ぶらしい。ただし、ゲイダーを持っている人は根本的にゲイの素質があるとも言われている。これもまた直感力と言えるだろう。

今の深層学習では(おそらく十分な学習データがないため)、ゲイダーのような才能を持つことは難しい。

後にチューリングテストと呼ばれることになったアラン・チューリングの「イミテーション・ゲーム」は、テレタイプ端末による筆談だけから、相手が本物の女性か女性のフリをした男性かを見分けるというものだった。要は、ネカマ(ネットオカマ)を見破るテストだ。

でも実際にネカマをやってみるとわかるが、ネカマを演じ続けるのはかなり難しい。設定の作り込みと女性に対する洞察、そして女性らしさのエミュレーションを自分の中にもっていないとならない。

とはいえ、チューリングは英国人で英語を話す。英語の文章から女性らしさを見抜くのは、日本語のそれよりもはるかに難しいはずだ。

例えば、「Yes, I think so」という言葉だけから女性か男性かを見分けるのは難しい。日本語なら「そうだね、僕もそう思うよ」とか「そうね、私もそう思うわ」で男性らしさ、女性らしさを出すことができる。一人称で性別がある程度類推できるというのは日本語の利点でもある。

最近知り合ったとある女性から来るラインの一人称は「僕」で始まる。でも面白いことに、「僕」で始まっていても、女性のように感じられる。それは「僕」以外の言葉が女性らしいからだ。

なぜそう感じるのか。それはもう、直感としか言いようがない。もちろん先入観もある。でもそれ以上に、「感覚」の獲得というのが大きいのだ。

さて、製造業の人々が工場に深層学習されたAIを入れる場合、その動作が論理的に説明できず感覚的にかわからないということをどう説明するか。

私はそのとき思いついた答えをけっこう気に入った。

「そもそも工場におけるすべての作業が論理的に説明できると考えていること自体が誤りなのではないでしょうか」

なぜ工場が完全に無人化できないのか。コストバランスの問題もあったとしても、そもそも"いまこの工場は問題なく動いている"とか、"この部品の取り付け位置はこれが正しい"とかを感覚的に判断している工場長なりラインリーダーなりがいるはずで、工場の設計者が論理的に効率的な設計をしていると信じていたとしても、結局、最後の最後の部分は人手に頼っているところで辻褄を合わせている可能性はないだろうか。

「例えば、バスケットボールのフリースローが上手くなりたいとします。"上手いフリースロー"を論理的に説明できたとしても、それで実際にフリースローが上手くなることってありますか? ないですよね。普通、フリースローをマスターしたければ、練習あるのみです。絶対的な練習量と生まれながらの素質が、強いバスケットボール・プレイヤーを作り上げるわけです。そこに論理性なんか要らないですよね。ところが、ここにお集まりの皆さんは、論理性を追求してこられた方々だ。だから皆さんから見て、いわば体育会系の深層学習に頼るのがなんとなくイヤだ、という感情は理解できますよ」

深層学習ニューラルネットワークも、性能を高めたければ、生まれがらの素質(初期値)と、練習量(データ量、訓練数)が重要になる。そして指導方法(最適化関数、ハイパーパラメータ)との相性もあるだろう。

筋肉をつけたければ筋トレするしか方法がないのと同じで、深層学習を有効に使いたければそれなりのデータを用意してできるだけたくさんの訓練をするしかない。その際にいろんな指導方法を試してみることも重要だ。

要は深層学習は、コンピュータ科学者が初めて扱う、体育会系的な概念の技術なのである。

だから、これを理解するには、やはり体育会系の考え方を適用し、ひたすら練習するしかない。つまり私は、人工知能のトレーニングジムを経営しているようなものだ。

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら

清水 亮(しみず・りょう)

ユビキタスエンターテインメント代表取締役社長CEO。1976年新潟県長岡市うまれ。6歳の頃からプログラミングを始め、16歳で3DCGライブラリを開発、以後、リアルタイム3DCG技術者としてのキャリアを歩むが、21歳より米MicrosoftにてDirectXの仕事に携わった後、99年、ドワンゴで携帯電話事業を立上げる。'03年より独立し、現職。'05年独立行政法人IPAより天才プログラマーとして認定される。

RELATED TAG