20151120privacy-ec

人間の「内なる声」は人工知能に届くのか(2)「データは客観」の落とし穴に墜ちてはいけない

テーマ11:「プロファイリングの現在と未来」

2015.11.20

Updated by 特集:プライバシーとパーソナルデータ編集部 on 11月 20, 2015, 11:50 am JST

前編では、AIや機械学習が向かうべき方向性について、「リアルな研究と夢のある研究」という両方を意識したトレンドと、その中でも「潜在意識や無意識行動」を考える重要性が挙げられた。実現に向けた議論の中で登場した「東洋思想」というキーワードとは--引き続き、国立研究開発法人 産業技術総合研究所・人工知能研究センター副研究センター長(兼 確率モデリング研究チーム長)の本村陽一氏と、デジタル・アドバタイジング・コンソーシアム株式会社・プロダクト開発本部 広告技術研究室 主任研究員の原田俊氏に、対談いただいた。

原田俊氏 本村陽一氏


──前編でご指摘のあった「潜在意識や無意識行動」ですが、無意識な行動や振る舞いもデータとして取り扱わないと、潜在意識を含めたモデルが作れません。そして、そのモデルがない状態では、いつまで経っても、「昨日の午後三時に何をしていたか」とか「日曜日の午後7時にどのTV番組を見ていた」という、いわば日常のスライスを追いかけるだけにすぎなくなってしまいますね。そしてネット広告の分野が顕著ですが、そうした「履歴に基づき追いかける」というパーソナルデータの使い方が先行してしまったため、消費者からは疎ましく思われる存在になってしまっているようにも思えます。

そのモデルは「人間の次のアクション」を生み出しているか?

本村 新たなパラダイムを実現するために必要なのが「現象のモデル化」と呼ばれるものです。ただ、何時何分に誰かが行動したと言うことを学習して、何時何分になったから何かを出力すると言うことではなく、その人がある気分になったときに何かを出す、つまりその現象の因果的構造のモデルなのかが本質のはず。

つまり、それが次の現象を生む生成モデルになっていないといけないし、起こる現象が制御できるものでなければ意味がない。

原田 仰るとおりですね。マッチングしてクリック率が高くても、その先の購買行動等に繋がっているかが本質のはずです。その上で、潜在意識を踏まえて複数のペルソナを把握するには、同じ持ち主のPCとスマホのブラウザを結びつけて、それで多層を観察するという「クロスデバイス」のアプローチが重視されてきています。そしてそこに、位置情報というオフラインのペルソナを把握できるデータも入るようになってきた。

本村 それこそが、昨今のIoTの流れです。「過去のデータの丸暗記」を越えるためには、いま仰った前提が揃うことで、初めて現象を因果的にモデル化し、計算できるデータが揃うのでしょうね。

IoTは「アクションを確認する」ためのテクノロジー

──現象が起きたときにトラッキングできる環境は整いつつある。あるいはそれを整えていくのが、IoTである、ということですね。

本村 テクノロジー的な勝負はそこに移っている。研究者として、今はインターネットのデータで研究なんかしている場合じゃないんです。時間と状況、コンテクストの入ったリアルな空間での状況を研究しなければならないし、そこではデータが集まっただけでは不十分。さらにそのデータを丸暗記できるディープ・ラーニングでも現象を制御するためには不十分です。だから、データに『知識』を融合させないといけない。

ところで、いま『知識』と呼びましたけど、それが具体的に何なのかが、まだわからない。「潜在意識における知識」とは何でしょうか?潜在意識によって行動が変わり、現象も変わっていくこと自体は、観測できるようになってきた。だとすると、その現象の違いを説明する、データでは表現しきれていない「何か」を定義し、融合することが必要なんです。

そして僕は、それこそがより価値の高いものではないかと思うんですね。データに価値があると、皆がデータに目を向けている間にこそ、データではないものを押さえることが、戦略上最も重要だと思います。

東洋思想で「現象を変えていく」知識を獲得する

──現象を変えていく知識、ですか。かなり難しい領域ですね。

本村 そこで実は東洋思想にもヒントがあるのではないか、と考えているんですね。たとえば、「違和感」って英語でどう言うかわかりますか?

──うーん、”difference”とか、でしょうか?

本村 僕も本当に改めて調べてビックリしました。ピッタリの言葉がなくて、強いて言うなれば”something wrong”なんだそうです。

だとすると、「違和感」というものが何か具体的なものとして存在しうると考えるのは、東洋思想ですよね。実際それがあるからこそ、我々には「違和感を共有」できるわけですよ。これこそが、日本が勝負に打って出る、西洋型のAIに対抗しうる武器じゃないでしょうか。

一方で、日本語では上手く表現できないこともある。”point of view”と”view point”の区別を日本語はしていないんですよ。どこから見ているかと、どこを見ているかは、視座と視点の両方があるわけです。「生活者の視点」という時に、生活者が見ている先の空間のことか、生活者の心理のことを考えているのか、区別していない。

何が言いたいかというと、既成の言語体系で考えている限り、アクセスできない領域が、私たちにはある、ということです。そうした潜在意識へのアクセスが可能になると、人間はおそらくバージョンアップする。そう考えれば、テクノロジーを恐れる必要はないんじゃないかと思います。あるいは日本人はもう少し、バージョンアップした方がいい面もあるかもしれない(笑)。

客観のない世界で日常世界をどう構成するか

──日常世界をどうやって構成するのか。その中での意味をどのように見出しているのか。現象学的な知見が必要ですね。

本村 たとえば物理学では、極めていくと量子的な領域では本当は「客観はあり得ない」となっています。でもそのあたりが中途半端だと、客観的に語ろう、データで客観的に語ろうと言うわけです。でも、実際のデータは現象の前ではそもそも客観的ではない。不確定性原理で、本当に客観を極めてセンシングしようとした人間は、限界を見切って「それは確率事象だ」と気づいているわけですよ。本当の客観は存在しないんです。あると仮定して、ニュートン力学、昔の物理学で合意しているから、一見、同じ何センチといって社会生活ができているだけですから。

「客観的」と我々が呼んでいるのは、これがそうだとするなら、それと比べてどうか、ということであって、すべては相対的なんです。ただ、それはたくさんの人が合意したら、その間では共通だと見做そうという「間主観性」の世界なんです。我々が生活できているのは、その合意が取れているからで、その共通表現として法律であったり、ある種のゲームのレギュレーションがあって、共通の場が作られているわけですよ。

法律という概念だって「変わらなきゃ」

ところが、その法律だって、時代がこれだけ変わっちゃうと、昔のままでは当てはまらなくなりますよね。法律だって相対的なものだと、皆うすうす気づいているわけですよ。ところが、皆が法律を変えて、法律が自分たちの行動を規定しているっていう、これも相対的な関係じゃないですか。だとしたら、法律も変わらなきゃいけない。

原田 それも、結構大きなアップデートが必要になっていますね。

本村 それこそ法律という姿そのものも、問われているのかもしれない。リアルタイムで多くの人に周知徹底できるテクノロジーがすでに我々にはあるわけですから、みんなが共通に同意できる、法律の条文の代わりになるものがあればいい、とも言える。”something wrong”ではなく”something right”ですね。それで社会は成立するのかもしれない。

──リアルタイムアップデートの必要性、ですね。それこそ個人情報保護法の改正に10年を要してしまったというのは、法律という姿そのものの限界が示されたのかもしれません。ただ、今回の法改正で画期的なのは、自主規制ルールの導入からも分かるように、規範であることの限界を自ら宣言しているところでもあります。

本村 実際、旧態依然とした法律への態度を改めないと、AIで計算した方がいいということになりかねない。

原田 人間が考えるよりもいい、と。

見る番組をYouTubeのアルゴリズムによって決められる時代

本村 スピードが遅いわけですから。態度を変えないままでいると、本当に今まで人間が縛られていた基準というものが、AIに置き換えられてしまう。実際、我々は幼少期に見た「鉄腕アトム」を見てロボット工学者になったりしているわけですよ。うちの子どもなんかYouTubeを見ているんだから、YouTubeの協調フィルタリングやAmazonのレコメンデーションによって「見るべきもの」がセレクトされて、それによって幼少期の文化がはぐくまれて人格に影響しているわけで、もうSFでもなんでもない。

原田 本当に”something right”なのかってことですよね、背後にあるものが。

──”right”なのか”wrongなのか、分からないですよね。そして、それが分かったところで、責任を取る主体がいない。「使ったのはユーザであるあなた自身でしょ?」となってしまう。

本村 むしろ今の人間にとっては都合が良いのかもしれない。「オレのせいじゃないから、でもあれは正しい」という態度でやってきたわけです。お上が言っているから、法律がそうだから、どこかの偉い先生が言ってるから。

ディープ・ラーニングの過剰学習(オーバーフィッティング)を疑え

原田 そこは学習モデルなり、設計の所に人の善意なりをいれることによって、解決できるものですか。その善意が正しいかどうかという問題もありますが。

本村 ありとあらゆる場所にそういう仕組は必要だと思います。例えば知識として健在化させ共有する時に判断するとか。データに何かが紛れ込んでしまうことは避けられないわけです。そのデータを入れて、これは正しい学習アルゴリズムだと言うことで使っていても、データの中のノイズによって起こる影響が増幅されちゃうかもしれない。それに対する抑止力をどこに置くか。逆に言うと、機械学習においては、何らかの抑止力をおかないと、危ないです。

原田 僕はその抑止力を配置する場所は「出口」だと思っています。人間と対峙するところに制限や抑止力を入れる必要がある。

本村 だから、ディープ・ラーニングがスゴいといって結果を疑わない人は、ディープ・ラーニングを使っちゃいけないんですよ。あぶないでしょう。しかもビッグデータでどんな学習したのかわからないかもしれないのに、精度が高いことを笠に着て、「ウチのディープ・ラーニングは」って自慢するわけですよ。

これは、第二次ニューロブームの終わりを知っている人間が、なぜ今慎重なのかを考えていただきたい。過剰学習(オーバーフィッティング)の怖さをわかってるから言えるわけですよ。物理学、量子力学を極めているから、世の中に客観がないと初めて言えるわけですよ。それをデータは客観だから、と言っている人は、その危険性を知らないわけです。

「機能」や「モデル」を考え続ける意志がアップデートを支える

──ネット社会において、私たちは、YouTube用のペルソナ、Amazon用のペルソナと、ペルソナをいくつも持っている。そして大多数の人はそれをおすすめされて良さそうだ買ってしまうけど、そのリスクを自ら管理できるようになる必要があるわけですね。

本村 プログラミングの世界では、オブジェクト指向がわかるプログラマとわからないプログラマでは大きな壁があるんですね。それは、作るものに対しての「メタ認知」ができるからなんです。オブジェクト指向が分かる人は、作るべきものをただ闇雲に作るのではなく、俯瞰的な視座からどんな「機能」があるべきかと考えて、あえて新しく作らず、すでにあるものを組み合わせたり、そこに手を加えるということができる。

機械学習も同様で、ディープ・ラーニングのパラメータ学習だけの世界と、それのモデル自体を選択するモデルの学習というレベルは、後者が一段高い「メタ」のレベルになっています。そのメタ認知があるからこそモデルが進化できるわけで、私たち自身の生き方も、そうした「メタ認知による認識構造の再定義(リフレーム)」が必要なんじゃないかと思います。

──今回の個人情報保護法改正が興味深いのは、3年経ったらアップデートすると明言していることです。「3年を目処に」といったお茶を濁す表現ではなく、かなり踏み込んで見直そうといっている。そのためのアジェンダはすでにいくつか挙げられていて、その一つが「プロファイリング」なんです。

本村 そこにおける態度と更新し続けるという意志が大事ですね。それをやめた瞬間、止まってしまったものに依存してしまう、制御されてしまうことになるので、常にそれを良い物にアップデートし続けるという態度ですね。

「間違い」さえも正しく取り込む

もうひとつは、わかった上でのアクティブ・サンプリング。つまりデータやモデルが正しいはずだ、というのではバイアスが掛かるわけですよ。先ほどの東洋思想からの敷衍では、陰と陽というのがありますね。よい面もあれば必ず悪い面もあるので、必ず諸刃の剣だという前提で失敗から活かす、つまりあえて間違っているかも知れないデータやモデルを活用し、進化させるという発想も必要だと思いますね。

それこそ、特区構想も含め、あえて失敗しても良い実験場を持っていた方が良いと思います。そういう同意を得て、「私はプライバシー出しても良いよ」という人達だけで作ったコミュニティにおいてひたすらやってみたら良いじゃないですか。

その上で、本当に真剣にプライバシー侵害リスクを計算した方が良いですね。得られるベネフィットと比べたら、見合わないくらいリスクは低いかもしれない。もちろん、重篤なリスクはあり得るでしょう。ただその頻度は高くなくて、リスクを負ってでも、実験で得られるベネフィットの方が高い、ということも言えるかもしれない。とにかく、そうした議論をするための検証の機会が、もっと必要ですね。

(3)に続く

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら

特集:プライバシーとパーソナルデータ

情報通信技術の発展により、生活のあらゆる場面で我々の行動を記録した「パーソナルデータ」をさまざまな事業者が自動的に取得し、蓄積する時代となっています。利用者のプライバシーの確保と、パーソナルデータの特性を生かした「利用者にメリットがある」「公益に資する」有用なアプリケーション・サービスの提供を両立するためのヒントを探ります。(本特集はWirelessWire News編集部と一般財団法人日本情報経済社会推進協会(JIPDEC)の共同企画です)

RELATED NEWS