先進テクノロジーハイプサイクル2021を見て、考えたAIのこれから

2021.08.26

Updated by Ryo Shimizu on August 26, 2021, 08:21 am JST

ガートナーの先進テクノロジーハイプサイクル2021が発表された。

まず驚いたのは、幻滅期のテクノロジーがなくなったこと。
通常は幻滅期を経て啓蒙活動期、生産性の安定期に到達するのだが、今年は幻滅期に入った先進テクノロジーはないという見方だ。

先進テクノロジーのハイプサイクルは、ガートナーが様々な分野の技術を分析して抽出した、特に先の長い技術の分類だが、この変遷を追いかけてみると、2018年のハイプサイクルでは、ディープラーニング(深層学習)が「過度な期待のピーク」期にあった。

2019年のハイプサイクルでは、ディープラーニングがなくなり、「説明可能なAI」「エッジAI」「AI PaaS」「拡張インテリジェンス」「転移学習」「敵対的生成ネットワーク」「アダプティブな機械学習」と言った分野に細分化している。

もっとも、AIの専門家としてはこの分類に疑問が残る部分がなくもない。「敵対的生成ネットワーク(GAN)」と「説明可能なAI」は比較できるようなものではなく、当然使われる技術の一つに過ぎない。これをハイプサイクルに置くのは少し違和感を感じる。

2020年のハイプサイクルでは、「説明可能なAI」「AI拡張開発」「組み込み型AI」が「過度な期待のピーク」期に移行し、「AI拡張型開発」「責任あるAI」「生成的AI」「AI拡張型設計」が黎明期として順調に伸びている。

こういう時系列をもとに、2021年のハイプサイクルを見ると、「過度な期待のピーク」期にあるAI技術は、「AI拡張型ソフトウェア・エンジニアリング」だけだ。これは明らかに、GPT-3系統の技術を応用した、Github Copilotや、OpenAI Codexを指していると思われる。

多分ハイプサイクルのレポートが書かれた時点で、CodexもCopilotも公開されていなかったのでまだ「過度な期待」だったのだと思うが、僕的には実際に触ってみると幻滅期に入ってるように思える。

2021年になって初めて登場したのは「AI主導型のイノベーション」という項目で、これはまさしく黎明期ではあると思うが実際にそうした仕事に関わっている筆者の肌感覚とも一致する。

組織やビジネスの根幹にいかに巧みにAIを持ってくることができるかどうかが今後の競争力の源泉となることはもはや間違いない。

ただし、AIはまだまだ目に見えない。目に見えないことで理解を得られていないのはなかなかにもったいない。

CodexにしてもCopilotにしても、AIというものがどういうものなのかわからないまま、機械と対話しているという感覚は非常にもどかしい。

この状態は、アラン・ケイがゼロックスのパロアルト研究所でグラフィカルユーザーインターフェースを発明する以前のコンピュータの世界を想起させる。

当時、コンピュータは専門家にしかわからなくて当然のものだった。
世界で最初のインタラクティブコンピュータの発明者の一人であり、マウスの発明者でもあるダグラス・エンゲルバートは、一部の特別な訓練を受けた軍人やナレッジワーカーに最適化された環境として、マウスを備えたNLS(オンラインシステム)を発明した。

[youtube https://www.youtube.com/watch?v=yJDv-zdhzMY&w=560&h=315]

アラン・ケイはNLSのコンセプトとは逆に、「誰でも楽器のように使えるコンピュータ」を目指してグラフィカル・ユーザー・インターフェース(GUI)を発明した。

このGUIの発明が、現代のWindowsやMacOS、iPhoneやAndroidへと至るコンピュータ世界全体に広がるイノベーションに繋がっていく。

ステーブ・ジョブズはアラン・ケイのGUIに刺激されてLisaとMacintoshを作ったのは有名なエピソードだが、その時のジョブズの考えは「自分の母親が使えるコンピュータを作りたい」というものだった。

実際にジョブズの母親がコンピュータを使えるようになったのかわからないが、ジョブズの母親より遥かに若い、筆者の母親(70歳代)は、いまだにGUIを使えない。

筆者はGUIで機械学習を簡単に行えるツールを作り、これを実際に新潟県の中学生に使わせて授業をしたりしたことがある。

しかし、ただ「機械学習ができる」だけでは、AIのインターフェースとしては不十分である、という結論に達した。

なぜなら、この授業を受けた中学生は、その後、AIを自分の生活や日々の課題解決に一切活用できるようにならなかったのである。

体験の提供価値としては一定の評価を与えられるが、「誰もが使える道具」になるにはまだ程遠い。

つまり何を言いたいかというと、コンピュータはGUIによって飛躍的にわかりやすくなったが、AIはGUIを与えただけでは全く不十分であるということだ。

今やほとんどの典型的なAIは、GUIで作ったり使ったりすることができる。Prediction OneやNeural Network Consoleは、簡単に使えるGUI環境で高度なAIを開発可能だが、大多数の人々にとっては、まず「開発したいAI」を典型的なAIの形式に落とし込むことができない。

これはプログラミングそのものと同じくらい難しい。
つまり、AIを民主化するには、GUIでは根本的に不十分なのである。

ということは、我々、AI研究者はアラン・ケイの思想を超える、新たなユーザー・イリュージョンを構想しなければならない。

こうした現状を踏まえると、今年のハイプサイクルも、「木を見て森を見ず」という感覚は否めない。

虚数を用いた複素数が発明され、数学者たちに普及したのは1700年代のレオンハルト・オイラーの時代だが、それを用いた道具を一般の人が使いこなすには、スマートフォンの発明と普及まで待つ必要があった。

いや、ひょっとすると筆者が知らないだけで、社会インフラや自動車や自転車の設計に複素数が用いられたことがあるのかもしれないが、スマートフォンほど複素数を頻繁かつ有効に使っているものはないだろう。

写真の保存に使われるJPEG技術は、複素数が元になっている。立体的なものを表現する場合でも、複素数がどこかしらに使われている。スマートフォンの利用者数と、それ以前の複素数の応用技術の利用者数では比較にならないはずだ。

スマートフォンがなぜ便利なのかといえば、それはGUIを備えているからである。

AIは複素数と同じくらい重要かつ便利な技術だが、GUIだけではその能力を引き出すことは困難である。少なくとも、既存のGUIで用いられているメタファーには、そもそも知性を備えた機械というものが前提として存在しない。

アラン・ケイはユーザー・インターフェースより先に、「ユーザーにどのような錯覚を与えるか」という観点から「ユーザー・イリュージョン」の設計を行なった。

ユーザーを積極的に「騙す」ことによって、ユーザーに「わかった」という錯覚を与えることが目的である。

たとえば、フォルダをダブルクリックするとフォルダの中身が別のウィンドウで開く。
これでユーザーは「フォルダを開いた」と錯覚するのだが、実際にはフォルダを開いたわけではなく画面の一部にフォルダの中身が表示されただけである。

アラン・ケイの設計したユーザー・イリュージョンは、「明らかな嘘だとわかっていても受け入れた方が気持ちいい錯覚」を与えるという点で、手品や催眠術とよく似ている。

現代のAI産業に生きる我々が、本当にAIを誰にでも使えるようにしたいと考えるのであれば、手品師のように、新しい錯覚を考え出さなくてはならない。

なぜアラン・ケイがあの有名な警句を残したのか、今更ながらにわかる気がする。

「ソフトウェアについて真剣に考えるものは、ハードウェアを創り出さなければならない」

それはすなわち高度な錯覚を実現するためにダグラス・エンゲルバートがマウスを作り出したのと同じように、錯覚というのは画面の中に閉じてはいけないという意味だったのだ。

つまり我々は手品師に学ばなければならない。
そう考えて、現役のマジシャンと筆者で対談してみた。

[youtube https://www.youtube.com/watch?v=94RwTY7zCHg&w=560&h=315]

おすすめ記事と編集部のお知らせをお送りします。（毎週月曜日配信）

登録はこちら

清水亮（しみず・りょう）

新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。

AIが会社を経営することは可能か?

実在しないリアルな人間の顔を作り出せるエヌビディアのAI　ほか

AIの実装はビジネスのバリューチェーンで考える必要がある

[PR]「旅マエから旅ナカまで」訪日外国人の消費機会を地域に還元するための方法

PREVIOUS
NEWS

【島薗進氏による私塾】死にゆく人と愛の関係を再構築する技術　第5回：グリーフケアと修復的正義

Oculusが会議室になる。FacebookのHorizon Workroomを試してみた

NEXT
NEWS