ニューラルネットワークは21世紀のトランジスタである

新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。

過日、スコットランドのグラスゴーで開催された世界規模のコンピュータ・ヒューマン・インタラクション学会、CHI2019に参加してきた。
そこで目にしたものは、もはや当然のように受け入れられているニューラルネットワークの数々である。

CHIという学会においては、ニューラルネットワークがなんら特別なものと認識されていない。
それどころか、そもそも「当然のように使う道具」として捉えられているのが非常に印象的だった。

例えば、東京大学の暦本純一研究室では、口腔内を超音波エコーでスキャンして、口腔の断面図からニューラルネットワークによって発音を推定し、スピーカーで再現することで無声状態でAmazon Alexaを起動するSotto Voiceなどを論文発表していた。

暦本教授によれば、このニューラルネットワークは、暦本教授自身がKerasで書いたものだと言う。
暦本教授の専門はコンピュータ・ヒューマン・インタラクションやテレイグジスタンスだが、いわばAIを「専門外」とする研究者が、「単に便利な道具として」使うことで、効果的な研究結果に結びつけるという事態が発生している。

もうひとつ具体例を出すと、たとえばこんな研究が発表されていた。

これは視覚障害を持つ人のための視覚支援デバイスで、スマートフォンのカメラをかざすと、そこになにがあるのか教えてくれるというものだ。

それだけならニューラルネットの簡単なサンプルプログラムで終わってしまいそうなのだがさもありなん。

カメラにはなんでも映ってしまうので普通に「これがあります」では全くよろしくないのだ。
特に、薬箱なんかを写して「薬です」と言われて、間違った薬を飲んだりしたら一大事である。

そこでこの研究では、「視覚障害を持つ人が対象物を手で触ったものを通知する」というアプローチをとっている。

そのために独自のデータセットを作ったりもしているが、基本的には視覚障害を持った人特有の触り方、というのに着目し、その手の動きをニューラルネットに学習させて特定している。

ニューラルネットそのものは既存の、どちらかというと少し古い形式のものをそのまま使っているが、彼らが実現したいことは精度を上げることではなく役に立つものを作ることである。

その点で、CHIでは、「ヒトとコンピュータ(AI)」がどのように相互作用すべきかということが全体的に議論されていたように感じた。

このように、もはやAIは産業応用へのステップに急速に進んでいるのである。

先日、とある電機メーカーに努める学生時代の友人と会った時、「うちの会社でもあちこちの部署がAIやってるって言ってて収拾つかないんだけど、どうしたものかね」とこぼしていた。

そのときふと筆者の脳に浮かび上がった言葉が、本稿のタイトルである。

「ニューラルネットは、いわば21世紀のトランジスタなんだよ。だからどんなものにも使えるし、使って行くべきなんだ」

「なるほど、そういうものなのか」

トランジスタの発明が世間からほとんど全く注目されなかった、という話をご存知だろうか。
ベル研究所のウィリアム・ショックレーらが開発したトランジスタのニュースは、非常に小さい記事として新聞の片隅に載せられただけだった。

発明者たちの興奮とは裏腹に、それが何の役に立つのかほとんどの人には理解できなかったのである。

というのも、発明された当初のトランジスタは、真空管の代用品という認識だったからだ。しかし真空管が前提の世界では、真空管が小さくなったことによるメリットは理解しにくい。

その後、小型真空管による補聴器を作っていたレイセオン社が、トランジスタを利用した小型補聴器を開発してようやく実用化された。

東京通信工業(現ソニー)はウェスタンエレクトロニクス社に膨大な特許使用料を払ってトランジスタの特許を獲得するが当初欲しかった高周波の処理ができず、やむなく独力で高周波トランジスタの実用化に成功する。

トランジスタは最初のベル研究所で発明された不安定な点接触型から、テキサス・インスツルメンツが開発したシリコンをベースとした接合型トランジスタへ進化した。

当時、トランジスタを使った製品はあちこちの会社から発売されており、トランジスタそのものが競争力を持っていたわけではなかったものの、トランジスタを使いこなすことが20世紀後半の世界の電機メーカーにとって死活問題になっていった。

ニューラルネットワークに関する状況はこれと極めて類似している。
シリコンバレーがシリコンバレーと呼ばれるようになったのも、もとはトランジスタの発明者、ウィリアム・ショックレーがマウンテンビュー(現在Googleなどがある)に半導体研究所を設立したのがきっかけだった。

ショックレーはかなりの困った人で、秘書が怪我をした原因を探るために嘘発見器を使って犯人を突き止めようとしたり、無茶苦茶な研究テーマを掲げて研究させたり(でも実際には後世に実用化された)、急に「シリコンで半導体をつくるのはやめる」と言い出してみんなを困らせた。

ショックレーのシリコン離れにキレた若き日のロバート・ノイスとゴードン・ムーアを含む8人の社員は研究所を退職してフェアチャイルド・セミコンダクター社を設立した。

ところがフェアチャイルド・セミコンダクター社も彼らにとっての楽園とはならず、やむなく再度独立を画策したノイスとムーアは、「統合されたエレクトロニクス(Integrated Electronics)」から名前をとった、Intel社を設立し、現在に至る。AMDを設立したジェリー・サンダースも、後にAppleの社長となりジョブズを復帰させたギル・アメリオも、フェアチャイルド・セミコンダクター社の出身である。

トランジスタは単独の発明ではなく、様々な才能を持った人々が知恵を絞りあって現在の形がある。いまや若者に「トランジスタ」と言ってもなんのことだかわからないだろうが、トランジスタがなければ現在の世界は全く存在しない。

現在のiPhoneXsシリーズに搭載されているApple A12 Bionicチップには69億のトランジスタが使われている。

今、「ポケットに100億以上のニューロンが入る時代が来る」と言っても想像ができないだろうが、ヒトのニューロンも高々20億くらいしかないので、1トランジスタ=1ニューロンとすれば(そんなに簡単な話ではないが、ここでは話を簡略化するとして)、全く不可能な目標とも言い難い。

深層学習の最初期に話題を呼んだAlexNetのニューロン数は約65万個と主張されており、人間並の20億を達成するには、この3000倍以上の情報量が必要になる。

とはいえ、半導体の世界で「3000倍」というのはそこまで無茶苦茶な目標とも思えないので、2045年まで待つ必要はないだろう。

トランジスタが発明されてから約25年後の1971年には2,300個のトランジスタによるマイクロチップ4004が開発され、それから7年後の1978年には、29,000個と10倍の集積度の8086が発売された。以後、1985年の80386(27万)、1993年のPentium(310万)と、7〜8年に10倍ペースで増えて言ったのである。これが俗に言う、ムーアの法則だ。

というわけで、現在のニューラルネットは1950年代のトランジスタと似た状況にあるが、一つだけ大きく違うことがある。

それは、ニューラルネットが、ソフトウェア技術であるということだ。

ハードウェアも深く関係するが、実際にはソフトウェア技術であるというポイントによって、トランジスタのように工場を構えてないと新しいものを作り出したり改良したりできないということがない。むしろ誰でも使うことができる便利な道具であり、アイデアと組み合わせ次第でこれまで不可能に思えたことができる、という点がトランジスタとは大きく違うところだ。

筆者は職業柄、いくつもの技術的革新が起きる現場に立ち会ってきたが、普通に想像するよりも、技術的革新の広がりというのは早い。

時には消費者から見て全く非合理的なことでも、産業界からすると必然的かつ不可避な流れとしてソフトとハードの逆転現象が起きる。特にコンピュータにおいてはこの現象は必ず起きると言っても良い。

たとえば、かつて浮動小数店演算機能(FPU)や、メモリ管理機能(MMU)は、CPUとは別のハードウェアが担当するものであり、とても高価なオプション品だった。

ところが現在、この二つの機能を持っていないCPUの方が珍しい。1000円程度で販売されているラズベリーパイZEROですらメモリ管理機能も浮動小数点演算機能を持っている。

不要な贅沢品と思われていたこれらの機能が統合された理由は、ハードウェア設計者が「そのほうが良いと思ったから」に他ならない。

CPU開発と製造のスパンはソフトに比べて膨大に長い。数年後のニーズを確実に予見することはかなり難しいので、どうしても「次のチップはこれからニーズがでてきそうな機能全部盛りで」という設計になってしまう。

そして、ハードが先に出てしまうと、ソフトはそれにあわせて書いていくことができる。ソフトの開発スピードはCPUに比べて極めて早い(数時間から数ヶ月)ので、大元のCPUを設計する人たちはかなり先のことまで考えて設計をする必要がある。

同様に、どう考えても普通の人から見たら「いらない」機能である3Dグラフィックスだとかの機能もどんどんついでに内蔵されていき、それが発展して、今はニューラルネットの処理をする専用回路みたいなものもどんどん内蔵される傾向にある。まさしくiPhoneXsのA12 Bionicなどはその典型で、ニューラルネットを使ったアプリケーションもまだほとんどないのに、「とりあえず全部入りで」とばかりに乗っかってしまっている。

この全体的な流れは、ARMもIntelも追従せざるを得ないだろう。
半導体企業がこぞってRISC-Vに注目し、作ろうとしている独自CPUもまたニューラルネット専用回路を搭載していることが少なくない。要は「何に使うかわからないけど便利そうだと思ってもらうためには載せておこう」という心理が作用しているのだ。「効果的な使い方はソフト屋さんが考えてくれるだろう」というわけである。

実際、メモリ管理機能とか3Dグラフィックス機能なんか使わないよ、と普通の人は思うかもしれないが、メモリ管理機能がハードウェアレベルで存在しているからOSはウィルスに対抗できるのであり(もしできないとしたらOSの設計が悪い)、みんなが「iPhoneはサクサク滑らかー」と言ってる見てる画面は2Dだけど、実は内部的には3D機能によって美しく高速な描画が実現されている。

これは部品が別になっていると「わざわざ3Dチップを追加コストをかけて載せる意味」を考えなくてはならないが、最初から入っていると「あるなら使わないと損」という発想に180度変わってしまうからである。

ということは、必然的に「ニューラルチップが載ってるスマホ」が意味があるのかないのかわからないまま今ものすごい勢いで普及しているわけで、とりあえずHUAWEIだろうがPixel3だろうがiPhoneだろうが「とりまニューラル」を入れてる状態になっている。

こうした「眠れる森の美女(半導体の新機能)」たちは、いつか生かした王子様(エンジニア)がそっと口付けしてくれる日を今か今かと待っているのである。

「AI、なんに使うかよくわからんよ」と言ってる場合ではない。何に使うのかよく考えるべき時代なのだ。ちなみに3Dの時もMMUの時もモバイルの時もブロードバンドの時もインターネットの時も同じようなことを言ってる人は居た。結局そういう人たちは時代に取り残されていった。

特にニューラルネットは使い道がたくさんある。それを考えるだけであぁ楽しい。なんて楽しい時代に生まれたんだろう。

と、幸福を噛みしめるべきなのである。

ニューラルネットワークは21世紀のトランジスタである

Newsletter

Related Articles