WirelessWire News Philosophy of Safety and Security

by Category

WWWの次の世界

2021.09.17

Updated by Ryo Shimizu on September 17, 2021, 11:27 am JST

20世紀は、メディアを発見する時代だった。

1911年生まれのマクルーハンは、20世紀中盤にメディア論を唱え、それまで人類が無自覚的に使ってきたあらゆる「道具」をメディアとして再定義することで全地球規模の「村」、グローバルヴィレッジを構想した。この思想に刺激を受けてグラフィカルユーザーインターフェース(GUI)が発明され、インターネットという全地球規模の「村」が出現した。

マクルーハンの思想に強く影響を受けたアラン・ケイは、自らの夢想した新しい機械を「パーソナル・ダイナミック・メディア」と呼んだ。
この思想は後に、「パーソナルコンピュータ」として知られるようになる。

今日、我々が毎年のようにiPhoneの新製品に一喜一憂するのは、こうしたメディア論の裏付けがあるからに他ならない。
マクルーハンの時代には当然、パーソナルコンピュータなどというものは存在しなかった。

しかし、マクルーハンは、ラジオからテレビへとメディアの中心が変化する時代の中心にいた。
あるメディアが衰退し、別のメディアが台頭してくる現象を分析するためのツールとして、マクルーハンはテトラッドと呼ばれる図を用いた。

テトラッドは、メディアの持つ性質を三つの側面、増強する(enhances)、衰退させる(obsolesces)、回復させる(Retrieves)といったものから分析し、最後に新しいメディアが「反転して(Reverses)」現れるということを示唆する。
同じメディアについても、見方を変えることで複数のテトラッドの解釈があり得る。

しかし、テトラッドは、思考を整理するためのフレームワークとして非常に便利なので筆者はよく使っている。

たとえば、メディアが発見された当時、ラジオからテレビへの移り変わりをテトラッドで表現すればこうなる(マクルーハン自身の解釈とは違う。あくまでもテトラッドという道具を用いた筆者なりの解釈であることに注意されたし)。

筆者の解釈では、ラジオが増強したものは明らかに「聴覚」であり、「声の届く範囲」だ。これは、当然、資格を衰退させ、美男・美女の相対的な価値を下げる。

しかし一方で、ごく少数の発信する側と大多数の受診する側に分断することによって権威と芸能が回復する。
回復した権威と芸能、そして一度衰退した視覚を足し合わせたものが、テレビである。と、ここではしている。

もちろんこうしたテトラッドの書き方はこじつけめいてはいるが、ゴールがどこなのか考えながら書くことにも、ゴールがわかっている場合にはゴールから逆に何が途中の要素だったのか帰納的に考える時にも役立つ。

ここまではマクルーハンが生きている時代に起きたことなので、そこまで違和感はないはずだ。
次に、マクルーハンの晩年から死後に起きた変化について考えてみる。

テレビからWWWへの変化だ。

テレビが増強するのは、明らかに視覚であり、芸能の価値だった。
このことが活字離れ、要は新聞や雑誌、書籍を衰退させていった。

また同時に、芸能人や文化人といった、所属する団体に関係なく、強烈な個性を持った「強い個人」としての人間に注目が集まるようになった。

普段テレビを見ている時に、そのタレントがどこの事務所なのか意識しながら見てる人はほとんどいない。
タレント本人を見てるのであって、その背景を見ているわけではないからだ。

こうした「強い個人」は個性を全面に打ち出しても、ある程度の社会規範に従っていれば受け入れられるし、時にはメディアの支配者であるはずのテレビ局とも喧嘩できるほどの強い存在になっていった。

この「強い個人」と、衰退したはずの活字文化が組み合わさったのが、ワールド・ワイド・ウェブ、いわゆるWWWである。
WWWは、従来の雑誌や新聞と違い、権威がなくても誰でも発信することができ、それがまた魅力でもあった。

WWWが発明されるまでの間、人類はインターネットを本当の意味では使いこなせていなかったと言える。
インターネット自体は、1970年代から存在していたが、普通の人が当たり前のように使うようになったのは1995年頃からだ。これにはやはりWWWの発明が大きい。

20世紀前半は聴覚メディアの時代で、20世紀後半は視覚メディアの時代であるとざっくり分けることもできる。

WWWの発明によって、人々は日常的に視覚的刺激を受けることができるようになった。新聞は読まなくてもスマートニュースは読む。ニュースさえ読まなくてもTwitterやYouTubeは見る。それが当たり前の世界になった。

20世紀前半の人々に、「21世紀初頭の世界では、文字による文通が親しい人も含めた主な会話手段である」と説明したら到底信じてもらえないだろう。しかし現実に、おそらく家族でさえ文字でのやりとりが圧倒的に多くなっている。これは20世紀末の人に説明しても多分信じてもらえないだろう。ほんの20年前、まだ携帯電話がかろうじてeメールをやりとりできるようになった頃のことを思い出して欲しい。

過去70年近くにわたり、我々は視覚優位の時代に生きている。
文字を読むのも、書くのも、友人と連絡を取るのも、基本的に視覚メディアだ。

GUI(グラフィカル・ユーザー・インターフェース)とは、そもそも視覚を起点としたユーザーイリュージョンの設計である。
アラン・ケイに才能を見出され、マサチューセッツ工科大学の教授となった石井裕は、アラン・ケイの作り出したGUIを中心とする世界を「ピクセル帝国(pixel empire)」と呼ぶ。

ピクセル帝国への抵抗と叛逆こそ、自らの使命と考える石井裕は、独自に視覚のみに頼らないユーザーイリュージョン、Radical Atomsを構想した。Radical Atomsでは、基本的にはピクセルを用いず、現実世界の物理的な現象を引き起こすことでユーザーとインタラクションを行う。環境に思考力を持たせるというアイデアは瞬く間に広まり、アンビエントコンピューティングやアンビエントインターフェースというコンセプトに強い影響を与えた。

たとえばAlexaやGoogleアシスタントのようなスマートスピーカーは、アンビエントコンピューティングの一種と考えられている。

さて、しかしいざ冷静に考えてみると、我々は視覚に頼り過ぎてはいないだろうか。
歩きスマホは危ない、というのもあるし、ARグラス/VRグラスはやっぱりまだまだ普及するまでに最後の人押しが足りてない気がする。そもそも、本当に視界に情報が掲示されるのは便利なのだろうか。

Garminが発売している自転車用のARディスプレイがあって、筆者はそれをしばらく装着しながら自転車に乗っていたのだが、常に視界の一部がディスプレイに占拠されているのはどれだけやっても慣れることがない。

一見すると便利なのではないかと思うのだが、実際に使ってみるとなんだか面倒くさいのである。

最近はAR/VRをまとめてXRと読んだりもするが、ここでいう「リアリティ」はあくまでも視覚的なものを指す。
実際、筆者もゲーム開発者だった頃は、音が苦手だった。基本的に音をつけるのは最後の最後で、ゲームバランスの調整の時に初めて音を鳴らす。

というのも、音というのは重なりすぎるとちゃんと聞こえないし、ある意味で一番後回しにして問題ないプログラムでもあるからだ。
下手をすると、音がないゲームを作ったことの方が多いかもしれない。

映画音楽も、基本的には映像が出来上がってから発注する。映画を盛り上げるのに一番大事な要素とも言えるのに、映像が出来上がるまで音がつかないというのは全く不思議に思える。

もちろん編集時には、音がなにも入ってないと困るので仮の音楽を入れておく。
しかし仮の音楽よりも劇盤・・・すなわち映像に合わせて作曲したものがやはり最も良い演出効果を狙えるのが定説だ。

つまり、20世紀後半以降の世界はビジュアル・ファーストとも言える。

もちろんWWWのサイト、いわゆるWebサイトも、音がないものがほとんどだ。昔は開くだけで音楽が鳴るようなサイトもあったが、そういうのは嫌われるのでなくなっていった。数少ない例外がYouTubeなどの動画サイトである。

iPhoneやAndroidのアプリも、広義にはWWW技術の援用である。そこにパフォーマンス的な違いや管理的な違いはあったとしても、本質的には変わらない。

僕はスマートフォンのゲームを熱心にやるが、基本的に音は切っている。
音によって自分の集中を乱されたくないという気持ちもある。

さて、ところで、我々はどうしてこんなに視覚優位の世界に生きているのだろうか。
テレビの出現まで視覚優位なメディアはなかったのだろうか。

もちろん違う。
ラジオの前は新聞や雑誌、書籍といった視覚メディアがメディアのメインストリームだった。

それを実現する活版印刷技術の発明されるより前は、舞台演劇や教会での礼拝など、聴覚が優位な時代があった。

このように、人類の扱う情報メディアは、聴覚優位と視覚優位を交互に繰り返しているという性質がある。
それはメディアが進歩し、浸透すればするほど、そのメディアが陳腐化していくからだ。

メディアの浸透圧が高まれば、新しいメディアの出現する可能性も高まる。

そもそも音がなかったWWWの世界に、YouTubeやNetflixが登場し、テレビでもYouTubeやNetflixを見ることが当たり前になった時代、我々はすでにWWWより一歩先の世界の扉を開いていることになる。もう文字で読む情報は沢山なのだ。

そこで大胆にも、筆者はWWWの次に来るメディアの姿を予知してみたい。

WWWが増強したのは、明らかに「視覚」であり、「書かれた言葉」であり、「双方向性」だ。
従って、衰退させたのは「聴覚」であり、「話された言葉」であり、「権威」であると言える。

ちなみにメディア論では視覚/聴覚の対立軸のほかに「権威の喪失と復活」という軸がよく出現する。
基本的に情報発信の非対称性が高まれば高まるほど権威は増強され、誰でも発信できるものになるほど権威は失墜する。

今のWWWの世界では権威はほぼほぼ存在しないといっても間違いではない。
大臣だろうが教授だろうがTwitterの失言で失職するかもしれないご時世である。

反対にWWWによって回復されたものは、過去の歴史の蓄積や、知識や経験、そのアーカイブといったものになる。
テレビはどうしても放送帯域が限られるので、過去の全ての歴史を常に参照できるようには構造的にならない。しかし、WWWによってサーバーさえどこかに置いておけば、誰でも過去の歴史やアーカイブにアクセスできるようになった。重い百科事典を持ち歩かなくても、いつでもWikipediaやオックスフォード英英辞典を参照することができる。

このアーカイブ的な性質と、聴覚的な性質によって出現する新しいメディアとは何か。

筆者は暫定的にこの世界を「Audio First」と呼ぶことにしている。
これは、これまでの視覚優位な世界に対して、聴覚優位な世界を意味する。

たとえば、AlexaやSiriは、音声を起点としてWikipediaを検索したり、道案内をしたり、天気予報を告げたりすることができる。
「話された言葉」が起点にあるため、これはAudio Firstなユーザーイリュージョンと言える。

哲学者で批評家の東浩紀氏が立ち上げたシラスというサービスは、これまでのニコニコ生放送やYouTubeライブとは一線を画す新しいコンセプトと料金体系で成功を収めている。

シラスは月額制の動画配信サービスであり、それも「見放題」などというものではない。むしろ、「個」を強調し、コンテンツは少ないが内容を濃くした上で濃いファンたちだけから配信収入を得ることを目的としている。

沢山のコンテンツを揃えて月額定額料金で楽しめるというNetflixやAmazon Primeのようなコンテンツとは真逆のコンセプトで、しかしシラスのコンテンツは常に生放送かそれに近い形での配信だけが行われているので、これはメディア論的にいえばローレゾでクールなメディアということになる。

メディア論における「クール」とは、「何が起きるかわからないゆえに人の興味を強く惹きつける」ものである。このためにはローレゾでクールでなければいけない。ローレゾであるべき理由は、作る側が疲れないことが大事だからだ。

一方でNetflixやAmazon Primeは、「ホット」で「ハイレゾ」である。メディア論における「ホット」は「押し付けがましい」という意味になる。4KHDR放送のガリガリに作り込まれた映画を見るわけだから、見る側も疲れてしまう。実際、在宅ワークへの以降でNetfixを片っぱしからみたはいいが、流石に見るのに疲れてしまったという人は少なくないのではないだろうか。

YouTubeやTikTokも、登場当初はローレゾでクールだったのだが、次第にページビュー数や広告クリック数が収入に直結するようになってから様相が変わった。つまり、お金を稼げてしまう以上はハイレゾ化してまうし、ハイレゾになってしまったら、クールではなくなってしまうのである。

そして、さらに最近思ったのは、たとえば筆者がサンフランシスコ在住のYouTubeであるdrikin氏と定期的に行っているYouTube番組などは、完全に「対談」であり、視覚情報をほとんど必要としない。

画面を見ても老けた男が二人深刻そうに顔で話をしているだけで楽しくもなんともない。
しかし、だからこそ惹きつけられる、という視聴者がいるのである。

思えば、東浩紀氏と10年近く前に立ち上げたゲンロンカフェという場所も、基本的にはわざわざ五反田まで出かけていかなければならず、しかも雑居ビルの6Fという決して恵まれているとは言えない立地でのスタートだった。

そしてゲンロンカフェまでわざわざ来てチケットを買って話を聞く人たちというのは、もはや視覚情報に頼っていないのである。
たとえばスライドを出すと一斉に顔が上がる。壇上からそれがよく見える。ということは、彼らはスライドを出す直前までは下を向いていたのだ。

ゲンロンカフェは、いわば教会の日曜礼拝みたいなもので、その場にきて触覚的・聴覚的体験(メディア論では、聴覚は触覚の一部である)をすることを目的にしていたわけだ。

シラスは、ゲンロンカフェのオンライン版であり、明らかに聴覚が優位で視覚が補完的な役割だけを持っている。
Siriも、音声だけでは伝えきれない情報を伝えるときだけ補助的に画面に地図やWebサイトを表示するようになっている。

つまり、今の世界はAudio Firstな世界へ移行しつつあると考えておかしくないのだ。
なぜSlackでは伝わらなくてZOOMなら伝わるのか。

テレワークが増えた現代人はむしろ今一番聴覚を重視し始めているのである。

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら

清水 亮(しみず・りょう)

新潟県長岡市生まれ。プログラマーとして世界を放浪した末、 '17年にソニーCSLとWiL LLC.とともにギリア株式会社を設立し、「ヒトとAIの共生環境」の構築に情熱を捧げる。 '17年より東京大学先端科学技術研究センター客員研究員を兼務。著書として「教養としてのプログラミング入門(中央公論社)」「よくわかる人工知能 (KADOKAWA)」「プログラミングバカ一代(晶文社)」など。

RELATED TAG