WirelessWire News Philosophy of Safety and Security

by Category

ビデオ会議 コミュニケーション イメージ

ZOOM飲み会が人類とAIの共進化を加速する

2020.05.05

Updated by Ryo Shimizu on May 5, 2020, 10:57 am JST

ZOOMやWebExといった、ビデオ会議システムの需要が爆増している。

これは少し前までは全く想像できなかったことだ。
特に日本では。

日本の通信事業者にとって、テレビ電話の実現と普及は果てしない夢だった。ドコモやau、彼らが20世紀に作ったプロモーションビデオでは、21世紀とはテレビ電話の時代だった。必ずそういう未来が来るのだと何度も何度も言い聞かせるかのように、彼らはテレビ電話が普及する未来を描き続けた。

しかし実際に21世紀に突入し、携帯電話によるテレビ電話が現実のものになっても、それは普及とは程遠いものだった。

実際に、実現されたテレビ電話は照れくさいし、面倒くさい。その上、料金が高い。

だから遠距離恋愛中の恋人同士とか、離れたところに住む老夫婦と息子夫婦とか、そういう特殊な状況でなければ使われることはなかった。

全世界的な外出自粛によって、人々は急激にテレビ電話を欲し始めた。それがZOOMやWebExといった、本来はテレビ電話として設計されたわけではない会議システムによって代替されるようになった。

ほんの二ヶ月前に、誰が想像できただろうか。
これほどまでに人々がテレビ電話を必要とする状況を。

なぜならば、テレビ電話など使わなくても、もっと簡単でもっと効率的なコミュニケーション、すなわち文字や絵文字やスタンプといったものによるコミュニケーションはとっくに普及していたからだ。

つまり、人は単なるコミュニケーションを求めてテレビ電話を使っているのではない。
事実、僕も普段からあまり会わない相手とは、未だにテキストでコミュニケーションをとるのが普通である。

ではテレビ電話はどのようなときに使うのかといえば、普段顔を合わせていた相手、または平時ならば顔を合わせて話すのが当然という状況のときに、言葉だけでは伝えられないことを含めて伝え合うためにテレビ電話を必要とするのである。

それはもはや「伝える」ことそのものを目的とはしておらず、テレビ電話を起動する真の目的は、言語を超えたコミュニケーション、いわば魂の交流を求めたものに変化しつつある。

筆者はここのところ、二週間に及ぶ無料のZOOM講座「中学生・高校生のためのプログラミング/人工知能の教養講座」を毎朝開講し、ZOOMとYouTubeとで配信した。最初からYouTubeのみで配信すればいいじゃないかと思うかもしれないが、ZOOMで配信することでたとえ言葉を発しなくても、生徒たちが頷いたり、首を傾げたりといった反応を見ながら講義を進めることで理解度を確認しながら講義することができた。

一昨日は、社会人向けの有償講座「shi3zのメディアラボ>」の定例講義を行ったが、これはZOOMのみで開催した。

やはり、言葉が発せられなくても、受講者たちが頷いたり、講義中にチャットで質問されたりすることでスムーズに講義が進行できる。

ミネルヴァ大学の授業はすべてZOOMで行われていると聴くが、たしかにこれなら、実際にキャンパスで行う授業よりも効率が良さそうに思える。

連日連夜のようにZOOM飲み会を開催していた筆者は、むしろ普段よりも沢山の人と知り合った気がする。ZOOM飲み会の場合、友達の友達を誘うのが通常よりも簡単で気楽なのである。

そういうわけで、筆者の周囲では外出自粛によって、むしろ交友関係が増えるという逆転現象まで起きている。

この状況がもう一ヶ月続くとすると、さらなる変化が起きるだろう。
これはいったいぜんたい、今、人類の意識のなにが変わろうとしているのだろうか。

20世紀は情報(Information)の時代だった。
情報という言葉がこつ然と出現し、政治や軍事にとって極めて重要なものとして再認識された。
情報は産業の根幹を変え、産業の中心になり、情報を扱うための技術が飛躍的に進歩した。これが情報技術革命と呼ばれる20世紀最大のムーヴメントである。

情報という言葉が20世紀にこつ然と現れたからといって、それ以前の世界に情報が存在していなかったわけではない。たとえばそれは紀元前3000年以上前の象形文字といった形で現れ始めた。

古代ギリシャの哲学者、ソクラテスの時代は言葉を文字として綴ることが軽視されていた。
したがってソクラテスの言葉というのは弟子たちが記したものしか残っていない。

ソクラテスの弟子のうち最も有名なのがプラトンで、彼は芸術を軽視し、経験主義のような不確かなものを否定した。

話された言葉と書かれた言葉は同じ言葉であっても全く異なるもので、英語と日本語くらいには別のものだ。この2つを結びつけるのは人間の脳だけであって、これが動物が言葉を持たないとされる理由でもある。

特にマクルーハンは、表音文字を持つ人類の出現に大きく注目する。象形文字はその名の通り概念を形で表現した文字だが、表音文字、すなわちアルファベットやひらがなやカタカナのような文字は、文字の形と意味するところ(音)はほとんど関連性がない。

ただ「a」という文字に「えー」とか「あ」とかいう音を割り当てているだけである。ところがこの「えー」という音は、必ずしも全く同じ波長を意味しない。なぜならば同じ「えー」であっても、喋る人の育った環境や体の作りや母語とする言語によって微妙に異なるからである。

表音文字そのものにも「a」と書くか「A」と書くか「α」と書くかいろいろな書き方があり、これらは集団の合意形成によってしか成立しない。

たとえば古代ギリシャ語の「Υ」が「U」と「V」と「W」に分化していった。文化するということは、たぶんひとつの文字「Y」に文化圏によって異なる読み方があったためだろうと考えられる。ローマ帝国が版図を広げる中でさまざまな文化を取り入れていく過程でこうした統合と分割が行われていったのだろう。

日本語でも、「お」と「を」は音が全く同一だが、意味が根本的に異なる。「を」は表音文字でありながら表意文字的な性質を持つ特殊な文字である。

国際音声記号(IPA)では、母音は20種類あり、各言語によって異なる母音の組み合わせを用いる。

つまり表音文字がそのまま音声に変換されていることはかなり稀なのだ。

我々は幼少の頃から表音文字に触れ、文字と音声が当たり前のように統合したものという錯覚を持って生きるためについつい表音文字と実際の音声が全く異なる性質のものであることを忘れがちだが、実際にそれは全く違うものだ。

LINEやメッセンジャーによるテキストコミュニケーションがひどく快適に思えたのは、文字を使うことによって自分のその瞬間の状況や都合をうまく省略して相手に伝えることができるからである。

自宅でリラックスしながら、人に見られたら困るような格好をしていてもまるで紳士のような内容のメッセージを送ることができるのは誰もが認める利点だろう。

しかし仕事に関する打ち合わせを完全に文字だけでやろうとすると多少以上の不都合が出てくることを今回の外出自粛で人々はひどく強く意識したはずなのだ。

文字、すなわち情報だが、情報だけで相手とコミュニケーションが円滑にとれるのは、相手と自分との間に強い信頼関係と薄い依存関係がある場合だけで、そのどちらかが揺らぐと文字以外の非情報を送り合う必要がでてくる。

20世紀以降の人類は、非情報にはほとんど注目してこなかった。それが「ある」ということさえほとんどの場合は見過ごされて来たが、ダイレクトに人と会うことができなくなってしまった現在、情報だけでは埋められないものを求めて人々がテレビ会議に群がっている。

特に驚いたのは、筆者の周りだと、たとえば2月くらいにテレビ会議をしていた頃は、たとえ自宅にいてもカメラをオフにして参加する人のほうが多かった。このときカメラをオフにしていた人々は、情報を重視して情報以外のものは不要なものと考えていたのだろう。

ところが3月に入ると、カメラをオンにする人が増えてきた。4月に入ると、全員がカメラをオンにするようになった。

理由はいくつか考えられるが、ひとつは、テレビ会議においては、カメラがオンの人間のほうが、明らかに発言力が強いからだと考えられる。

人間の顔は飾りではない。特に微妙な内容や、ハードな交渉では顔が物を言うようになってくる。むしろこの状況においては、男性用化粧品が流行するのではないかという気さえしてくる。

カメラ画像をリアルタイムで加工するSnapCameraなどの登場によって、必ずしも自分の顔をそのまま晒す必要がないというコンセンサスが急速に広まって行った。

その結果、顔はなんのためにあるのかと言えば、発言の説得力を増すためにあるのだという考え方に早々に変化していくだろう。

PCとの距離を考えると、テレビ会議ではこれまで以上に顔が物を言う。
大げさなボディランゲージや体格の違いよりも、まず顔である。
半沢直樹の大和田常務がZOOM会議に参加してくることを想像してみるといい。
彼ほど発言に説得力がありそうな顔はいないではないか。

また同時に、いま人類は急速に「記録される会議」の時代に突入した。それは求めていようと求めいなかろうと、あらゆるテレビ会議は記録されうるし、記録可能なものになってしまうのである。

ZOOMにはホスト以外は録画できない機能などが備わっているが、ZOOM本体の機能に頼らなくても記録する方法などいくらでもある。

これまでは会議の内容を録音したり録画したりするというと、相手を疑っているのではないかとか、あとで裁判になるんじゃないかとか、そういう緊張感があったが、これからはすべての会議が記録される前提で行われることになる。

これは結果的にハラスメントを撲滅する方向に向かっていくだろう。

そしてすべての会議が記録される時代というのは、人工知能研究者にとっては夢のような環境である。

すべての会議が記録されることが前提になれば、会議の膨大なデータが蓄積され、それによって人工知能が飛躍的に学習効率を高める可能性が出てくる。

なぜならば、会議の内容は原則として秘中の秘であり、Googleで検索しても決して出てこない内容だったからだ。

会議室にスマートスピーカーがあれば会議の内容はダダ漏れかもしれないが、それは提供各社にとって「聞いてはいけない会話」であるため、おおっぴらに使うことが出来なかった。

そして会議はともかく、飲み会までもがこれまでオフラインにしか存在していなかった情報が可視化され記録されるのである。もちろん記録をとらないこともできるが、一定のプライバシーさえ守られれば記録されて困ることはない、という人も一定数以上いるだろう。

人工知能が人間を知るための究極の方法、という観点から見れば、会議や飲み会、全ての人間同士の交流がオンライン化される状況は、人工知能と人類が共進化する上で決定打になる可能性がある。

別にわざわざ盗み聞きみたいなことをする必要もない。単にZOOM飲み会に参加する人工知能がひとつあればいい。Botのようなもので、可愛くて、話すと楽しい相手であれば十分だろう。

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら

清水 亮(しみず・りょう)

新潟県長岡市生まれ。プログラマーとして世界を放浪した末、 '17年にソニーCSLとWiL LLC.とともにギリア株式会社を設立し、「ヒトとAIの共生環境」の構築に情熱を捧げる。 '17年より東京大学先端科学技術研究センター客員研究員を兼務。著書として「教養としてのプログラミング入門(中央公論社)」「よくわかる人工知能 (KADOKAWA)」「プログラミングバカ一代(晶文社)」など。

RELATED TAG