二年前に上梓した「検索から生成へ」が再び身の回りで話題になっている。
当時はピンと来なかった人も、最近のAIの進歩でようやくわかってくれるようになったらしい。
本書は能天気なまでにAIの進歩を前提としているが、その直感がほとんど全く間違っていなかったことをただ確認する二年間だった。
AIにできることは本書の中で想定した通り増えているが、できないことは変わっていない。
最近、いろいろな動画生成AIが出てきているが、それももちろん本書の中で予言している。それらがオープンソースになることも。
オープンソース(またはオープンウェイト)のAIは、あとからファインチューニングという処理をかけることで、本来知らないものや苦手なことをやらせることができる。動画生成AIも多分に漏れず、「この動きを再現して欲しい」と頼めば、再現してくれるようになる。
最近、動画生成AIのファインチューニングが流行っている。
ただ問題は、「一体何を学ばせればいいのか」という「ネタ」が尽きることだ。
こうなると結局、「自分しか持ってないデータ」を作れる人が一番強い。
こうしたデータは、一種の秘伝のタレのようなものとして、各プロダクションに蓄積されていくようになるだろう。
AIモデルが主役なのではなく、AIに適用できるデータが主役になるのである。
もうしばらくすると、動画を参考に動画を生成する技術も一般化してくる。
そうなると、さらに演出指示がやりやすくなるだろう。
僕は元来、「制約の大きな環境を意外な方法で活用する」企画が得意だった。
アプリが動かない頃の携帯電話でゲームを作ったり、アプリの容量が少ない頃の携帯電話で通信対戦RPGを作ったり、みんなが絶望したりうんざりしたりするような環境で「その手があったか」という企画を立てたりプログラムを書いたりするのが好きだった。
しかし今はそれと真逆の状況で、「制約がほとんどない環境」になってしまった。制約がない環境というのは活用するのが死ぬほど難しい。
もちろん、制約が全くないわけではない。金銭的な制約もあれば、設備の制約もある。しかし、実際のところ、制約はないも同然というほど、今のAIは進歩してしまった。
本書で予言していたのは、「検索するより先に生成するようになる」世界の出現だ。
そして今、実際にそうなりつつある。
TikTokの動画にかなりの数の生成された動画が混ざり始めている。YouTubeもそうだ。実際、そのようなツールを作ったこともある。
GoogleのNotebookLMのように、調べたことをポッドキャスト風に喋ってくれる音声を生成するケースもある。URLを入れると解説動画を生成するサービスもある。
あらゆるコンテンツが生成される時代が本当にやってきた。
制作とは本来、限られた時間と予算の中でベストを目指す、苦痛の伴う行為だ。
しかし制作も制約から解放されつつある。
テレビドラマを作ってる知人から、既に予算が限られたドラマの現場では、グリーンバックで撮影して背景を画像生成して済ませてるらしい。
まあ「それっぽい素材集探して」よりも、「それっぽい写真作って」のほうが遥かに簡単に望みのものが出てくるんだからやむなしだろう。
だがその一方で、いまだにAIでは、人の心を揺さぶるようなものを直接作ることは難しい。
それでもいくつかの物語のパターンをAIが学習してきたことで、最初期(2年前)よりはグッとくるシーンや展開を書けるようになってきているが、それでもそのまま使うことは難しい。かなりの工夫が必要である。
最近は、難しい英語論文をChatGPTに「小学生にもわかるように例え話で説明して」と頼んで生成してもらうのにハマっている。
こうした文章は、それなりに読み応えがある。その読み応えの中心は、もとの英語論文にあるわけだ。つまり完全に生成されたわけではない。
既に人類は、人類が生み出したコンテンツをAIというフィルターを通して生成したものを読む方が、直接読むよりも楽になっている。
この状況も、既に予想されていた。
それを物語形式で読むか、Podcastで聴くかは、完全に受け手の趣味の問題で、むしろ受け手の資質のほうが問われる。
一定程度以上に難しいことは受け手が理解できないので、理解できる範囲で理解させるコンテンツを受け手ごとに生成させたほうが効率がいいのだ。
この傾向はさらにどんどん高まっていくだろう。
人間の作り出すコンテンツはAIのトリガーになっていく。ただ、人間の作り出したコンテンツが完全に消化され雲散霧消するのではなく、その本質をより適切に、受け手に伝えてくれるフィルターの役割を果たす。
最近、スマートニュースの広告や、なぜか古い記事、しかも過去に読んだ記事を表示してくるのが嫌になってきてしまった。
面白い記事との出会いは、最近はGoogleのトップページの方が多い気がする。Googleもまた、どこかでビジネスモデルの根本的な転換を迫られるだろう。既に迫られ始めているが、突破口は見えていないように見える。
あるサービスが支配的な地位をおさめるには、ボース・アインシュタイン凝縮が起きる必要がある。
他のサービスへのスイッチングコストが高くなり過ぎて「これでいいや」と諦めるポイントである。
しかし今のところ、スイッチングコストは限りなく低い。ChatGPTでもGoogle GeminiでもClaudeでもMistralでもDeepSeekでも、どれも無料である程度は使えるし、どれかが落ちて使えなくなったら他のAIを頼ればいい。Googleが落ちたらBingを使えばいいのと同じだ。これは壮大なチキンレースだ。誰かの金が尽きたらそこで終わる。そういう意味では早期に課金サービスを始めたChatGPTやClaudeに生き残りのチャンスがある。
Googleによって検索のボース・アインシュタイン凝縮は決定的なものになった。Googleの武器は、鬱陶しいバナー広告を出さず、検索連動広告に特化したこと。だがそのモデルも限界に近くなっている。
では検索はなくなるのか。
必ずしもなくなるということはないだろう。
検索は普遍的に必要な機能だからだ。
ただ、検索広告がなくなる可能性は依然として高い。
しかも昔に比べると、「検索」を使う機会はどんどん減っている。
昔は、たとえば「AI」で検索したら何が出てくるだろう?という感じで使っていた。
今、たぶん「AI」で検索する人はいない。欲しいものが得られないと経験上知っているからだ。
今検索を使うパターンは、ブックマークのかわりか、知らない単語を調べるときくらいだろう。
これからのプラットフォーム競争は、かなり興味深い進み方をしていくだろう。
まず、AIサービスだけで優劣は付かない。各社学習させるための情報が枯渇しており、賢くするために規模を大きくするのも限界に達しているし、誰かが新しい学習法を見つけると、それをすぐさまライバルに真似されてしまう。最終的にはオープンソースにされてしまう。
ここで生き残るには、独自のデータを作ることに全力を注ぐしかない。
GoogleやMicrosoftのように巨大な資本がある会社は既に何年も前から「他者がもってないデータ」を自力で作り出すことをやっている。たとえば過去に出版された書籍や膨大な音楽データ、動画データ、それらをスキャンして学習に使っていることは公言されている。ただ、これはお金と手間の問題なので、金さえあれば誰でも真似できる。ここは競争力の源泉にはなり得ない。
Twitterあらためx.comが、自社サイトのスクレイピングを禁止したのはかなり理にかなっている。
x.comに保存されているデータは全て独自のものであり、他者に解放しないほうが有利だからだ。
Facebookもその意味ではクローズドなデータセットを持っている点が他社と比べて有利と言える。
そこはGoogleとMicrosoft(OpenAI/ChatGPT)は少し苦しいところだ。さすがにOffice365に蓄積されているデータやGMailのデータには倫理的に手を出せない。YouTubeのデータなら大量にあるが、本当に有用なものはそれほどない。
ということは、人間の価値はコンテンツを作ることなのである。
AIが参考にするコンテンツを作る人間だけが生き残っていける。
コンテンツを作るにはこれまでは特別な才能が必要だったが、今のAIがあれば、才能すら不要になる。
たとえば友達との雑談を録音する。この録音データさえコンテンツになり得る。
この録音データをAIに聴かせて文字起こしして、文字起こししたものをAIに読ませてそこから事実を引き出し、何らかの意味のあるコンテンツを自動生成することができる。
僕は以前、水口哲也氏のインタビューを3時間ほど撮っていたので試しにそれを読ませて5万字の原稿を書かせてみると、固有名詞以外はほとんどそのまま使えそうな文章が出てきた。
このコンテンツを人間が直接消費するか、AIになんらかの別の手段に翻案させるか選ぶことになるわけだが、ボース・アインシュタイン凝縮という観点から考えると答えは自明になっていくだろう。
新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。