• 執筆者一覧Contributors
  • メルマガ登録Newsletter
アビリティストア第一弾はAIラジオドラマ制作スキル

アビリティストア第一弾はAIラジオドラマ制作スキル

June 10, 2026

清水 亮 ryo_shimizu

新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。

Claude Mythosと同等の能力を持つというFable5が発表された。
もはやAIは単純な思考能力を比較しても、僅差でしかないことを最先端のモデルに日常的に触れている人であればあるほど感じていることだろう。重要なのは、AIの能力の差ではなく、それを使う人間の能力の差だと。それが残酷なまでに浮き彫りにされているのが今という時代ではないだろうか。

このような時代、どのAIを使うかという問題は、もはやどのメーカーのスニーカーを選ぶかという問題に過ぎなくなる。つまり、細かな機能性の違いはあれど、一定額を出せば一定のクオリティのものが手に入る、AIのコモディティ化とでもいうべき状態に移行している。

このような時代に重要になるのは、AIそのものよりもむしろAIをどのように使うか、少し前からClaude Code界隈では常識となった、AIのための「スキル(skill)」をどうまとめるかということの方が重要になっている。

その中で筆者は自ら配信する動画番組「教養としてのAI講座」の中で、「能力の商店」となる「アビリティストア」の実験をこの春始めると宣言していた。

しかし、いざ「アビリティ」を商品化しようとすると、単純なノウハウだけではやや物足りない。
誰もが自分の能力を拡張できたと実感できるようなツールの形になっていないと、それは「ちょっと気の利いた名言集」に終わってしまう。

しばらくあーだこーだと悩んでいたのだが、突然、閃いた。

きっかけは、この二年間作り続けているアニメーション映画「The Space Detective」のフッテージを見た時だった。専任のスタッフが毎日この作品を作り続けているのだが、最近の動画生成AIの成長も目覚ましく、「これは!」というカットが月次と出てきた。ただ、声の演技だけはどうも物足りない。

その時、脳裏に去来したのは、何年か前にサンダーバード55の吹き替え版の収録に立ち会ったときの記憶だった。

ナレーションを担当したのは、名ナレーターの故・矢島正明さん。「新世紀エヴァンゲリオン」に大きなインスパイアを与えた「謎の円盤UFO」のオープニングナレーション、クイズタイムショック、矢追純一UFOスペシャルなどのナレーション、スタートレックのオリジナルシリーズのジェームズ・T・カーク船長の声優としても知られる。

その矢島さんがブースにいて、あれこれと音響監督とやりとりする。「謎の円盤UFO」のオープニングシーンでは矢島さんの流れるようなナレーションが大きな魅力なのだが、それを模したものを「サンダーバード55」でやろうと企んだわけだ。これが何テイクも要した。矢島さんにしてみれば、50代の監督など自分の子供か孫の年齢である。それでも体力を振り絞って淡々とナレーションのリテイクに応じていた。そういえば水口哲也さんが、スペースチャンネル5を作る時に、マイケル・ジャクソンが参加してくれることになり、「ポウ!」という音声データを送ってもらったとき、「マイケルのポウ!は、このポウじゃないんだ!」とリテイクしてマイケルがリテイクに応じたという話を思い出した。僕がマイケルだったら、「おれがマイケルで、俺のポウ!がマイケルのポウ!だろ!」と怒り出してもおかしくないが、そうではないのだ。それがプロなのだ。それで彼が腹を立ててなかった証拠に、「スペースチャンネル5」の続編では、マイケルはちょい役からメインキャストに昇格していた。

つまり、たとえ超プロ、プロ中のプロでも、監督は演技を納得いくまで何度も付け直すのである。
たとえば筆者は、自作のエージェンティックAIであるSikiにTwitterとBlueSkyといったSNSを24時間監視させ、毎日自動的に最新のAIニュースを動画形式で読み上げるシステムを作っているが、これはあくまでもニュース的なものなので演技などが必要ない。情報として単に音声から聞いているだけだ。

しかし、物語となると演出は不可欠で、これをひたすら部屋に篭って全てのセリフについてダメ出し、リテイクができたら・・・。それはある意味で人間同士のやりとりだけでは決して不可能な領域の新しいクリエーションにつながるのではないか。

実際の収録だと、あまりに多くリテイクを出すと、声優さんの体力や喉の問題もあって怒って帰ってしまったり、そうならなくても、スタジオを借りている時間との戦いになる。だから必ずどこかで妥協が必要になる。この人の声で喋って欲しい、この人の演技が欲しい、といくら思っても、引き出しきれずに「時間切れ」になることもある。

もしも人間の声優さんで一通り撮ったとしても、あとで「どうしてもこの芝居はリテイクしたい」と思った時に、監督のイメージを伝えるのに少しでもAIが貢献できたら・・・つまり、「こういう感じでお願いできますか」というのを相手の声で指示できたら、それはすごく豊かなクリエイティブにつながるのではないか。

そんなことを考えていたら、ラジオドラマ制作ツール「DramaMaker」ができた。脚本をdocxやpages形式で与えると、それをもとに編集可能なラジオドラマ制作ワークフローに変換してくれるスキルだ。セリフだけでなくSE(効果音)も追加でき、リバーブやエコーなどのエフェクトを加える機能もある

内部的にはIrodoriTTSという音声合成エンジンを使っているが、これが抜群に速い。数秒で9テイクの少しずつ異なる表現のセリフを読み上げてくれる。これをもとに作り込んだら、ずいぶん制度の高い「本読み」ができることになる。

この状態でプレスコまで作り込んでから映像を当てはめる方が、あるいは今風かもしれない。

このスキルを作った時は手元にある自分の友人の音声をベースに作ったのだが、プロではない普通の人の音声で芝居をつくると、なんとヘタクソだということがわかった。これは面白い発見だ。なぜかというと、普通の人は、録音されるような環境で抑揚をつけたり感情表現したりすることに慣れていないので、全てが棒読みになってしまうからだ。

例外は、ごく自然な発言、日常会話でおどけたり、大袈裟に騒いだりするときの音声を使った時で、この時は感情豊かな表現ができるようになる。

IrodoriTTSは、音声サンプルがなくてもそれっぽい音声を生成してくれるのだが、音声サンプルを固定しないと同じキャラクターなのに毎回声が違うという気持ちの悪いことが起きてしまう。

そこで、音声サンプルがない場合に、AI音声をオーディションする機能を第二弾のアビリティストアとして開発中である。

筆者は声優さんの演技にAIは決して勝てないと考えているが、現実問題として、端役やモブまで声優さんで賄うことは不可能に近い。しかし、AIオーディションを活用すると主要なキャスト以外は簡単に作り出すことができ、なおかつクオリティを上げることもできる。

DramaMakerは現在α版で、ごく少数の限られた人たちだけでテスト中だ。

今後は、「アビリティ」とは、「スキル」と「プログラムまたはツール」がセットで提供されることになるだろう。
そうすることによってより柔軟かつ強力な「能力」を提供できることになるからだ。