WirelessWire News Philosophy of Safety and Security

by Category

小説あらすじ生成AI「ひびのべる」の示す可能性

2020.03.03

Updated by Ryo Shimizu on March 3, 2020, 13:17 pm JST

突然だが、物語の魅力とはなんだろうか。
まずハッキリしていることは、魅力的な物語とそうでない物語があり、どの物語に魅力を感じるかは人によって大きく違う、ということだ。

浜崎あゆみのリアリティあふれる恋愛秘話の物語を魅力的に感じる人もいれば、行ったこともないし見たこともないであろう人が全くの架空の世界について叙述するSF的物語に魅力を感じる人もいる。

おそらく大切なのは、「物語られる」ことであって物語そのものではない。
ところが物語ることは、それなりに難しい。

「翻訳は根本的に二次創作である」と筆者はよく主張している。無数の解釈のありえる原文から、もっともふさわしいパラグラフをそれっぽく作り出す。そこには多分に、翻訳者の経験や個性や現実の認識、原語と原文への理解度が反映されてしまう。

自動翻訳の進歩を示すために、僕は何回もジョン・F・ケネディのライス大学における講演(通称、ムーンスピーチ)を翻訳してきた。しかし未だにこれは自動翻訳でうまい具合にいかない。人間でも手を焼く難易度なのだから当然といえば当然だ。

ただ、翻訳という作業がある種の「創作性」を宿していることにもっと注目してみると、単に海外で書かれた文章を日本語で読んだり、その逆をしたりという以上の可能性を感じ取る人たちもいる。

たとえば、翻訳という作業ができるAIに、文章に宿されたニュアンス(好悪の感情など)を読み取らせる試みがある。この試みは「センティメント分析」と呼ばれる。

他にも、質問に答えさせたり、画像から説明文を生成したりと、この手のAIには多くの夢と可能性がある。

筑波大学の落合研究室の大曽根氏が開発した「ひびのべる」はこうした翻訳AIの応用として物語生成を試みる取り組みだ。たとえば「ひびのべる」はTwitterトレンドキーワードから自動的に物語のあらすじめいたものを生成できる。

これは、下にあるように「#名前の最初をどにすると強そう #安倍はやめろ #bananamoon #三四郎ANN 不二先輩 #超電磁砲T」といったTwitterのトレンドキーワードをもとに、AIが生成したSF小説のあらすじのようなものである。

「#安倍やめろ」から「安倍晴明」が主人公になっているのがおもしろい。
昔から、この手の遊びは存在はしていたが、それらのほとんど全ては、予め指定したキーワードをテンプレートに組み合わせるものでしかなかった。どれだけもっともらしく作られたとしても、全く未知の固有名詞などは出てこないのである。

この「ひびのべる」に対してリプライをキーワードとともに送ると、そのキーワードで作文してくれる。これがなかなか楽しい。

「とんかつ カツ丼 孤独」というキーワードを送ってみると、生成されたあらすじはどことなくトンカツやカツ丼が出てきていながらも、孤独というキーワードにも引っ張られている。

事前学習したデータはなろう小説やブログなどを含む膨大なものであり、それらにクラウドソーシングで「あらすじ」と「キーワード」を人間の手で付け、その対応関係を学んだ。まさに翻訳するのと
同じように。いやもっと雑な感じに。

その結果、孤独といえばグルメであり、とんかつといえば和幸という単語が自然に登場したことがわかる。和幸はシェフの名前になってしまったが。かずゆきとでも読むべきか。

レストラン「ハナノトコ」は、Googleで検索しても出てこない。なんらかの理由で生成された固有名詞なのか、それともなろう小説か何かに出てくる固有名詞なのかはわからない。

「レシピは孤独から開放されるとともに、グルメでもなんでもないです」という一文が光る。

もう一回、今度は短文形式で投げ込んでみた。

あらすじというよりは「うる星やつら」の次回予告みたいになってしまったが、「語彙力向上ウィルス」とか「島全体がとんかつしたとんかつ世界」とか、どことなく心惹かれるキーワードが踊る。そうか。ドン勝の語源はここだったのか(違う)。

他にも「桃太郎 浦島太郎 杉良太郎」でやってみると

とんだ「桃太郎 --another story--」が飛び出してきた。

通常、この手のものは基本的にランダム性のみに頼っているので、出てきても「たまにおもしろいのがあるね」くらいで終わってしまっていた。

手法は違えど、ランダムな単語とテンプレートの組み合わせというのは昔からあったからだ。

しかし、この手法がおもしろいのは、アルゴリズム的な工夫を一切行わずに、教え方、すなわちデータの工夫だけで性能を向上させてきたところである。

自動翻訳のための手法はこれからもどんどん出てくるはずで、それ自体を追求するという研究の方法もあるが、その部分には一切手を加えずに、出てきた成果を使わせてもらうことに徹して、データの食わせ方を変えていったり、クラウドソーシングでできることを工夫していったりすることで、目的に近づいていくというアプローチはかなり現代的なAI開発のアプローチだと思う。

こうしたアプローチは彼の所属研究室がメディア・アートを標榜する落合陽一研究室だからできることなのかもしれない。たぶん通常の工学系の研究室では研究と認めてもらうことは難しいだろう。

「ひびのべる」で遊んでいると、この方向性でどんな工夫をデータに加えれば、よりおもしろいものになっていくか、もしくはこの現状のアプローチの問題点はなにか、といったことにより目が行く。

創作というのは正解がない世界なので、「こうすれば正解」と言えるものがない。つまり評価関数が作れない。あるとすれば使っている人間が結果を気に入るか、気に入らないかしかない。

ひびのべる、誰でも遊べるように敢えてTwitterボットになっているので、お手すきの方はぜひお試しあれ。

https://twitter.com/hibinovel

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら

清水 亮(しみず・りょう)

新潟県長岡市生まれ。プログラマーとして世界を放浪した末、 '17年にソニーCSLとWiL LLC.とともにギリア株式会社を設立し、「ヒトとAIの共生環境」の構築に情熱を捧げる。 '17年より東京大学先端科学技術研究センター客員研究員を兼務。著書として「教養としてのプログラミング入門(中央公論社)」「よくわかる人工知能 (KADOKAWA)」「プログラミングバカ一代(晶文社)」など。

RELATED TAG