WirelessWire News Philosophy of Safety and Security

by Category

Replicateに新たな作画AIが登場

2022.08.18

Updated by Ryo Shimizu on August 18, 2022, 09:30 am JST

作画AIの進化が止まらない。
手軽に使えるMidjourneyが大きな話題を呼んでいるが、Stability.aiから新たにStability Diffusionモデルが公開され、それが既存のアーティストの画風をあまりにも精緻に模倣することがアーティストから批判されるなど、賛否両論を巻き起こしている。

我が国では今のところ学習データに著作物を利用することは法的に問題ないが、肖像権・パブリシティ権の侵害があれば罪に問われる可能性はあるとストーリア法律事務所の柿沼弁護士は「法律時報8月号」の中で指摘している。

ただ、アーティストの「画風」については、まだなんとも言えない。
たとえば誰かの漫画が極端に他の誰かの漫画に似ていたとしても、「ファンだから模倣した」と言われれば完全に同じキャラクターが登場しているか、もしくはときどき世間を賑わす「トレース疑惑」が持ち上がるかしない限りは剽窃と言い切るのは難しい。

そんな中、以前この連載でも紹介したreplicate.comで新たに高精度な画像生成AIが公開された。

作者のafiaka87氏は、この分野をリードするエンジニアの一人として世界的に知られている。
かなり早くからオープンソースのDALL-Eクローンの学習に貢献し、今回はretrieval-augmented-diffusion(検索拡張分散モデル)という手法による事前訓練済みモデルを公開している。


Blattmann et al. 2022 https://arxiv.org/abs/2204.11824

与えられた指示文(プロンプト)に似た画像を検索し、画像の生成中にそれらを参照しながら最終的な絵を完成させるというモデルになる。
何枚の画像を参考にするかを指定でき、通常は10枚くらいを参照する。参照する画像が多くなると、AIが混乱しておかしな絵が生成される可能性が高まってしまうという。

このモデルの場合、どの画像データベースを参考にするかを別途指示することができる。

筆者が「a scene of the movie police officer riding a horse at street of New York」で生成させた画像はこんな感じになった。

参照するデータベースが異なると同じ文章でも違う結果になる。たとえば上図は「simulacra」というデータベースを使ったが、これを「prompt-engineer」に変えるとこうなる。

replicate.comのモデルはダウンロードして実行できるし、実装は公開されている

自分で改造したり、独自のデータベースを参照させることもできるだろう。
たとえば作家が自分の過去の絵を参考にAIに描かせる、なんていうこともできるかもしれない。研究のしがいのある分野ではないだろうか。

いずれにせよ作画するAIはいま絶好調で、ニーズがあることもよくわかった。
同時にさまざまな問題も発生しているが、作画AIが社会とどう折り合いをつけていくか今後の動向を見守りたい。

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら

清水 亮(しみず・りょう)

新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。

RELATED TAG