WirelessWire News Technology to implement the future

by Category

短い文章からAIが自動的にポスターを生成するMicrosoft Designerとスイス・アーミーナイフ

2023.05.02

Updated by Ryo Shimizu on May 2, 2023, 09:17 am JST

Microsoft Designerが使えるようになっていたので使ってみた。
使い方は非常に簡単。MicrosoftアカウントでMicrosoft Designerにログインするだけだ。

すると、プロンプトを入力する画面が出てくる。

デフォルトの例として、インスタグラムへの投稿、みたいなものが書かれている。
たとえば8月2日にBBQパーティと花火大会をやるとして、どんなインビテーションになるのか試してみた。
すると提案されたのがこちらのデザインだ。

なるほど、確かに花火とBBQ。しかも動画を使ったものまである。

作成された動画

何回か試してみて、確かに「額面通り」の動作はするものの、なんとなく思ってしまった。

「これは俺が本当に欲しかったものなのか?」

もしかしたら同じ疑問を、Microsoftの開発者たちも持っているのかもしれない。

たしかに、デザインはできる。しかもすごい速さで、いろんなバリエーションを見せてくれる。
けれども、どうにも、どこか、どこまでいっても、「コレジャナイ」感が滲み出てくる。

いや、たしかにこういうものが欲しかったはずなのだ。
でも、出来上がったものを見ると、なんというか、まるで、暖かみが感じられないのである。

最近毎日シラスというプラットフォームで「モーニングAIニュース」という動画ニュースを配信している。
今朝の放送でもこのMicrosoft Designerを紹介したのだが、そこについたコメントが「ストックフォト感」と表現されていた。
そうなのだ。

もしかして、内部的にはDALL-E2とかで画像を生成しているのかもしれない。実際、Microsoftにはそれができる。
しかし、なんだろう、この当たり前なんだけど「血が通ってない」感じ。

綺麗なんだけど綺麗すぎるというか、もう少し落ち度というか、人間臭さというか、これを受け取った人が「ああ、清水のイベントなんだな」と思えるような匂いがついてない。
もしかすると、その「匂い」は、豊富なカスタマイズ機能で好きにつけければいいよ、ということなのかもしれないけど、逆に出てくるデザインの完成度が高すぎて(決して洗練されているというわけでもないのだが)、何かひとつでも手を加えると蛇足になってしまいそうだ。

たとえば画像とか動画とか(さすがに動画はストックだと思うが)、プロンプトをいじらせてもらえないものだろうか。
もしかして画像も生成していないのかもしれない。

でもそしたらレイアウトのテンプレートに画像と言葉を流し込むだけじゃないの。

たとえばもしもこれを、社内のデザイナーが作ってきたら文句なしにボツにするだろう。
「全然楽しそうじゃない」と言うと思う。

ストックフォトの持つヨソヨソしさを本来は打ち消すかのようにデザインというのはある。
ストックフォトを使えば誰でも「それっぽい」ものを作れると錯覚するが、プロはストックフォトをストックフォトに感じさせないテクニックを持っている。
写真が上滑りせず、ちゃんとそのデザイナーの表現として着地している。それはトリミングひとつ、ガンマ曲線の傾きひとつでそのデザイナーの「個性」になる。

ところがMicrosoft Desingerの出してくるデザインには個性がない。
ちょっとAdobe製品の使い方を練習した高校生が間に合せで作ったようなヨソヨソしさがある。

AIに個性を求めないというのはひとつの考え方だと思うが、いくらなんでも個性がなさすぎではないだろうか。
もしかして、プロンプトをもっと凝らなければダメなんだろうか。

というか、全体的に、Microsoft Designerというツールが、もともとAIを中心に設計されているわけではないのか知らないが、ほとんどのプログラミングパワーが、AIとは直接関係ない、細かいエディット機能に割かれていて、もっとAIを貪欲に活用しようという意欲が開発者から感じられない。

正直、現状のMicrosoft Designerのようなものが最先端のAIの限界だと思われては困る。
AIはもっと楽しく、その人らしさを引き出すようなことができるはずなのだ。

発展途上というか、細かいエディット機能などを除いて仕舞えば、学生が暇つぶしに作れてしまいそうな(悪い意味での)手軽さをMicrosoft Designerからは感じてしまった。
まあ社内全体がGenerativeAIへレッツゴーみたいな状態だとこういうものも生まれてきてしまうだろうが、業界のリーダーとして、こんな中途半端なものをプレビューとして出すのはいかがなものだろうか。

でも、もっと危惧すべきは、Microsoft自体が、AIを「こんな程度のもの」と思っている可能性だ。これもぜんぜん否定できない。なにしろフォントにすらこだわりが全くない会社(こういうのは創業者の考えが色濃くできるものなので)が、どだい「デザイン」を語ることなど、滑稽なのだ、という気もする。

もしもこれがAppleのKeynoteの新機能だと言われたら、「いつものジョークだろう」で済まされてしまいそうなほど、危ういところにこの(あえて製品とは呼ばず)作品はある。

Microsoftは過去何度も、Adobe製品的なものに挑戦してきたが、ひとつとしてうまくいったものがない。
AI時代においても、それがまた証明されてしまった。Adobeだって独自のAIを長年研究しており、貪欲に自社製品に取り入れている。
もしもIllustratorに同様の機能が入るとしたら、もっと遥かに素晴らしいものになるだろう。

そしてこの教訓から学べることは、たとえAIが道具箱に入ったところで、使う人間の持つセンス、もっといえば、価値観にその可能性は大きく制限を受けてしまうということだ。
AIは使うものの想像力の限界を常に受けてしまうのである。

日本語において、想像力という言葉は、良い意味でも悪い意味でも使われる。

良い意味の場合は、クリエイターを讃えるような時に、悪い意味の場合は、ありもしないゲスの勘ぐりや、できもしないような絵空事を考えるような時に使う。

しかし、実際には「想像力(Imagination)」はもっと遥かに重要な意味をもっている。
それは頭の中でシミュレーションをする力だ。

GPTおよびその派生品は、一見するとなんでもできそうでいて、実はそれを実用的に活用する場面を見つけるために使う側の想像力を要するという点で、スイスのアーミーナイフみたいなものだと言える。

たとえば台所に立ってリンゴを剥こうというとき、わざわざスイスのアーミーナイフを使う人はいない。台所の果物ナイフを使うだろう。
いざ食事をするとき、フォークとスプーンをスイスのアーミーナイフで済まそうとする人もいない。爪切り、ハサミ、ドライバー、全て専用品のほうがずっと使いやすいし合理的だ。

スイスアーミーナイフが役立つのは、極限状態の時だけだ。でも普通に生活していたら、そんな場面にはまずお目にかからない。

GPTも使いどころが大事だ。
正直、プロンプトの研究というのはそれほど重要ではないと思っている。

Instructionデータセットのファインチューニングが有効であることからも分かる通り、プロンプトは、学習したデータと対になっている。
ということは、大事なのは、「どのようなデータでファインチューニングして、どのようなプロンプトを使うか」だ。

既製品のGPT4だのそのバリエーションだののプロンプトをいくら研究しても、来年には不要になる可能性が高い。
結局はデータだ。この連載で何度も言っているように、AIの価値はデータの価値で決まるのだ。

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら

清水 亮(しみず・りょう)

新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。

RELATED TAG