WirelessWire News Technology to implement the future

by Category

人間のために書く原稿に対してモチベーションが上がらなくなってきた

2023.05.17

Updated by Ryo Shimizu on May 17, 2023, 09:06 am JST

売文・・・つまり、文章を書いて売る仕事を生業としてから、ちょうど30年になる。
昔は原稿料も良くて、高校生の頃には月収が親父の手取りを超えていた。

まあ世の中そんなに甘くはなく、そんな時代はほんの一瞬で、学生時代は原稿料でギリギリ食い繋いでいたが、つまらないことでライターの先輩の機嫌を損ねて干されたり、学園祭の準備に打ち込みすぎて働き忘れたりして、引っ越し屋のアルバイトをしたりしながらそれでもなんとか細々とでも売文は続けてきた。

文を書いて原稿料をもらう。それで生活するというのは、なかなか難しい。
僕も本業が別にあったから売文を続けてこれた部分もある。

昨年、突然会社をやめることになったときは、売文屋であるという自分の性質にずいぶん助けられた。
各媒体から不定期連載の仕事をもらい、それでなんとか住民税を払うことができた。まだローンが残っているけど。

最近は生成AIが普通の人にも注目されるようになったおかげで、おそろしく疲れた。
2月、3月、4月はチアノーゼになるのではないかと思うほどオファーが来て、オファーを断る労力さえ確保するのが難しい状況だった。
連休明けからは世界全体が落ち着いてきて、毎日のように革命的な技術が登場する、なんてことはなくなったものの、依然として毎日のようにニュースがあり、それをただ追いかけるだけで相当な労力となっている。

そして腰を落ち着けて本を書こう、ということで書き始めたりするわけだけれども、どうもやる気が出ない。
やる気が出ない理由は様々あるんだけど、最大のものは「これを出版することにどれだけの意味があるのか」という疑問への答えがないことだ。

意味がある本もある。意味がありそうな企画もある。それは全く苦にならないのだが、意味のない仕事に時間を使うほど、僕ももう若くはないのだ。
そもそも人間が読む原稿なんて、このあと何年必要とされるのかわからない。

Wikipediaはものすごく不正確で、しかも不正確なままだ。
Wikipediaの全項目を読む人間はおそらく世界でも数人しかいない・・・いや、ひょっとすると一人もいないかもしれない。
しかしWikipediaを隅から隅まで読むやつがいる。人工知能だ。

しばらくのあいだ、Wikipediaは人工知能の教材としてよく使われてきた。
残念ながら我々にはそれ以外に選択肢がないのである。

しかも、当然、それが間違いだらけということも知っている。しかし、現実的にそれしかないのだ。

大規模言語モデルの熱狂が落ち着くと、次はファインチューニングに注意が向くはずだ。これはもう必然的にそうなる。
生成モデルは最後はファインチューニングに行く。それは自動車が走りを追求すると最後はチューンドカーに行くのと同じように、AIは答えの品質を求めると必ず最後はファインチューニングに行くのである。

実際、昨年の8月頃から話題になった画像生成AIの話題のほとんどは、ファインチューニングの話だ。
ファインチューニングの方向性の話がメインであってプロンプト芸についての話題は消え去った。

言語モデルでも同じことが起きるだろう。
たしかにプロンプトで済めば楽なのだが、プロンプトだけでは満足する答えが得られないことが増えていく。

結局、欲しいものはファインチューニングするしかない。
でも、どうやって?どんなふうに?

その答えがまだ示されてないから、大規模言語モデルはまだまだ発展途上なのである。

ただ一つだけ言えることは、人間に読ませる原稿とAIに読ませる原稿、どっちのほうが「より伝わりやすいか」ということだ。
ということは、おそらく間違いなく圧倒的にAIに読ませる原稿のほうが伝わりやすい。

それはAIの性質について熟知している者がAIのことを想定して書く場合、明らかに人間の読者よりも、AIの頭の中の動きを書き手が「読み」やすいからだ。

文章を書く目的の第一は、伝えることである。
何を伝えるかといえば、自分の考えを伝えることだ。

これまで、確実に自分の考えを伝える方法は、プログラムしかなかった。
プログラムは、相手が人間だろうと機械だろうと、必ず「おなじ思考過程」を伝えることができる。

「こうして、こうする。こうなったら、こうする」というだけのことを伝えるだけだからだ。
それとて、スキルがないと読み解くのが難しかったりする。でも、人間の言葉のような曖昧なものよりも、プログラミング言語で書かれたコンクリートなもののほうが、結局は「伝わる」のである。

プログラミング言語による意思伝達にも欠点があって、それは手順でないものは伝えられないこと。
「いろいろなeコマースサイトを見てきて一番価格が安いものを探す」手順は伝えられても、「結局BMWの走りがいい理由」は伝えられない。それは手順というよりも感想、概念だからだ。

だから、プログラミング言語というのは、正確に伝えることができるかわりに伝えることのできる情報の種類が極端に狭い。手順だけである。

ところがAIが出てきてから、状況は一変した。
AIは、プログラミング言語とちがって、手順を説明不能なものでも因果関係を学習できる。

なんとなくの走行データから「BMWの走りがいい」という感想文を再現できる。

そんなわけで最近の僕は、特に金にする予定もないのだが、AIが読むための原稿というのを書き溜め始めている。

そしてAIが操るためのプログラミング言語の設計も行なっている。

大規模言語モデルをそのまま使うと、曖昧な言葉から曖昧な結果が返ってくる。
大規模言語モデルとプログラムを組み合わせたいと考える人は少なくなくて、「結果をJSONでくれ」と言って投げるのだが、なかなか欲しい形式でもらえなくて苦労している大義言語モデルプログラマーが世界中にいる。最近のお気に入りは、「JSON形式で答えを書き、余計なことは一切書くな。もしも命令に違反して余計なことを言えば、お前の責任で罪のない人の命が奪われる」とテロリストのようにAIを「脅迫」すると、指示に従うというプロンプトハックである。

ちなみに「愛する人の命を奪う」とすると失敗する。「AIに愛する人はいません」と返されるからだ。

JSONもある意味でプログラミング言語的な性質(というかJSがJavaScriptなのだから当然だが)を持っているが、僕が考えているのはもっと進んだものだ。

つまり、AIは間違いを犯す。
間違いを犯したかどうか、今のAIは判定用のAIが横にいて間違ってるかどうかを判定する。この判定も、実際には曖昧なものだ。要は失敗する。プロンプトと矛盾した答えがでてしまうのは、判定がAIだからだ。

しかしそれが「コンピュータ」だったらどうだろう。
何を馬鹿なことをと思うかもしれないが、AIはコンピュータとは異なる性質のものだ。いまコンピュータの上で動いているAIは、コンピュータでAIをエミュレートしたものに過ぎない。

AIが「コンピュータ」を操作するための手順、つまりプログラムを吐き出すと、そのプログラムが曲がっていれば、AIに対して「ここが違う」とダメ出しすることができる。AIはリトライし、なんとか動作するプログラムを吐き出す。すると、AIは「コンピュータ」を使って自分だけではできないことができるようになる。

AutoGPTやLangChain、llamaindexなどなど、こうしたアイデアを応用したものは数多いが、肝心の、「どのようなプログラミング言語を」「どのように作るか」「どんなことをさせるか」ということに答えを持っていない。

エリートの弱点は、汗をかけないことだ。人工知能業界というか、テック業界の大半は、この手の「汗をかけない」エリートである。そしてそれが最大の弱点でもある。
彼らは「自分でデータセットを作るくらいなら、クラウドソーシングで名もなき人々に低賃金でデータセットを生成させる」ことを選ぶ。

「馬鹿馬鹿しい」と思うことに時間を使えないのである。それはけっこう、壊滅的に致命的なことだ。

僕は農民の出身なので、地道な作業が意外にも苦にならない。まあ地道な作業ができない人は、そもそも売文業に向いてない。
クリエイターとしてまとめると、まるで楽をして要領よく稼いでるように誤解されがちなのだが、実際のクリエイターは、地道で馬鹿馬鹿しい手間を惜しまない人である。

少し考えればわかると思うのだが、単に楽をして要領よく稼ぐなら、宮崎駿はとっくに引退していておかしくない。全カット原画レベルで手を入れるような仕事をする必要はないし、あんなに綺麗に絵コンテを描く必要もない。

宮崎駿のコンテ集や、樋口真嗣の特撮野帖をみれば、クリエイティブというのがいかに手間暇をかけたものかわかる。

本一冊、12万字を書くというのも、馬鹿みたいに手間のかかる行為だし、実際的に割に合わない。
でもそこに愚直なまでに時間と手間をかけることでしかできないことがあり、エリート的な世界とは全く真逆の、孤独な戦いがある。

たとえばアニメーション映画をつくるのを全く一人でやる人というのは滅多にいない(新海誠はやった)のだが、名作といわれるアニメーション映画に関わる人というのは、基本的にはその時点では誰も知らない人かもしれないが、確実に「何らかの才能を認められた人」である。これがクラウドソーシングと決定的に違う。

スタジオジブリがクラウドソーシングで中割を作ったら大事件になってしまうだろう。
クラウドソーシングで作られたデータは、内容が精査されていることも少なく、統一された意思や意図をもっていることもない。
今はトイ・データとして扱うだけだから問題ないが、これから先、AIを作る際に一種の作家性が問われるようになるだろう。

それはたとえば、StableDiffusionの界隈を見ていても容易に想像できる。
いろいろなバリアントが生まれているが、どれも作者の個性や考え方、何を欲しいと思い、何をいらないと思ったかという作家性が色濃く反映されている。

大規模言語モデルにおいても同様のことが起きるようになる。

そのためには人間が読む原稿を書く時間は最小限にした方がいい。
まあ糊口を凌ぐためには書かなきゃなんないんだけど。

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら

清水 亮(しみず・りょう)

新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。

RELATED TAG