WirelessWire News Technology to implement the future

by Category

AI 構造 透明性 イメージ

オープンソースの失われた10年と「オープンソースAI」の行方

2023.12.13

Updated by yomoyomo on December 13, 2023, 07:34 am JST

今年も残り少なくなり、2023年を振り返る記事が出始めてますが、来年を占うというのも年末にありがちだったりします。今年最後は、自分もそういうのをやろうかぼんやり考えていたのですが、先月におけるOpenAIのサム・アルトマンの電撃的解任から数日後の復活という劇的な展開、そして2023年を通して悪目立ちし続けたイーロン・マスクの広告出稿を停止した世界的大企業である広告主に対して「くたばれ」と言い放つ自爆行為を目の当たりにすると、毒気が抜けるというか、一寸先のことすら何も分からんよ、という気分にもなります。

来年の今頃、AGI(汎用人工知能)が人類を支配してても驚かないっすね(投げやり)。

オライリー・メディアのコンテンツ戦略部門のバイスプレジデントのマイク・ルキダスは、未来予測は楽しいけれど、それはテクノロジー分野で何が起きているかを考える良い材料にはならない、自分は予測よりも今ある疑問や問題に目を向けたいと書いており、これは参考にすべき知見に思えます。

ルキダスの文章で挙げられる疑問は、やはり今年を席巻し続けたAI分野の話が多いのですが、それ以外では「オープンソースに対する逆風に対する逆風」として書いていることが目を惹きました。

10年前、我々はオープンソースが勝利したと言った。しかし最近になって、開発者たちはウェブジャイアントの時代におけるオープンソースの妥当性に疑問を投げかけている。2023年、闘いが再び始まった。2024年末までには、これらの質問に対する答えについて、もっと多くのことがわかるだろう。

ここでルキダスが書いている「逆風」とは、オープンソースでビジネスを行ってきた企業が、主要製品のライセンスをオープンソースのライセンスから競合サービスを抑制するライセンスに移行するHashiCorpなどの企業の動き、そしてそれに対するオープンソースコミュニティの反発を指しています。

それとは少し話がズレるのですが、「10年前、我々はオープンソースが勝利したと言った」というので想起した文章を少し前に読んでいたので、今回はまずそれを取り上げたいと思います。

それは、オープンソース・イニシアティブ(OSI)でエグゼクティブ・ディレクターを務めるステファノ・マフリの「オープンソースの失われた10年:人工知能への重要な教訓」です。

個人的には、題名にもなっている「オープンソースの失われた10年」というフレーズに驚きました。もっぱらデジタルエコシステムのインフラとして認められているオープンソースにとって、この10年が失われた10年だったと考えたことはありませんでした。

マイク・ルキダスが書く「オープンソースが勝利した」という10年前の話でなくても、CanonicalのCOOやAmazon Web Serviceのオープンソース戦略部門長を務めたこの界隈のベテランであるマット・アセイは、2019年に「我々は今、オープンソースの黄金時代にいる」と書いています。ステファノ・マフリの認識は、これに真っ向から反するものです。オープンソースの価値観が、モバイルとクラウドという現在の二大分野に大方なじんでいないというのが彼の見方です。

その例として、マフリは2016年にイタリア政府が立ち上げたデジタルトランスフォーメーション省の話をします。イタリア政府というとあまり良い評判はないだろうがとマフリは前置きしますが、イタリアのデジタルトランスフォーメーション省は、オープンソースで国家の公共のデジタルインフラを構築する3年計画を立て、それを実現します。ソフトウェアプラットフォーム、API、パブリッシングツール、そしてデータとガイドライン一式からなるIT部署向けのポータルを構築したのです。

しかしマフリは、その成果である何百万行ものオープンソースのコードやドキュメンテーションをじっくり見た後、がっかりしてため息をつきました。それは確かにオープンソースでしたが、プロプライエタリなクラウドの機能に本質的に結びついていたため、結果的に「オープン」ではまったくなかったのです。

ただそれは、必ずしもイタリア政府の落ち度とは言えません。この10年以上にわたり、オープンソース運動がモバイルやクラウドコンピューティングという課題にしっかり取り組んでこなかったことが原因だとマフリは主張します。プロプライエタリなクラウドの機能性への依存の問題もありますし、イタリア政府の重要なインフラを動かすのにアメリカの大企業に依存するのでは、「オープンソースで国家の公共のデジタルインフラを構築する」という基本方針と矛盾するというマフリの指摘は、ガバメントクラウドにおける国産サービスの参入が話題となった日本にも示唆的かもしれません。

しかし、アメリカのビッグテックが提供する高機能なクラウドサービスを排除したのでは、とてもではないがデジタルトランスフォーメーションの実現がおぼつかない現実があります。問題は、それの代替となる選択肢を持てなかったことです。

それが、オープンソース運動が、クラウドとモバイルという二つのテクノロジーの登場を無視した結果なのだ。オープンソースの価値観は、今日これらのテクノロジーではかなり異質なものになっている。クラウドとモバイルは、フリーソフトウエアに関してGNUマニフェストが、自由を守る手段として発表された1980年代には利用できなかったソフトウェアの開発、配布、そして実行の新しい方法を生み出した。その定義は、現代のコンピューティングには容易に適用できない。

その上でマフリは、ある意味で我々は、GNUソフトウェアがプロプライエタリなUnixワークステーション上でしか動かなかった頃に戻っているというシビアな認識を示します(その環境の多くは、オープンソースソフトウエア上に構築されているにもかかわらず!)。我々は何十年も著作権とコピーレフトに頼ってきたが、このアプローチは現代のテクノロジーに対して限界を露呈しつつあるというわけです。

上で紹介したマイク・ルキダスの文章に書かれる「逆風」、つまりはオープンソースでビジネスを行ってきた企業が、主要製品のライセンスを競合サービスを抑制するライセンスに移行する企業が出てきたのも、クラウドでのオープンソースビジネスが容易に競合相手、特にビッグテックのクラウド大手にコピーされてしまう問題への対策と言えます。

しかし、それでライセンスがオープンソースの定義から外れるのは、その勧進元であるOSIにとって看過できない事態です。

そして、マフリはクラウドとモバイルという二つだけでなく、オープンソースは人工知能と機械学習(ML)の新時代において、危機の瀬戸際に立っており、同じ間違いをする余裕はないと訴えます。AIとMLは、クラウドやモバイルよりもオープンソースの定義にさらに大きな難題を突き付けている、というのがマフリの認識です。それはなぜでしょうか?

AIとMLはソフトウエアとデータの境界を融合する。AIシステムは、著作権法の適用が疑わしい新たな中間生成物をもたらす。生成AIシステムはまた、特許や企業秘密に関する多くの確立された理解に対して、新たな、入り組んだ法的課題を突き付けてもいる。実用的なMLシステムを構築するのに必要な大量のデータは、プライバシー保護からセキュリティ、非差別、アクセシビリティに関する法律、そして基本的人権の保護にいたるまで、他の法律にもすべて影響する。既存のOSIが承認するライセンスの多くは、こうした文脈では無力である。

その前提に加え、大規模言語モデルの発表時に「オープンソース」という言葉が宣伝文句に使われ、それに対しモデルの利用条件が「オープンソースの定義」を満たしていないという批判が起こる事例が、今年は内外でありました。マフリもMetaのLLaMa 2公開時に、そのライセンスがオープンソースではないという声明を出しています

この問題についてマット・アセイは、開発者は原理主義的にライセンスの純粋さにこだわるよりも、ソフトウエアのアクセスや使いやすさを重視すべきだという趣旨の「オープンソースのライセンス戦争は終わった」という文章を書いています。ここで注意すべきは、アセイが現在MongoDBでDevRelの職にあることです。MongoDBは、2018年にGNU Affero General Public License(AGPL)バージョン3からServer Side Public Licenseにライセンスを変更しています。

Server Side Public LicenseはAGPLv3をベースとしながらも、競合相手がそれを使用したサービスをネットワーク経由で提供することに制約を課すもので、OSIによりオープンソースのライセンスではないと明確に否定されています。アセイの上記の主張は、「オープンソース」という言葉の僭称、乗っ取りをAI分野にも広げるものだという批判が容易に予想されます。

「オープンソースAI」という言葉の流行りにもかかわらず、共有され合意された定義がまだないこと、そして、MLモデルにソフトウエアライセンスを適用するのが流行りだが、皆がその条件の適用に同意しているわけではないことをマフリも認めます。そして、OSIはこの問題をただ手をこまねいて見ているだけではありません。

オープンソースの原則を次代のテクノロジーに生かすには、AI/MLの領域に「オープン」の基本理念をどのように適応させるかについて、真剣、慎重、かつ迅速に考えなくてはならない。OSIは利害関係者にAI/ML向けの「オープンソース」の定義の世界的な起草プロセスへの参加を呼びかけている。

OSIが2022年から継続的に開催してきた一連のイベントがDeep Diveであり、Mozilla Foundation、クリエイティブ・コモンズ、ウィキメディア財団、インターネット・アーカイブ、Linux Foundationといったオープンソース/オープンカルチャーの主要団体も参加しているのにOSIの本気度が伝わります。

本文執筆時点で、「オープンソースAIの定義」の最新版はドラフトv.0.0.3ですが、中身を見ても正直まだまだと感じます。マフリによると、2024年中のバージョン1.0公開を目指しているとのことです。

「オープンソースAI」には何が必要でしょうか? Deep Diveにも参加する、商用オープンソースのスタートアップ支援を専門とするベンチャーキャピタルのOSS Capitalのジェネラル・パートナーである弁護士のヘザー・ミーカーは、「AIを信頼するには、それがオープンで透明性がないといけない。以上。」と書いています。

「AIを信頼する」ことについては、信頼には対人信頼と社会的信頼の二つがあり、我々はしばしば両者を混同してしまうこと、そしてAIがこの混同を拡大させる(AIシステムを開発する企業もそれに便乗する)こと、そして社会への信頼を生み出すのが政府の役割、つまり規制であるというブルース・シュナイアーの論も考慮すべきなのですが、それについてはまた別の機会に書くかもしれません。

マフリもオープンソースの価値が、「自律性、透明性、摩擦のないイノベーション、教育、コミュニティの改善」に集約されるのを認めており、「オープンソースAI」を考える上で、「透明性」が重要なのは間違いないでしょう。

それでは、AIにおける透明性とは何でしょうか? ビーナ・アマナス『信頼できるAIのアプローチ』(共立出版)から引用します。

AIに関して言えば、透明性とは、最も単純に、ステークホルダー間で共有されるデータセット、プロセス、用途、およびアウトプットに関する情報のことです。AIにおける透明性とは、ツールの品質を指すのではなく、組織が様々なステークホルダー間でシステムの構成要素と機能に関し、理解を高める方法なのです。(p.63)

このように考えると、透明性はAIに対する信頼を促進するための道標となります。透明性は、正当性と完全性をサポートし、説明責任と新たな法律や規制の遵守につながります。AIにおける透明性はステークホルダーのコミュニケーション方法を決める根拠となりうるのです。(p.64)

ここまで書いて、ワタシがふと思い出したのは、ティム・オライリーが2006年に書いた「オープンソースのライセンスは時代遅れだ」という文章です。内容はタイトルの通りで、マフリが繰り返し書く、クラウドというプログラムの実行環境にオープンソースの価値観がなじまない問題を訴える先駆と言えるものです。

重要なのはオライリーが、我々に必要なのは「オープンサービスの定義」であり、オープンソースの定義と同じくらい深く考えられ、挑発的なオープンサービスのためのガイドライン一式が必要だと訴えていた点です。その後のクラウドとオープンソースの関係を考えるなら、2023年の現在、「オープンソースAIの定義」について真剣、慎重、かつ迅速に意見をまとめる必要があるのは間違いないでしょう。そして、そのためには、「オープンソースAI」がAIにとっての透明性をどのように担保できるかが重要な論点になるように思います。

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら

yomoyomo

雑文書き/翻訳者。1973年生まれ。著書に『情報共有の未来』(達人出版会)、訳書に『デジタル音楽の行方』(翔泳社)、『Wiki Way』(ソフトバンク クリエイティブ)、『ウェブログ・ハンドブック』(毎日コミュニケーションズ)がある。ネットを中心にコラムから翻訳まで横断的に執筆活動を続ける。

RELATED TAG