データマイニングによるフェイクニュースの選別

NTTデータ経営研究所にてコンサルティング業務に従事後、イタリアに渡る。ローマの国連食糧農業機関（FAO）にて情報通信官として勤務後、英国にて情報通信コンサルティングに従事。現在ロンドン在住。

昨年は、ありとあらゆる国でフェイクニュースの広がりが大問題になりましたが、テクノロジー業界では「AIを使用してフェイクニュースの広がりを防止するべきだ」という声が上がっています。

その具体的な手法の理論はあまり多くないように思いますが、データマイニングによってフェイクニュースを検出しようという研究も進んでいます。

アリゾナ州立大学の Kai Shu氏とHuan Liu氏による研究（A Quick Guide to Fake News Detection on Social Media）では、フェイクニュースをコンテンツの内容、発信元、書き方等に分解して分析するシステムにより、自動的にフェイクニュースを検出します。

フェイクニュースに関する複数のキャラクターを定義し、それらを組み合わせることでフェイクニュースをパターン化して検出するという手法です。

扇動的なニュースは、使われる単語や表現方法にある一定のパターンがありますから、パターンを大量に収集し分類するということは大変有効な方法なのではないでしょうか。

一方で、この手法はフェイクニュースだけではなく、信用できるニュースソースを抜き出すためにも使えそうです。

つまり、良質な情報を配信するサイトを発信元、執筆者、使用される言葉、文章のパターン等で抜き出すわけです。 2000年以前のWeb2.0（今や死語でしょうか？）以前の「人力インデックス」を機械的に行うのですね（私のようなインターネット老人会会員には馴染みのある仕組みですが）。

SNSで特定のインフルエンサーをフォローする人の中には、キュレーションされた情報に触れたいからという人が大勢いるわけですし、一部の新聞や雑誌、個人ニュースサイトの有料購読も増えていますから、昔懐かしい「人力検索」「人力インデックス」的なサービスの需要はあるということです。

現在、インターネットで最も大きな問題は、雑音的な情報が増えすぎてしまって目的する情報にたどり着けないことです。

例えば、プロのレシピを検索したいのに料理の名前を入力すると特定のレシピ投稿サイトばかりが出てきてしまう、医師が執筆した医療情報を探したいのに、検索すると出てくるのは素人のライターが依頼を受けて書いたいい加減なサイトばかりだったりします。後者に関しては、人命に関わることですから社会問題だと考えても差し支えないような気がします。

コンテンツを選別するための仕組みを「より良いコンテンツを分類する」ことに活用することの議論が、もっと活性化するべきなのではないでしょうか。

データマイニングによるフェイクニュースの選別

Newsletter

Related Articles