写真:yurakrasil / shutterstock
写真:yurakrasil / shutterstock
データを利用するためには、分析者がドメイン(領域に関する)知識を有しているか否かが重要になる。業界や領域の知識を持たない者が分析を行なった場合、バイアスを見抜けずデータが示す内容を見誤ることがあるのだ。現役データアナリストが解説する。
なぜデータ分析にはドメイン知識が必要なのか?
データ分析者にドメイン知識が必要であることは昨今よく指摘されています。データ分析者が特定の業界や領域のドメイン知識を持つことは、分析の意味をより深くし、ビジネスに対する価値を高めるからです。分析対象のドメイン知識を身に付けることは、データをただの数字の集まりでなく意味のある情報として扱うことにつながります。
例えば、医療データを分析する場合、医療の基本的な概念や規制に対する理解がなければ適切な洞察を得ることは簡単ではありません。医療に関する知識がない素人のする分析のほとんどが的外れになってしまうことを、ここ数年で多くの人が実感したのではないでしょうか。
これはビジネスにおいても同様です。商品や市場の特性、法律、規制、商習慣、サプライチェーン、ビジネスモデルなど、データ分析を行うにあたって考慮すべき事項は多くあります。ドメインに関する理解という下地が不足した分析は、正しい結論が得られないどころか誤った意思決定を加速させてしまいます。
なぜこのようなことになってしまうのでしょうか?
例えば、ドメイン知識の不足は課題を理解するうえで大きな障害となります。分析の課題がどのような背景から発生し、どのような分析をすれば解決にたどり着けるのかを把握するためには、その分野を理解している必要があります。
また、データは常にドメインの商習慣などの影響を受けているので、それを理解せずに分析をすると間違った解析結果が導き出されます。つまり、データ分析における課題の設計/データの処理/データの解釈というすべてのステップでドメイン知識は影響してくるのです。
商習慣バイアス、業務の理解、サービス知識という3ジャンル
ドメイン知識にはどのようなものがあるのでしょうか。例えば、法律や規制、ビジネスモデル、プロダクトの知識などなど個別に挙げれば限りがありません。ですから、ここでは3つのジャンルにわけて整理します。
※本稿は、モダンタイムズに掲載された記事の前半部分です。
(ドメイン知識の無い分析の続きを読む)
この筆者の記事をもっと読む
おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)
登録はこちら