WirelessWire News Technology to implement the future

by Category

トラフィック量で見るヘビーユーザーの特徴

2011.10.28

Updated by WirelessWire News編集部 on October 28, 2011, 18:30 pm JST

本稿は、株式会社インターネットイニシアティブ(IIJ)のインターネットの最新の技術動向・セキュリティ情報を紹介する技術レポート「Internet Infrastructure Review vol.012(2011年8月19日)」に掲載された「ブロードバンドトラフィックレポート」の一部を抜粋・編集して掲載したものです。脚注などを含む全文はこちらでお読み下さい。なお、図版番号については原文に準拠しています。(編集部)

使用しているデータについて

個人及び法人向けのブロードバンド接続サービスでファイバーとDSLの利用者を収容しているルータから、SampledNetFlowによって収集したデータを利用しています。ブロードバンドトラフィックは平日と休日でその傾向が異なるため、1週間分のデータを解析の対象にしています。今回は、2011年5月30日から6月5日までの1週間分のデータを、前回解析した2010年5月24日から30日の1週間分のデータと比較します。

全体ではアップロード量よりも一桁多いダウンロード量

まずは、ブロードバンド利用者の1日の使用量をいくつかの視点から見ていきます。ここでの1日の使用量は、各利用者の1週間分のデータを7で割った1日平均です。図-3に、利用者の1日の平均使用量の分布(確率密度関数)を示します。ここでは、IN(アップロード)とOUT(ダウンロード)に分け、X軸に利用者のトラフィック量、Y軸にその出現確率をそれぞれ示しています。また、図-3の左側では2010年と2011年を、右側では2005年と2011年をそれぞれ比較しています。X軸は対数表示で、その範囲は10の4乗(10KB)から10の11乗(100GB)です。

最も使用量が多い利用者のトラフィックは1.2TBにも及び、一部の利用者がグラフの範囲外になりますが、おおむね10の11乗(100G)までの範囲に分布しています。なお、グラフ左側に現れている突起は、サンプリングレートの影響によるノイズです。

IN(アップロード)とOUT(ダウンロード)の各分布は、片対数グラフ上で正規分布となる、対数正規分布に近い形をしています。これは、線形グラフにおいて左端近くにピークがあり右方向になだらかに減少する、いわゆるロングテールな分布になります。OUTの分布がINの分布より右にあり、ダウンロード量がアップロード量よりも1桁ほど大きくなっています。

▼図-3 利用者の1日のトラフィック量分布(左側:2010年と2011年の比較、右側:2005年と2011年の比較)
201110281800-1.jpg

===

ヘビーユーザーはIN/OUTのトラフィックが対称

IN(アップロード)の分布の右端に注目してみると、もう1つの小さな分布の山があることに気付きます。実際にはOUT(ダウンロード)の分布にも、メインの分布に重なっていますが同様の分布の山があります。これの分布は、INとOUTでほぼ同じ位置にあり、IN/OUTのトラフィックが対称であるヘビーユーザの存在を示しています。

そこで、ここでは便宜上、大多数を占めIN/OUTのトラフィックが非対称な分布を「クライアント型利用者」、右側にある少数でIN/OUTのトラフィックが対称なヘビーユーザの分布を「ピア型利用者」と呼ぶことにします。

表-1に、トラフィック量の平均値と、分布の頂点である最頻出値の推移を示します。平均値はグラフ右側に存在するヘビーユーザの使用量の影響を受けるので、2011年の平均値はIN(アップロード)が432MB、OUT(ダウンロード)が1,001MBでした。2010年では、それぞれ469MBと910MBでしたので、INが減少しOUTが増えています。

▼表-1利用者の1日のトラフィック量の平均値と最頻出値の推移
201110281800-2.jpg

クライアント型利用者での分布の最頻出値を2010年と2011年で比較すると、IN(アップロード)で7MBから8.5MB、OUT(ダウンロード)で145MBから223MBにそれぞれ増え、特にダウンロード量が増えていることが分かります。

===

トラフィック量に占めるヘビーユーザーの割合は減少傾向

2005年と2011年を比較している図-3の右側に注目すると、一般利用者の使用量が着実に増えているのに対して、量的に大勢を占めるヘビーユーザの使用量が横ばいであり、その割合が減ってきていることが分かります。

図-4では、ランダムに抽出した利用者5,000人のIN/OUT使用量をプロットしています。X軸にOUT(ダウンロード)、Y軸にIN(アップロード)を採り、両対数グラフで表しています。IN/OUTのトラフィックが同量である利用者は、グラフの対角線上にプロットされます。

▼図-4 利用者ごとのIN/OUT使用量
201110281800-3.jpg

ここでは、2つのクラスタが見られます。対角線の下側にあり、対角線に沿って広がるクラスタは、OUT(ダウンロード)量がIN(アップロード)量よりも1桁多いクライアント型利用者です。一方、右上の対角線上あたりを中心に薄く広がるクラスタは、ピア型利用者です。しかし、この2つのクラスタの境界はあいまいです。

これは、実際には、クライアント型利用者もSkype等のピア型アプリケーションを利用し、ピア型利用者もWeb等のダウンロード型アプリケーションを利用しているためです。つまり、多くの利用者は両タイプのアプリケーションを異なる割合で使用しています。また、各利用者の使用量やIN/OUT比率のばらつきも大きく、多様な利用形態が存在することがうかがえます。この傾向は、2010年と比較しても、ほとんど違いがありません。

※ポートごとの使用量からみたトラフィックの内訳については、本編をご覧下さい。
全文:Internet Infrastructure Review vol.012「ブロードバンドトラフィックレポート」

 
文・長 健二朗(株式会社IIJイノベーションインスティテュート 技術研究所 所長)

WirelessWire Weekly

おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)

登録はこちら