KDDI、LTE通信トラブルの原因と対策を説明、300億円の設備投資を決定
2013.06.10
Updated by Naohisa Iwamoto on June 10, 2013, 20:08 pm JST
2013.06.10
Updated by Naohisa Iwamoto on June 10, 2013, 20:08 pm JST
KDDIは2013年6月10日、4月27日から3回にわたって「4G LTE」関連の通信トラブルがあったことに対して、原因と対策を公表した。トラブルは3回とも、LTE基地局制御装置のソフトウエアの2種類のバグに起因する。KDDIでは、総額300億円の設備投資などにより、トラブル対策を施す。
4G LTEのデータ通信サービスにトラブルが生じたのは、すべてLTE基地局制御装置(MME:Mobile Management Entity)のバグが原因だった。4月27日のトラブルは、60バイト以下の断片化したパケットが来た際のフラグメンテーション処理で、MMEがリセットされてしまうバグが最初の原因。多摩のセンターにある2系統のMMEに2つずつあるネットワークインタフェースカードのうち3つがリセットされてしまい、残る1つに信号が集中。呼処理カードのリカバリー処理のプロセスにバグがあり、輻輳状態に陥って2系統あるMMEがトータルでシステムダウンした。
▼一連の4G LTEのトラブルから見えた解決すべき課題
5月29日と5月30日は、このバグを取り除くための修正ファイルを投入する作業で、トラブルが生じた。5月29日は、MMEのうち1台で修正ファイル投入中にハードウエア障害が起こり、リセットを行った。その際にもう1台のMMEに処理を引き継ぐ過程で輻輳が生じ、4月27日と同様のリカバリー処理のバグを呼び起こしてしまった。4G LTEのデータ通信サービスがダウンしただけでなく、加入者情報管理装置(HSS)の輻輳も誘発して音声通信にもトラブルが広がった。5月30日は、手順を見直して修正ファイルを再投入するものの、前日と同様の経緯で4G LTEのデータ通信サービスが利用できない状況になった。
これを受けてKDDIの田中孝司社長は、一連の通信トラブルの課題を整理した。2つのクリティカルなバグの対処、復旧時間の短縮、システム切替時の高負荷耐性の向上である。データトラフィックが膨大になるスマートフォン時代に対応するネットワークを構築するだけでなく、「スマートフォン/4G時代に見合った"機能安全"の確立」を基本方針に掲げた。オペレーションミスやバグがあった場合でも、サービスが継続できるような"フェールセーフ"の考え方で対策を施すとの考えだ。
▼機能安全の確立を基本方針に掲げるKDDIの田中孝司社長
具体的な取り組みとしては、MMEなどの重要設備を分散収容するための設備投資を行う。5月15日時点で230億円の設備投資を決定したが、5月末のトラブルを重く見て6月10日には総額300億円へと積み増した。主な対策のスケジュールは、作業手順の再確立が6月3日に完了、呼処理カードの性能向上や作業手順のトレーニングを6月中に、2種類のバグの解消は8月までに実施する。MMEの設備増設などは下期にかけて実施する計画だ。
▼通信トラブルの課題解決へのスケジュール
KDDIでは、今回の一連の通信トラブルに伴ってデータ通信および音声通信のサービスを利用できなかったユーザーに対して、請求額から一律700円を割り引く措置を取ると発表した。3日のトラブルのいずれかに該当したユーザーが対象で、最大で70万~80万ユーザーが対象になるとの見方を示した。
おすすめ記事と編集部のお知らせをお送りします。(毎週月曜日配信)
登録はこちら日経BP社でネットワーク、モバイル、デジタル関連の各種メディアの記者・編集者を経て独立。WirelessWire News編集委員を務めるとともに、フリーランスライターとして雑誌や書籍、Webサイトに幅広く執筆している。