ニュースリリース

AIを活用した障害検知システムの運用を開始

~膨大なデータをAIで分析、新たな仕組みで障害を検知可能に~

KDDI株式会社

KDDIは2024年1月25日、LTEのモバイルコアネットワークにおいて、AIを活用した障害検知システム(以下 本システム)の運用を開始しました(以下 本運用)。KDDIは2022年7月に発生した通信障害を受け、通信障害が社会へ与える影響の甚大さを改めて認識するとともに、再発防止に向けた改善と高いネットワーク品質を目指す取り組みを進めており、その一環として本運用を実施しています。
これまでの障害を検知するシステムでは、障害を判断する一定の基準値(固定しきい値)を設定して障害を検知していましたが、昼間に多く使われ、夜間に減少するトラフィック量など、時間帯や平日・休日の違いで値が大きく変動するパターンでは固定しきい値を設定することが難しく、このようなパターンのデータでの障害検知が課題でした。
今回、本システム導入により、複雑な基準値を動的に設定することが可能になり(動的しきい値)、時間帯や平日・休日などの違いで値が大きく変動するパターンの障害検知を実現しました。これにより、監視可能なデータ数を約6倍に増やし、障害を検知できる可能性を大幅に高めることが可能となります。
今後も、障害検知システムの高度化を通して通信障害の大規模化予防に努め、お客さまの生活を支えるネットワーク品質のさらなる向上につなげていきます。

新規ウィンドウが開きます

<本システムの仕組み>

■本システムについて

ネットワークの監視運用業務では、ネットワーク機器から出力されるトラフィック量や接続成功数、機器のCPU利用率などの時系列のパフォーマンスデータを分析し、基準値を超えたことを検知することで障害発生の判断につなげています。
本システムは、過去のパフォーマンスデータのパターンを学習して、予測値を生成します。この予測値と実測値を比較して、大きく乖離がある場合に異常が発生しているものとして障害検知の判断に活用しています。また、過去のパフォーマンスデータには、時間帯や平日・休日などの時系列データに関連する属性も含まれており、これらのデータを使用しより精度高く予測する仕組みを具備しています。

新規ウィンドウが開きます

<本システムによる監視対象の拡大>

例えば、音声接続成功率など、正常時は一定の値となるパフォーマンスデータ(上図①)に対しては固定しきい値を用いて基準値を設定することで異常を検知することができますが、トラフィック量など、時間帯や平日・休日などで傾向のあるパフォーマンスデータ(上図②)に対しては効果的な基準値を設定することができませんでした。本システムでは、時間帯や平日・休日などの属性を含めたパフォーマンスデータを分析することで、例えば、祝日を考慮したパターンとなる予測値を自動的に生成することができるようになりました。
これにより監視対象のパフォーマンスデータ数を固定しきい値だけの適用に比べ6倍に拡大、異常を検知できる可能性を大幅に高めることで、障害の大規模化の予防につなげることができます。

KDDIは、KDDI VISION 2030「『つなぐチカラ』を進化させ、誰もが思いを実現できる社会をつくる。」を目指しています。AIなど最先端技術の活用により通信ネットワークの品質強化を進めることで「つなぐチカラ」を進化させます。今後もお客さまの命、暮らし、心をつなぐ取り組みを継続していきます。

  • この記事に記載された情報は、掲載日時点のものです。
    商品・サービスの料金、サービス内容・仕様、お問い合わせ先などの情報は予告なしに変更されることがありますので、あらかじめご了承ください。