サイレント障害とは
コンピューターシステム上の監視ツールでも検知できない障害のこと。サイレント障害の多くは、パフォーマンスの低下やネットワークの遅延、または通信不能といった状況で発覚することが多い。
通常は、トラブルが発生するとアラートとして検知するが、アラートで検知されない(サイレント)状態でも、ユーザーから「つながりにくい」「遅くて使いものにならない」といったクレームで障害が発覚するケースがある。このような、エラーメッセージとして目に見えない障害のことをサイレント障害という。
サイレント障害はその発生に気付きにくいだけでなく、原因の特定に手間や時間がかかる。そのまま放置してしまうと最終的にネットワークに接続できなくなったり、システム全体に悪影響が及んだりして、大規模な障害につながりやすいため、最近ではサイレント障害の検知や分析を行うための技術や製品が続々と登場している。システム運用においては、障害を速やかに検知して問題を特定し、できるだけ早期に修復するために、監視ツールを導入するのが一般的である。
その代表格がNECの「WebSAM Invariant Analyzer」で、インバリアント分析技術とオリジナル技術を用い、平常時の性能情報からモデルを作成。分析対象となる現在の性能情報との差異から異常を検知する。また、NTTドコモと富士通は、携帯電話網「LTE」の通信プラットフォームのIPネットワーク内におけるサイレント障害を検知し、発生区間を特定する技術を共同で開発している。
この記事を社内で共有し、課題解決のヒントにお役立てください
お客様マイページの「連絡ボード」機能を使って、同じ会社のメンバーと簡単にこのページを共有できます。社内で情報を共有し、組織全体の課題解決や業務効率の向上にお役立てください。
社内のメンバーに共有する(企業で共有する)
- (注)連絡ボードを利用するには企業設定が必要です。