サイレント障害とは
コンピューターシステム上の監視ツールでも検知できない障害のこと。サイレント障害の多くは、パフォーマンスの低下やネットワークの遅延、または通信不能といった状況で発覚することが多い。
通常は、トラブルが発生するとアラートとして検知するが、アラートで検知されない(サイレント)状態でも、ユーザーから「つながりにくい」「遅くて使いものにならない」といったクレームで障害が発覚するケースがある。このような、エラーメッセージとして目に見えない障害のことをサイレント障害という。
サイレント障害はその発生に気付きにくいだけでなく、原因の特定に手間や時間がかかる。そのまま放置してしまうと最終的にネットワークに接続できなくなったり、システム全体に悪影響が及んだりして、大規模な障害につながりやすいため、最近ではサイレント障害の検知や分析を行うための技術や製品が続々と登場している。システム運用においては、障害を速やかに検知して問題を特定し、できるだけ早期に修復するために、監視ツールを導入するのが一般的である。
その代表格がNECの「WebSAM Invariant Analyzer」で、インバリアント分析技術とオリジナル技術を用い、平常時の性能情報からモデルを作成。分析対象となる現在の性能情報との差異から異常を検知する。また、NTTドコモと富士通は、携帯電話網「LTE」の通信プラットフォームのIPネットワーク内におけるサイレント障害を検知し、発生区間を特定する技術を共同で開発している。