システムダウンとは
業務用サーバーなどの大規模なコンピューターシステムが、ハードウェアやソフトウェアの不具合や停電などの予期しない原因によって動作や機能を停止し、正常な稼動状態でなくなる事態を指す。「フリーズ」「ストール」「ハングアップ」「クラッシュ」「ダウンする」「落ちる」ともいう。
根本的な原因としては、主にハードウェアの故障、ソフトウェアのバグ、アプリケーションソフトの誤作動、自然災害による停電や瞬断、システムに対する過剰な負荷、アクセスの集中による応答性能の低下などがある。
システムダウンを含むシステム障害を防ぐ対策として、無停電電源装置(UPS)の導入、各種ハードウェアの多重化、ソフトの動作テストの強化、ピーク時の負荷に耐える処理性能の確保などがある。また、システムの障害を想定し、担当者の役割分担や応急処置の実施方法を策定する、顧客や社内への連絡の徹底を周知するなど、対応方法を決めておくことが必要だ。障害が発生した後は、原因を調査・究明して次の障害に対応できるようにマニュアルを作成することも重要である。
ただし、システムが停止することがシステムダウンというわけではなく、異常の有無を点検する計画に沿って止める計画停止はシステムダウンとは呼ばない。また、サーバー1台が故障しても処理を継続できればシステムダウンではない。