みずほ銀行システム障害
2021.03.15
システム
21/2/28にみずほ銀行で大規模なシステム障害が発生し記憶に新しいところです。
何と全国約5900台のATMのうち、最大で7割超に相当する4318台で不具合が発生し、キャッシュカードや通帳が取り出し不能になる障害が5244件にも及びました。
主要因は定期預金のデータ更新処理に伴う情報管理テーブルのオーバーフローで、これに伴い勘定系システム全体への悪影響を防ぐ為、勘定系の主要システムを一部制限したことによりATMが取引不能になった模様です。
結局、障害当日の実データ更新処理件数が想定以上であったことが発端のようですが、全てはテスト含め処理件数を適切に見積れなかった事前の想定の甘さに尽きるようです。
また、データ更新処理も深夜ではなく日中帯に実行されたことで多くの問合せにてコールセンターもパンクし、障害をより大きくしてしまった模様です。
これ、システム障害というより完全に人為的ミスですね。
通常、大量のデータ更新や移行を伴う作業はシステム更改と同じく、本番作業以上に、事前作業や準備(適切な計画立案・リハーサル実施・障害発生時の復旧手順確認など)に重みをおくものです。
事前作業が万全であるなら仮に障害が発生しても現場も混乱を必要最低限に抑えることができる為、結果的に被害を最小限にとどめられるものです。
というより通常は最悪を想定して本番作業前に事前準備を行うものです。
これができなかったのは、コロナ禍に伴うコミュニケーション手段や頻度の変化・人員不足など様々な要因が複合的に影響したと思いますが、システム運用体制に甘さがあったと言わざるを得ません。
キャッシュカードや通帳がATMから戻ってこないなど通常考えられない障害で、みずほ銀行にはきちんと原因究明してもらい且つ実行できる再発防止策を強く期待します。