障害検知のため定期的に監視スクリプトを実行しているのですが、サーバ側から外への接続には異常が現れていなかったため発見が遅れてしまいました。
障害回復については、ルータの再起動を行って回線接続を強制的にリセットすることで行いました。
回線異常を自動検知して回復を計るスクリプトを走らせていますが、今回は想定外の障害パターンでした。今回の障害を参考に新しい自己診断の導入して信頼性の向上させる予定です。
--
安冨 伸浩 (マイサイト管理人)
安冨 伸浩 (マイサイト管理人)