「連日のように障害が発生している状態では障害が同時多発的に発生するため、一人で対応することは困難です。しかし、障害がある程度落ち着いた時期には、一次対応者を一人にする方が望ましいと思います。一次対応者のペースで原因調査から、エスカレーションを含む対応の意思決定の経験を積めるからです」 「配信チームでは、障害が落ち着いた時期に一次対応者を一人に変更しました。一次対応者が対応できない場合は、二次対応者に通知され、さらに対応できない場合は全員に障害が通知される体制をとっています。一次対応者を一人にすることで、育成面と運用負荷の両面で改善されました」 配信システムの障害を撲滅してみんなで幸せになった話 - ZOZO TECH BLOG https://techblog.zozo.com/entry/eliminate-notification-system-alert
[Mastodon] 2024-03-23 23:36:36
|