AWS属人化で起きる5つの事故。担当者不在でも止まらない運用設計と引き継ぎ対策

AWS運用を支えていた担当者が、ある日突然いなくなる——。

このとき崩れるのは「技術」ではなく、「共有されていない知識」です。例えば、Terraformで管理されていない手動変更が残り再現不能になる。CloudWatchアラートの通知先が個人メールのままで、障害が誰にも届かない。管理者権限が1人に集中していて復旧作業が進まない。こうした“よくある崩壊”は、サービス停止やセキュリティ事故に直結します。もし今、以下に1つでも当てはまるなら要注意です。

・管理者権限が実質1人に集中している

・手動設定が多く、コード化されていない

・障害対応が“あの人頼み”になっている

本記事では、属人化を「設定意図・手順・判断基準が特定個人の頭の中にしかない状態」と定義し、それを壊すためのフレーム「可視化・標準化・冗長化」で、「誰が抜けても回る運用体制」と「抜け漏れのない引き継ぎ」の実践ポイントを整理します。

関連するFAQ

Q. AWS運用が属人化すると何が問題になりますか?

A. 典型的には次の事故が起きます。

・通知未達:CloudWatchアラートが個人メール/退職者に紐づき誰も気づかない

・権限ボトルネック:管理者権限が1人に集中し、障害時に操作できない

・再現不能:手動変更が多く、同じ構成を再作成できない

・誤操作:手順が文書化されておらず本番でミスが起きる

・コスト暴走:意図不明のリソースが放置され請求が急増

Q. 引き継ぎで最低限まとめておくべき情報は何ですか?

A. 次の“具体項目+意図”をセットで残します。

・アカウント/組織構成(OU、請求アカウント、環境分離の方針)

・IAM(管理者権限の所在、ロール設計、緊急時の昇格手順)

・ネットワーク(VPC、サブネット、ルーティング、外部接続)

・主要サービス(EC2/ECS/RDS等の構成図と依存関係)

・監視(メトリクス、アラート条件、通知先)

・運用手順(障害一次対応、ロールバック方法)

・コスト管理(タグ設計、予算/アラート、削減ルール)

※各項目に「なぜこの設計か」を必ず一行で記載

Q. 突然の退職・異動に備えるにはどうすればいいですか?

A. 「可視化・標準化・冗長化」で備えます。

・可視化:構成図、権限一覧、アラート一覧を常に最新化

・標準化:IaC(Terraform/CloudFormation)で手動設定を削減、手順書を固定化

・冗長化:権限と知識を複数人に分散、当番制で実運用を回す

Q. AWS運用の安定化にチェックリストは有効ですか?

A. 有効です。最低限、次をチェックリスト化します。

・アラートの通知先が個人依存になっていないか

・管理者権限が複数人でカバーされているか(ブレークグラス手順含む)

・本番変更がIaC経由で再現可能か

これにより、日常運用と引き継ぎの品質を一定に保てます。

Q. 長期的に属人化を防ぐには何をすべきですか?

A. 単発の引き継ぎではなく、継続運用で崩します。

・ナレッジ共有の場を定例化(障害レビュー、変更レビュー)

・IaCと自動化で“人の記憶”を減らす

・四半期ごとに権限/アラート/コストの棚卸し

「常に誰でも触れる状態」を維持することが鍵です。

👉 詳しい引き継ぎ対策はホワイトペーパーで!

リスク評価・情報リスト・引き継ぎフロー・実践チェックリスト・長期運用体制の構築方法を詳しく解説しています。AWS運用の属人化でお困りの方は、ぜひご活用ください。