File tree Expand file tree Collapse file tree 4 files changed +25
-25
lines changed Expand file tree Collapse file tree 4 files changed +25
-25
lines changed Original file line number Diff line number Diff line change @@ -8,9 +8,9 @@ description: 成功するポストモーテムプロセスは、誠実さ、学
88
99まず、ポストモーテムのアクションアイテムがいつ完了すべきかのポリシーを設定します。PagerDutyでは、Sev-1インシデントの再発を防ぐのに必要な高優先度のアクションアイテムは、インシデント後15日以内に完了する必要があります。Sev-2インシデントからのアクションアイテムは30日以内に対処する必要があります。この期待値をエンジニアリング組織全体に伝え、将来的にも参照できるよう文書化してください。
1010
11- アクションアイテムが実行されるためには、明確なオーナーが必要です。私たちはアジャイルとDevOpsの組織であるため、影響を受けたサービスを担当する職能横断チームも、障害の可能性を減らすと見込まれる改善の実装を担当します。エンジニアリングのリーダー陣は、各チームがシステムのどの部分を所有しているかを明確にし、新規開発と運用改善を担当するチームに対する期待値を設定します。オーナーシップの指定は組織全体に伝えられ、誰が何を所有しているのかをすべてのチームが理解し、オーナーシップの認識にギャップがあれば特定できるようにします。**例によって、新たにチームに加わるメンバーのために、将来的にも参照できるようこの情報を文書化してください。**インシデントのアクションアイテムのオーナーシップに不確実なところがあれば、ポストモーテム会議において 、アクションアイテムを所有する可能性のあるすべてのチームの代表者との間で議論します。
11+ アクションアイテムが実行されるためには、明確なオーナーが必要です。私たちはアジャイルとDevOpsの組織であるため、影響を受けたサービスを担当する職能横断チームも、障害の可能性を減らすと見込まれる改善の実装を担当します。エンジニアリングのリーダー陣は、各チームがシステムのどの部分を所有しているかを明確にし、新規開発と運用改善を担当するチームに対する期待値を設定します。オーナーシップの指定は組織全体に伝えられ、誰が何を所有しているのかをすべてのチームが理解し、オーナーシップの認識にギャップがあれば特定できるようにします。**例によって、新たにチームに加わるメンバーのために、将来的にも参照できるようこの情報を文書化してください。**インシデントのアクションアイテムのオーナーシップに不確実なところがあれば、ポストモーテムミーティングにおいて 、アクションアイテムを所有する可能性のあるすべてのチームの代表者との間で議論します。
1212
13- また、チームの作業の優先順位付けを担当するリーダー(プロダクトマネージャーとエンジニアリングマネージャー)をポストモーテム会議に参加させることで 、アクションアイテムの完了に対する説明責任が向上します。プロダクトマネージャーには、よい顧客体験を定義する責任があります。インシデントは顧客体験を悪化させます。ポストモーテムの議論にプロダクトマネージャーに参加してもらい、顧客体験に対する脅威とその体験を改善する方法についてより広い視点を提供してもらいます。これによって、エンジニアリングはこれらのアクションアイテムの重要性を説明し、プロダクトマネージャーがそれに応じて作業の優先順位を付けることができます。同様に、より多くのエンジニアリングのリーダー陣をポストモーテムの議論に参加させることで、技術リソースをどこへどのように投資すべきかの判断につながるような、システムの弱点に関する理解を深めることができます。この文脈を作業の優先順位付けを行うリーダーと共有することで、インシデント分析から発生した高優先度のアクションアイテムを迅速に完了できるよう、チームの取り組みを支援できます。
13+ また、チームの作業の優先順位付けを担当するリーダー(プロダクトマネージャーとエンジニアリングマネージャー)をポストモーテムミーティングに参加させることで 、アクションアイテムの完了に対する説明責任が向上します。プロダクトマネージャーには、よい顧客体験を定義する責任があります。インシデントは顧客体験を悪化させます。ポストモーテムの議論にプロダクトマネージャーに参加してもらい、顧客体験に対する脅威とその体験を改善する方法についてより広い視点を提供してもらいます。これによって、エンジニアリングはこれらのアクションアイテムの重要性を説明し、プロダクトマネージャーがそれに応じて作業の優先順位を付けることができます。同様に、より多くのエンジニアリングのリーダー陣をポストモーテムの議論に参加させることで、技術リソースをどこへどのように投資すべきかの判断につながるような、システムの弱点に関する理解を深めることができます。この文脈を作業の優先順位付けを行うリーダーと共有することで、インシデント分析から発生した高優先度のアクションアイテムを迅速に完了できるよう、チームの取り組みを支援できます。
1414
1515最後に、ポストモーテムのアクションアイテムを見つけやすく、定期的に確認できるようにしておきます。ポストモーテムのアクションアイテムを他のタスクと同様に文書化しましょう。インシデント分析から発生したアクションアイテムのリストは、ポストモーテムの文書にのみ記載しておくだけでは足りません。タスク管理ツールでチケットをオープンし、アクションアイテムを所有するチームのプロジェクト内に配置して、他にも計画されたすべての作業と一緒に表示できるようにします。すべてのチケットに重大度レベル(Sev-1、Sev-2など)と日付タグ(YYYYMMDD)を付けて、特定のインシデントからのチケットを簡単に照会し、重大なインシデント起点でオープンしているチケットの数のレポートを作成できるようにします。
1616
Original file line number Diff line number Diff line change @@ -14,13 +14,13 @@ description: 成功するポストモーテムプロセスは、誠実さ、学
1414
1515私たちは、ポストモーテムが広く共有される前にレビューが行われるよう、経験豊富なポストモーテム作成者のコミュニティを主催することで、ポストモーテムのベストプラクティスをチームが互いに学べるようにすることを奨励しています。これにより、ポストモーテムが書かれている間にフィードバックとコーチングを通じて非難のない分析ができるようになります。
1616
17- また、すべてのポストモーテム会議を共有カレンダーにスケジュールしています 。このカレンダーは会社全体に公開されており、誰でも参加することができます。これにより、エンジニアリングチームはブレームレスを実践し、インシデントの原因を深く分析する方法について互いに学ぶ機会が得られます。また、インシデントは隠しておくべき恥ずかしい失敗ではないことを明らかにします。
17+ また、すべてのポストモーテムミーティングを共有カレンダーにスケジュールしています 。このカレンダーは会社全体に公開されており、誰でも参加することができます。これにより、エンジニアリングチームはブレームレスを実践し、インシデントの原因を深く分析する方法について互いに学ぶ機会が得られます。また、インシデントは隠しておくべき恥ずかしい失敗ではないことを明らかにします。
1818
1919システムの障害について透明性を持つことは、非難のない文化を強化します。ポストモーテムが共有されると、チームはインシデントに対して個人が非難されたり罰せられたりしないことを知ります。これにより、問題が発生したときに発言することへの恐怖が軽減されます。自信を持って情報を共有できる文化を作ることは、チームが協力して改善を設計できる継続的学習の文化につながります。
2020
2121!!! info "重要なポイント"
2222 * 経験豊富なポストモーテム作成者のコミュニティを作り、ポストモーテムのドラフトをレビューし、ベストプラクティスを広めます。
23- * ポストモーテム会議を共有カレンダーにスケジュールし 、関心のある人なら誰でも聞いて学ぶことができるようにします。
23+ * ポストモーテムミーティングを共有カレンダーにスケジュールし 、関心のある人なら誰でも聞いて学ぶことができるようにします。
2424 * 完了したポストモーテムをインシデント対応に関わるすべてのチームにメールで送り、学びを共有し非難のない状態を強化します。
2525
2626---
You can’t perform that action at this time.
0 commit comments