PagerDuty(ページャーデューティー)は、インシデント対応の自動化と効率化を推進するため、運用の柔軟性を高める新機能やAIを活用したトリアージの強化を一挙に発表した。今回のアップデートは、チームの管理負担を軽減するオンコールスケジュールの刷新から、各種チャットツール内での迅速な対応、さらにはAIエージェントのデータ連携基盤の拡張まで多岐にわたり、システム全体のレジリエンス(回復力)向上を支援することを目的としている。
まずオンコール管理の基盤強化として、PagerDutyは「シフトベースのスケジュール(Shift-Based Schedules)」機能を導入した。従来の複雑なレイヤー構造を廃止し、一般的なカレンダーツールのように直感的な操作で自動反復するシフトや複数レスポンダーの割り当てを行えるようにした。世界中に分散するチームのタイムゾーンを考慮したローテーションの設定や、メンバー自身による空きスロットへの立候補も容易になり、管理の手間と割り当て漏れのリスクが大幅に削減される。
インシデントからの継続的な学習を組織に定着させるため、PagerDutyはウェブUI上で完結する「事後レビュー(Post-Incident Reviews)」機能を早期アクセスとして公開した。インシデントの解決と同時にタイムライン、対応履歴、Slackでの会話データ、AIによる要約が自動で集約されたレビュー資料が生成される。チームメンバーが同時にドキュメントを共同編集できるリアルタイムライティング機能も備えており、ツールを切り替えることなく摩擦のないスムーズな振り返りとナレッジ共有を実現する。
現場での迅速な意思決定を支えるChatOpsの領域において、PagerDutyはSlackアプリの大幅な機能拡張を実施した。重大なインシデントの発生時に専用のコミュニケーションチャネルを自動生成して関係者を即座に招待するだけでなく、Slackの画面から離れることなくコマンド操作で他の担当者やエスカレーションポリシーを直接呼び出せる機能を追加した。設定画面の一元化やレスポンダーの応答ステータス確認機能も実装され、インシデントのライフサイクル全体をSlack内でシームレスに完結させることが可能となった。
コミュニケーションツールとの連携強化はSlackにとどまらず、Microsoft Teamsの専用チャネルをインシデントワークフローから自動生成するアクションが一般公開となった。インシデント発生時にチーム名やチャネル名を動的に構成して即座に専用の会話スペースを立ち上げられるため、Teamsを主軸とする組織でも手動のセットアップを排除した迅速な自動復旧体制を構築できる。
さらに自律的な運用を加速させるための施策として、PagerDutyは「PagerDuty Advance SRE Agent」の機能を大幅に強化した。インシデントワークフローと連動してアラート検知と同時にエージェントが自動起動し、人間が対応を開始する前に外部ツールからログやメトリクスを収集して初期トリアージや過去の類似事例との照合を行う。提案された復旧手順をインシデント詳細ページから人間がワンクリックで実行できる仕組みも提供され、夜間の不要な呼び出しを減らしつつ平均復旧時間(MTTR)を劇的に短縮する。
また、こうしたAI連携の基盤を拡張する取り組みとして、PagerDutyはMCP(Model Context Protocol)サーバーの機能強化を実施した。アナリティクスやビジネスサービスに関するメトリクス集計、サービス間の依存関係分析などがAIから直接操作可能となっている。実験的ブランチではサービス依存関係グラフやオンコール手当のレポート生成機能も追加され、AIエージェントがより深い運用コンテキストを理解し、自律的な判断を行える環境を整えている。
出典:PagerDuty
この製品の詳細については、PagerDuty製品ページをご覧ください。