カオスエンジニアリングソリューションのリーディングプロバイダーであるHarness(ハーネス)は、同社のカオスエンジニアリングプラットフォームがGoogleのGKE Autopilot上でネーティブに動作するようになったことを発表した。この開発は、ユーザーがセキュリティーを損なうことなく、また回避策を必要とせずに、Googleが管理するKubernetes上でシステムのレジリエンス(復元力)をテストできるようになるという点で、大きな意義を持つ。
カオスエンジニアリングとは、意図的に制御された障害を発生させることで、潜在的なシステムの脆弱性を特定するプロアクティブなアプローチだ。これはインフラストラクチャーの火災訓練に似ており、システムがストレス下でどのように反応するかを理解するのに役立つ。一方、GKE Autopilotは、ノード管理、セキュリティーパッチ、キャパシティープランニングといった運用上のオーバーヘッドを排除するフルマネージドKubernetesサービスだ。しかし、厳格なセキュリティー制限により、カオスエンジニアリングの実験の実行は困難を極めている。
HarnessはGoogleと連携し、自社のカオスエンジニアリングプラットフォームをGKE Autopilotの公式ホワイトリストに追加することでこの問題に対処した。この統合により、HarnessはAutopilotのセキュリティー境界内でカオス実験を実行できるようになり、回避策を講じる必要がなくなる。ユーザーはHarness Chaos Engineeringを導入し、GKE Autopilot上でシステムのテストを簡単に開始できる。
GKE Autopilot上でHarnessを設定するには、簡単な許可リスト設定が必要だ。ユーザーは許可リストを適用し、GKE AutopilotにHarnessのカオスワークロードが安全に実行できることを通知する必要がある。クラスター設定が完了すると、ユーザーはHarnessでAutopilotモードを有効にできる。これは、カオスエンジニアリングの初期設定時、または新しい検出エージェントの作成時に行うことができる。
HarnessとGKE Autopilotの統合により、幅広いカオス実験がサポートされる。これには、リソースストレステスト、ネットワークカオス、DNSの問題、HTTP障害、APIレベルのカオス、ファイルシステムカオス、コンテナライフサイクルテスト、JavaアプリケーションのJVMカオス、Javaアプリケーションのデータベースカオス、キャッシュの問題、時間操作などが含まれる。
この開発は、GKE Autopilotを利用していて、Harnessによるカオスエンジニアリングの実装を希望するチームにとって大きなメリットとなる。Googleのマネージドサービスの利便性とレジリエンステストのメリットのどちらかを選ぶ必要がなくなる。カオスエンジニアリングを初めて導入するチームにとって、Autopilotはインフラストラクチャーの複雑さを軽減するシンプルな環境を提供し、チームはストレス下におけるアプリケーションの動作を理解することに集中できる。
Harnessは、シンプルなCPUストレステストから始め、徐々に複雑なシナリオを検討していくことを推奨している。また、Service Discoveryを設定してアプリケーションマップでサービスを視覚化し、実験中に耐性を検証するためのプローブを追加し、より高度なフォールトインジェクションシナリオを段階的に検討することも可能だ。カオスエンジニアリングの究極の目標は、何かを壊すことではなく、ユーザーに影響を与える前に何が壊れるのかを理解することだ。
出典:Harness
この製品の詳細については、Harness製品ページをご覧ください。