こんにちは、かびらです。
今回は、CloudWatchについて解説します。
CloudWatchとは、AWSが提供するログ・監視サービスです。
ECSやLambdaなどのAWSリソースのメトリクスやログを収集し、しきい値を超えた際にアラームで異常を検知・通知することができます。
CloudWatchの仕組み

ここでは、CloudWatchの仕組みを見ていきます。
まず、AWSリソースからログとメトリクスが出力されます。
ログはエラーなどの詳細な記録、メトリクスはCPUなどの数値データです。
ここれらをCloudWatchが収集・監視し、しきい値を超えるとアラームが発火、通知されます。
ログは原因調査、メトリクスは状態把握に使います。
CloudWatchを採用した理由

次に、LuxucomでCloudWatchを採用した理由についてです。
Luxucomでは、ECSやLambdaのログを一元管理し、状態監視や障害対応を効率化したいと考えていました。
そのため、CloudWatchを採用しました。
CloudWatchと関連するアーキテクチャ

次に、LuxucomでCloudWatchと関連するアーキテクチャを見ていきましょう。
Luxucomでは、ECSやLambdaから出力されたログやメトリクスをCloudWatchで監視しています。
そして、CloudWatchのアラームによって異常を検知すると、EventBridgeを経由して通知を送信できるようになっています。
CloudWatchを使って良かった点

次に、LuxucomでCloudWatchを使って良かった点です。
CloudWatchを使うことで、ECS・Lambda・ALBなどのログを一元管理できるようになりました。
その結果、ログ確認や調査がしやすくなり、保守対応を効率化できました。
また、障害発生時にもログやメトリクスを素早く確認できるため、状況把握や原因特定を容易にできました。
CloudWatchを使って難しかった点

最後に、LuxucomでCloudWatchを使って難しかった点です。
CloudWatchでは、ログ検索用のフィルター設定を柔軟に行えます。
ただ、その分設定方法が少し複雑で、最初は条件の組み方に苦労しました。
さいごに
今回は、Luxucomのインフラを支える仕組みの中から、CloudWatchについて解説しました。
ログやメトリクスを一元管理し、システムの状態監視や障害対応を効率化する仕組みが理解できたと思います。
次回は、外部からの攻撃を防ぐセキュリティサービスである、WAFについて解説します。


