- CloudWatch 모니터링: 메트릭 설정, 알람 구성, 로그 수집 설정
- CloudTrail 로깅: API 호출 및 보안 이벤트 추적
- 로그 분석: 실시간 로그 모니터링 및 분석 도구
1. CloudWatch 모니터링
(1) 메트릭 설정
- 기본 시스템 메트릭 : EC2, RDS, ALB, Auto Scaling 그룹 등 주요 리소스의 CPU 사용률, 메모리, 디스크 I/O, 네트워크 트래픽 등의 메트릭을 수집
- 커스텀 메트릭
- 애플리케이션 성능 지표 : API 응답 시간, 성공/실패 요청 수 등을 커스텀 메트릭으로 추가
- 비용 모니터링 : AWS 비용 추적 메트릭을 설정하여 리소스 사용 비용을 실시간으로 모니터링
- NGINX/Apache 로그 메트릭 : 애플리케이션 서버에서 수집한 웹 서버 로그 데이터를 CloudWatch에 전송하여 트래픽 패턴 및 에러 로그 추적
(2) 알람 구성
- 리소스 임계치 기반 알람
- EC2 CPU 사용률 80% 초과 시 경고 알람 설정
- RDS에서 커넥션이 과도하게 발생할 경우 알람 설정
- 애플리케이션 성능 기반 알람
- API 응답 시간이 500ms 이상일 경우 알람 전송
- 실패한 요청 수가 5% 이상일 경우 경고 알람 설정
- 비용 알람
- 일일/월간 비용이 설정된 임계치를 초과하면 알람을 통해 비용 관리
(3) 로그 수집 및 분석
- EC2 및 Lambda 로그 수집 : CloudWatch Logs Agent를 통해 EC2 인스턴스의 로그를 실시간으로 수집하고, Lambda 함수 로그도 자동으로 CloudWatch로 전송
- RDS 로그 수집 : RDS에서 Slow Query 로그와 같은 중요한 데이터베이스 로그를 CloudWatch에 저장하여 분석 가능하도록 구성
- ALB 액세스 로그 : ELB에서 수집되는 액세스 로그를 CloudWatch Logs에 전송하여 트래픽 패턴 및 에러 분석
2. CloudTrail 로깅
(1) API 호출 추적
- CloudTrail 설정
- AWS 리소스에 대한 모든 API 호출 기록을 남기기 위해 CloudTrail을 활성화
- 중요한 리소스와 서비스의 API 호출을 모니터링하고, 보안 이벤트나 이상 행동을 추적
- 추적 로그는 S3 버킷에 저장되며, 장기 보관 및 분석을 위한 아카이브 역할을 함
- 로그 통합
- CloudTrail에서 수집된 로그 데이터를 CloudWatch Logs와 연동하여 실시간 알람을 설정하고, 보안 이벤트가 발생할 경우 즉시 통지
- AWS Lambda를 활용해 자동화된 대응(예: 알람 전송, 특정 액션 차단)을 구현할 수 있음
(2) 보안 이벤트 추적
- IAM 및 보안 그룹 설정 변경 추적
- 보안 그룹 및 IAM 정책이 변경되는 API 호출에 대한 로그를 추적하고, 알림 설정
- 민감한 리소스에 대한 접근이 시도되면 CloudTrail 로그를 통해 즉시 인지하고 대응
- S3 액세스 로그 추적
- S3 버킷에 저장된 데이터에 대한 액세스 로그를 CloudTrail로 수집하여, 비정상적인 액세스 시도를 확인
- 민감한 데이터에 대한 읽기/쓰기 액세스가 발생할 경우 알람 전송
3. 로그 분석 및 실시간 모니터링
(1) CloudWatch Logs Insights
- 로그 쿼리
- CloudWatch Logs Insights를 사용하여 EC2, Lambda, RDS, ALB에서 수집된 로그 데이터를 실시간으로 쿼리하고 분석
- 예시 : 특정 시간대에 발생한 HTTP 5xx 에러 로그 필터링, 특정 사용자 IP의 접속 패턴 분석
- 커스텀 대시보드
- CloudWatch 대시보드를 통해 중요한 메트릭 및 로그 데이터를 한 눈에 확인할 수 있는 커스텀 대시보드 생성
- 각종 메트릭을 대시보드에서 시각화하여 애플리케이션 및 인프라 상태를 실시간으로 모니터링
(2) AWS ElasticSearch/Opensearch 연동
- 로그 분석 도구 연동
- CloudWatch Logs에서 수집된 데이터를 AWS Opensearch와 연동하여 보다 고급 로그 분석 및 시각화 기능 활용
- Kibana 대시보드를 통해 실시간 로그 분석을 수행하고, 로그 트렌드 파악 및 이상 행동 탐지
- 실시간 알람 및 대응
- Lambda 함수를 통해 실시간 로그 분석 후, 특정 패턴 또는 에러가 감지되면 자동으로 대응 작업을 수행 (예: 특정 IP 차단, 알림 전송 등)
(3) Amazon GuardDuty 연동 (추가 보안 모니터링)
- 보안 위협 감지
- GuardDuty를 활성화하여 AWS 계정 내 발생하는 보안 위협을 실시간으로 감지
- 비정상적인 API 호출, DDoS 공격 등 보안 관련 이슈를 감지하고, CloudWatch와 연동하여 실시간 알람을 설정
- 위협 분석 및 대응
- GuardDuty에서 감지한 위협 데이터를 기반으로 보안 로그를 분석하고, Lambda 함수를 통해 자동 대응 정책을 설정
'AWS > PROJECT' 카테고리의 다른 글
| [ 배포 자동화 ] (0) | 2024.10.23 |
|---|---|
| [ 요구사항 분석, 아키텍처 설계 ] (0) | 2024.10.23 |
| [ 개요 ] (0) | 2024.10.23 |