Observability Develop

project-spec -> architecture-design -> domain-develop -> application-develop -> adapter-develop -> observability-develop -> test-develop

선행 조건

adapter-develop 스킬에서 Observable Port와 CtxEnricher가 구현된 후 수행합니다. Functorium의 3-Pillar(Logging/Metrics/Tracing) 파이프라인이 DI에 등록된 상태를 전제합니다.

Functorium 프레임워크는 관측성 수집에 강합니다. [GenerateObservablePort]가 모든 어댑터에 Logging/Metrics/Tracing을 자동 부여하고, CtxEnricher가 비즈니스 컨텍스트를 3-Pillar에 동시 전파합니다.

그러나 수집만으로는 부족합니다. 수집된 데이터를 어떻게 분석하고, 어떤 지표가 건강한지 판단하며, 문제 발생 시 어떻게 행동할지 — 이 전략이 없으면 대시보드는 “보기만 하는 그래프”가 됩니다.

observability-develop 스킬은 이 간극을 메웁니다: instrument → analyze → alert → act.

관측성 설계해줘
대시보드 설계해줘
메트릭 분석해줘
알림 설정해줘
성능 분석해줘

비즈니스 성과 지표를 Functorium의 관측 필드에 매핑합니다:

비즈니스 KPI	기술 메트릭	Functorium 필드
사용자 응답 시간	P95 지연	`response.elapsed` (Histogram)
서비스 가용성	에러율	`response.status` + `error.type`
기능별 사용량	요청 수	`request.handler.name` (Counter)
결제 성공률	성공/실패 비율	`response.status` by `request.handler.name`

지표	Command 기준	Query 기준	External API 기준
P95 지연	< 200ms	< 50ms	< 1000ms
에러율	< 0.1%	< 0.1%	< 1%
처리량	> 100 RPS	> 500 RPS	-

CtxPillar	용도	예시 필드	카디널리티
Logging only	디버그/상세 데이터	요청 본문, 파라미터 상세	무제한
Logging + Tracing (Default)	식별자, 추적 컨텍스트	customer_id, order_id	높음
All (+ MetricsTag)	세그먼트 분석용	customer_tier, region	낮음 필수
MetricsValue	수치 기록	order_total_amount	-

카디널리티 규칙: MetricsTag에는 고유값이 제한된 필드만 사용 (customer_tier: 3~5종, customer_id: 수백만 → 금지).

지표	PromQL 예시	상태
요청 수	`rate(usecase_request_total[5m])`	처리량 추세
성공률	`1 - (error_total / request_total)`	99.9% 이상
P95 지연	`histogram_quantile(0.95, duration_bucket)`	< 200ms
에러율	`rate(error_total[5m]) / rate(request_total[5m])`	< 0.1%
Exceptional 에러	`rate(error_total{error_type="exceptional"}[5m])`	0에 수렴
DomainEvent 처리량	`rate(event_publish_total[5m])`	추세 확인

request.layer × request.category.name × request.handler.name 3차원으로 분해하여 병목을 식별합니다.

문제 신호 감지 시 분산 추적으로 원인을 진단합니다:

Functorium Source Generator가 자동 수집하는 필드입니다.

`error.type`	분류	설명	알림 대응
`expected`	비즈니스 오류	도메인 규칙 위반, 검증 실패	모니터링만 (정상 흐름)
`exceptional`	시스템 오류	DB 연결 실패, 외부 API 타임아웃	P0/P1 알림 (즉시 대응)
`aggregate`	복합 오류	여러 검증 실패 누적	모니터링 (Apply 패턴 결과)

error.code는 도메인 특화 오류 코드입니다. 예: "ProductName.Required", "Order.InvalidTransition".

구성 요소	패턴	예시
Meter Name	`{service.namespace}.{layer}[.{category}]`	`AiGovernance.application.usecase`
Instrument Name	`{layer}.{category}[.{cqrs}].{type}`	`application.usecase.command.duration`

점 구분, 소문자, 복수형을 사용합니다.