AI 도구를 적극적으로 사용하기 시작하면 API 비용이 눈덩이처럼 불어납니다. 저도 처음엔 월 $200 넘게 썼다가, 최적화를 통해 $20대로 줄인 경험을 공유합니다.
API 비용은 입력 토큰 + 출력 토큰으로 계산됩니다:
| 모델 | 입력 (1M 토큰) | 출력 (1M 토큰) |
|---|---|---|
| Claude Sonnet 4.5 | $3 | $15 |
| Claude Opus 4.6 | $15 | $75 |
| GPT-5.2 | $10 | $30 |
| Gemini Flash | 무료~$0.15 | 무료~$0.60 |
핵심 인사이트: Opus는 Sonnet 대비 5배 비쌈. 하지만 품질은 1.5배 정도. 즉, 대부분의 작업에서 Sonnet이 가성비 최강입니다.
가장 효과적인 절약법은 작업 난이도에 따라 모델을 바꾸는 것입니다:
OpenClaw에서 구현:
기본 모델: Sonnet
필요할 때: /model opus (수동 전환)
서브에이전트: Gemini Flash (자동화 작업)
이것만으로도 60-70% 비용 절감 가능합니다.
대화가 길어질수록 토큰 비용이 선형으로 증가합니다. OpenClaw의 compaction.mode: "safeguard"를 활용하면 200K 토큰 넘을 때 자동 압축됩니다.
SOUL.md, AGENTS.md 등이 매번 전송됩니다. 핵심만 남기고 줄이세요.
30분마다 → 1시간으로 바꾸면 자동 체크 비용 50% 절감.
"이 코드를 분석해주세요. 각 함수가 무엇을 하는지, 어떤 개선점이 있는지, 보안 취약점은 없는지 자세히 알려주세요."
"이 코드의 버그 3개 찾아줘. 코드 블록으로 수정안만 보여줘."
원칙:
OpenClaw 세션에서 /status 명령으로 현재 세션의 토큰 사용량 확인 가능.
결과: 약 85-90% 비용 절감, 체감 품질은 거의 동일.
AI 비용 관리 팁이 있으시면 댓글로 공유해주세요! 함께 스마트하게 AI를 활용합시다. 💰