검색어를 입력하세요.

Claude AI 프롬프트 잘 쓰는 법, 토큰 절약까지 함께 정리

간지뽕빨리턴님 2026. 5. 1. 09:44
반응형
 
Claude AI 사용량 줄이는 현실적인 방법

Claude AI 토큰, 생각보다 빨리 줄어든다면 이렇게 써보세요

Claude AI나 Claude Code를 쓰다 보면 “분명 별로 안 쓴 것 같은데 왜 벌써 사용량이 줄었지?”라는 생각이 들 때가 있습니다. 저도 개발 작업에 Claude를 붙여 쓰면서 가장 많이 신경 쓰게 된 부분이 바로 토큰과 컨텍스트 관리였습니다. 그래서 이번 글에서는 어렵게 설명하기보다, 실제로 바로 적용할 수 있는 방식으로 Claude 토큰을 아끼는 방법을 정리해보려고 합니다.

Claude AI를 더 오래, 더 효율적으로 쓰기 위한 토큰 관리 방법

먼저 결론부터 이야기하면

Claude 토큰을 아끼는 가장 좋은 방법은 단순히 질문을 짧게 쓰는 것이 아닙니다. 더 중요한 것은 Claude가 매번 다시 읽어야 하는 내용을 줄이는 것입니다.

Claude는 질문 하나만 보는 것이 아니라 이전 대화, 읽은 파일, 명령 실행 결과, 로그, 설정 파일, MCP 도구 정보까지 함께 참고할 수 있습니다. 그래서 대화가 길어지고 파일을 많이 읽을수록 토큰 사용량은 자연스럽게 늘어납니다.

쉽게 말하면, Claude에게 계속 두꺼운 참고자료를 들고 일하라고 시키면 그만큼 에너지를 더 쓰게 됩니다. 토큰 절약의 핵심은 “필요한 자료만 얇고 정확하게 건네주는 것”입니다.

목차

1. Claude 토큰이 빨리 줄어드는 이유

Claude를 사용할 때 토큰은 내가 입력한 질문에만 쓰이는 것이 아닙니다. Claude가 답변을 만들기 위해 참고하는 전체 문맥에 토큰이 사용됩니다.

구분 무엇을 의미하나? 왜 조심해야 하나?
질문 내용 내가 Claude에게 직접 입력한 문장 모호하게 쓰면 되묻거나 잘못 작업해서 재작업이 생깁니다.
이전 대화 같은 세션에 쌓인 과거 질문과 답변 새 주제인데도 예전 문맥이 계속 남아 있으면 비효율적입니다.
파일 내용 Claude Code가 읽은 소스코드, 문서, 설정 파일 전체 프로젝트를 무작정 읽히면 토큰이 빠르게 늘어납니다.
터미널 결과 빌드 로그, 테스트 결과, 에러 로그 긴 로그를 그대로 붙이면 실제 원인보다 주변 정보가 더 많아집니다.
MCP 도구 정보 외부 도구, DB, API 연결 정보 필요 없는 도구까지 켜두면 컨텍스트 관리가 복잡해질 수 있습니다.

제가 느낀 가장 큰 낭비 포인트

가장 큰 낭비는 “Claude가 뭘 봐야 할지 모르는 상태”에서 작업을 시작할 때 생깁니다. 예를 들어 “프로젝트 전체 확인해서 오류 고쳐줘”라고 하면 Claude는 관련 없는 파일까지 탐색할 가능성이 큽니다. 반대로 “이 로그인 오류는 Login.tsx와 authService.ts 쪽 문제 같아. 이 두 파일 중심으로 봐줘”라고 하면 훨씬 효율적입니다.

2. Claude Code에서 꼭 쓰면 좋은 명령어

Claude Code를 사용한다면 아래 명령어들은 꼭 알아두는 것이 좋습니다. 특히 개발 작업을 오래 하다 보면 세션이 길어지고, 파일도 많이 읽고, 테스트 로그도 누적되기 때문에 사용량 관리가 중요해집니다.

명령어 역할 이럴 때 사용하면 좋음
/usage 현재 세션의 사용량과 비용 정보를 확인합니다. 작업 전후로 사용량이 얼마나 늘었는지 확인할 때 좋습니다.
/context 현재 컨텍스트 사용량을 시각적으로 보여줍니다. 무엇 때문에 컨텍스트가 무거워졌는지 보고 싶을 때 좋습니다.
/clear 비어 있는 새 대화로 시작합니다. 완전히 다른 작업을 시작할 때 좋습니다.
/compact 지금까지의 대화를 요약해서 컨텍스트를 확보합니다. 같은 작업은 이어가야 하는데 세션이 너무 길어졌을 때 좋습니다.
/model 사용할 Claude 모델을 변경합니다. 간단한 작업과 복잡한 작업의 모델을 나누고 싶을 때 좋습니다.
/effort 모델의 추론 강도를 조절합니다. 간단한 작업에서는 낮추고, 어려운 분석에서는 높일 수 있습니다.
/mcp MCP 서버 연결 상태를 관리합니다. 외부 도구 연결이 많을 때 점검용으로 좋습니다.

실제로 이렇게 쓰면 편합니다

# 현재 사용량 확인
/usage

# 현재 컨텍스트가 얼마나 찼는지 확인
/context

# 완전히 다른 작업을 시작할 때
/clear

# 같은 작업을 이어가되 문맥을 줄이고 싶을 때
/compact 지금까지 수정한 파일, 남은 작업, 주의할 점 중심으로 요약해줘

# 모델 변경
/model sonnet

# 간단한 작업이면 추론 강도 낮추기
/effort medium
개인적으로는 새 기능 개발을 시작하기 전에 /clear, 긴 작업 중간에는 /compact, 사용량이 이상하게 빨리 줄어든다고 느낄 때는 /context를 먼저 확인하는 방식이 가장 편했습니다.

3. 질문을 어떻게 써야 토큰을 아낄 수 있을까?

Claude에게 질문할 때는 짧게 쓰는 것보다 정확하게 쓰는 것이 훨씬 중요합니다. 질문이 짧아도 모호하면 Claude가 여러 방향으로 추측해야 하고, 그 과정에서 파일을 더 많이 읽거나 답변을 여러 번 다시 만들게 됩니다.

아쉬운 요청 예시

이 프로젝트 전체적으로 오류 좀 고쳐줘.
성능도 개선하고 코드도 정리해줘.

이런 요청은 사람에게 말해도 범위가 너무 넓습니다. Claude 입장에서도 어디부터 봐야 할지 애매하기 때문에 불필요한 탐색이 늘어날 수 있습니다.

좋은 요청 예시

목표 : 로그인 화면에서 아이디와 비밀번호를 입력하지 않았을 때 안내 문구를 보여주고 싶어.

확인할 파일 :
- src/pages/Login.tsx
- src/services/authService.ts

조건 :
- API 응답 구조는 바꾸지 말 것
- 기존 디자인 톤은 유지할 것
- 관련 없는 파일은 수정하지 말 것

결과물 :
1. 수정한 코드
2. 수정한 파일 목록
3. 왜 이렇게 바꿨는지 설명
4. 실행해야 할 테스트 명령어

이렇게 적으면 Claude가 봐야 할 범위가 줄어듭니다. 결국 토큰을 아끼는 질문은 “적게 말하는 질문”이 아니라 “헷갈리지 않게 말하는 질문”입니다.

프롬프트에 넣으면 좋은 항목

  • 목표 : 무엇을 해결하고 싶은지 한 문장으로 적습니다.
  • 범위 : 확인해야 할 파일, 폴더, 기능명을 알려줍니다.
  • 제외 조건 : 건드리면 안 되는 파일이나 정책을 적습니다.
  • 출력 형식 : 코드, 요약, 표, 체크리스트 등 원하는 형태를 지정합니다.
  • 검증 방법 : 테스트 명령어, 기대 결과, 화면 조건을 알려줍니다.

4. 모델 선택도 비용 관리다

Claude를 쓸 때 무조건 가장 강력한 모델만 쓰는 것이 정답은 아닙니다. 복잡한 설계나 깊은 분석에는 고성능 모델이 좋지만, 단순한 문서 정리나 작은 코드 수정까지 전부 고성능 모델로 처리하면 효율이 떨어질 수 있습니다.

상황 추천 방향 이유
짧은 요약, 단순 문장 정리 가벼운 모델 사용 복잡한 추론이 필요하지 않기 때문입니다.
일반적인 개발 작업 Sonnet 계열 중심 속도와 품질의 균형이 좋습니다.
복잡한 장애 분석, 구조 설계 Opus 계열 또는 높은 effort 깊은 추론이 필요한 작업에 적합합니다.
설계와 구현을 나누는 작업 계획은 강한 모델, 구현은 일반 모델 비용과 품질을 함께 관리하기 좋습니다.
제가 추천하는 방식은 처음부터 최고 모델로 끝까지 가는 방식이 아닙니다. 먼저 일반 모델로 범위를 잡고, 진짜 어려운 판단이 필요한 순간에만 강한 모델을 쓰는 방식이 더 현실적입니다.

5. CLAUDE.md는 짧고 정확하게 관리하기

Claude Code를 쓰다 보면 프로젝트 루트에 CLAUDE.md 파일을 만들어 프로젝트 규칙을 적어두는 경우가 많습니다. 이 파일은 굉장히 유용하지만, 너무 길게 쓰면 오히려 매번 Claude가 읽어야 하는 기본 정보가 많아질 수 있습니다.

좋은 CLAUDE.md의 기준

  • 프로젝트 전체에 항상 필요한 규칙만 적습니다.
  • 특정 작업에서만 필요한 설명은 별도 문서로 분리합니다.
  • 중요한 규칙은 파일 상단에 배치합니다.
  • 장황한 설명보다 명령어, 경로, 금지사항 중심으로 작성합니다.
  • 오래된 규칙은 주기적으로 정리합니다.

CLAUDE.md 예시

# Project Guide

## Stack
- Frontend : React + TypeScript
- Backend : Node.js + Express
- Database : PostgreSQL

## Rules
- API 응답 구조는 임의로 변경하지 않는다.
- 기존 class naming 규칙을 유지한다.
- 작업 전 관련 파일을 먼저 확인하고, 최소 범위만 수정한다.
- 수정 후 변경 파일 목록과 테스트 명령어를 설명한다.

## Commands
- npm run lint
- npm run test
- npm run build

핵심은 간단합니다. Claude가 매번 알아야 하는 정보만 CLAUDE.md에 두고, 나머지는 필요할 때만 불러오는 방식이 좋습니다.

6. MCP와 로그는 필요한 만큼만 쓰기

MCP는 Claude Code를 외부 도구, 데이터베이스, API, 이슈 트래커와 연결할 수 있게 해주는 강력한 기능입니다. 하지만 도구를 많이 연결한다고 무조건 좋은 것은 아닙니다. 현재 작업과 관련 없는 도구까지 많이 켜져 있으면 컨텍스트가 복잡해지고, 분석해야 할 정보도 늘어날 수 있습니다.

MCP 사용 시 기억할 점

  • 현재 작업에 필요 없는 MCP 서버는 꺼둡니다.
  • DB 전체 스키마보다 관련 테이블만 알려줍니다.
  • 이슈 전체 목록보다 관련 이슈 번호를 지정합니다.
  • 도구 결과가 너무 길게 나오지 않도록 제한합니다.

로그 분석도 똑같습니다

에러를 찾겠다고 서버 로그 전체를 Claude에게 넘기는 것은 비효율적입니다. 대부분은 최근 에러, 실패 구간, 예외 메시지 주변만 봐도 충분한 경우가 많습니다.

# 비효율적인 방식
전체 app.log 파일을 그대로 붙여넣기

# 조금 더 나은 방식
grep -i "error\|fail\|exception" app.log | tail -100

# 테스트 실패 부분만 보고 싶을 때
npm test 2>&1 | grep -A 5 -E "FAIL|ERROR|Exception"
로그는 많이 줄수록 좋은 것이 아니라, 원인에 가까운 부분만 주는 것이 좋습니다. Claude도 사람처럼 잡음이 많으면 핵심을 찾는 데 더 많은 비용이 듭니다.

7. 프롬프트 캐싱은 언제 좋을까?

프롬프트 캐싱은 같은 지시문, 같은 문서, 같은 예제, 같은 배경 설명을 반복해서 사용할 때 효과가 있습니다. 특히 API로 Claude를 직접 사용하는 경우라면 캐싱 전략을 잘 설계하는 것만으로도 비용과 응답 속도 면에서 도움이 될 수 있습니다.

효과적인 경우 효과가 적은 경우
항상 같은 시스템 프롬프트를 사용하는 경우 매번 완전히 다른 질문을 하는 경우
긴 문서나 예제를 반복해서 참고하는 경우 짧은 일회성 질문만 하는 경우
API 기반 자동화 워크플로우를 만드는 경우 Claude 웹 화면에서 간단히 질문하는 정도인 경우
같은 코드베이스 규칙을 계속 주입하는 경우 매번 다른 프로젝트를 짧게 확인하는 경우

개발자라면 이렇게 생각하면 쉽습니다

반복되는 긴 입력은 캐싱하고, 단순 작업은 가벼운 모델로 보내고, 긴 로그는 미리 줄이고, 복잡한 판단만 강한 모델에게 맡기는 구조가 좋습니다. AI 사용량 최적화는 결국 “입력을 어떻게 설계하느냐”의 문제에 가깝습니다.

8. 바로 적용할 수 있는 실전 체크리스트

상황 추천 행동 사용하면 좋은 방법
새로운 작업을 시작할 때 이전 문맥이 필요 없으면 새로 시작합니다. /clear
작업이 길어졌을 때 중요 내용 중심으로 요약합니다. /compact
사용량이 빨리 줄어드는 느낌이 들 때 현재 컨텍스트 사용량을 확인합니다. /context, /usage
간단한 코드 수정 일반 모델과 낮은 effort를 사용합니다. /model, /effort medium
복잡한 설계나 장애 분석 강한 모델을 잠깐 사용합니다. Opus 계열 또는 high effort
로그 분석 전체 로그가 아니라 실패 부분만 전달합니다. grep, tail, 에러 필터링
프로젝트 규칙 관리 CLAUDE.md를 짧게 유지합니다. 핵심 규칙만 작성
MCP 사용 필요한 MCP만 연결합니다. /mcp, /context

마무리 : Claude를 오래 잘 쓰려면 컨텍스트 관리가 핵심입니다

Claude AI를 잘 쓰는 사람은 질문을 무조건 짧게 쓰는 사람이 아닙니다. Claude가 정확히 필요한 것만 보고 판단할 수 있게 정리해주는 사람입니다.

특히 Claude Code를 개발에 사용한다면 /usage, /context, /clear, /compact, /model, /effort 같은 명령어는 꼭 익혀두는 것이 좋습니다. 여기에 CLAUDE.md 정리, 로그 필터링, MCP 최소화, 명확한 프롬프트 작성까지 같이 적용하면 같은 사용량으로 훨씬 더 많은 작업을 처리할 수 있습니다.

결국 토큰을 아끼는 가장 좋은 방법은 Claude에게 일을 덜 시키는 것이 아니라, Claude가 헤매지 않도록 길을 잘 잡아주는 것입니다.

참고하면 좋은 공식 문서

아래 문서들은 Claude 사용량 관리와 토큰 최적화를 이해할 때 참고하기 좋습니다. Claude는 모델, 요금, 명령어, 정책이 계속 바뀔 수 있으므로 실제 적용 전 공식 문서를 한 번 더 확인하는 것이 좋습니다.

  • Claude Code Commands : /clear, /compact, /context, /usage, /model, /effort 등 명령어 확인
  • Claude Prompt Caching : 반복 프롬프트와 긴 컨텍스트 비용 절감 방식 확인
  • Claude Pricing : 모델별 입력 토큰, 출력 토큰, 캐시 비용 확인
  • Claude MCP : 외부 도구, DB, API 연결 방식 확인
  • Reddit r/ClaudeCode : 실제 사용자들의 토큰 사용 경험과 팁 확인

글 제목 추천

1안 : Claude AI 토큰 아끼는 법 : Claude Code 사용량 줄이는 현실적인 방법

2안 : Claude Code 토큰이 빨리 줄어든다면? 사용량 줄이는 설정과 팁 정리

3안 : Claude AI를 오래 쓰는 방법 : 토큰 절약과 컨텍스트 관리 실전 가이드

SEO 설명 문구

Claude AI와 Claude Code를 사용할 때 토큰을 효율적으로 아끼는 방법을 정리했습니다. /usage, /context, /clear, /compact, /model, /effort 명령어 사용법부터 CLAUDE.md 관리, MCP 최적화, 프롬프트 캐싱까지 실전 중심으로 설명합니다.

이 글의 핵심 키워드

Claude AI 토큰 절약 방법 Claude Code 사용량 줄이기 Claude Code context 관리 Claude Code clear compact 사용법 Claude 프롬프트 캐싱 Claude Code MCP 토큰 CLAUDE.md 작성법 Claude Code 모델 선택 AI 코딩 도구 비용 절감 Claude Code 토큰 최적화

커피 한 잔의 힘

이 글이 도움이 되셨다면, 커피 한 잔으로 응원해주세요!
여러분의 작은 후원이 더 좋은 콘텐츠를 만드는 큰 힘이 됩니다.