Claude Sonnet 5: 새로운 기능과 실제 운영 비용

Claude Sonnet 5는 2026년 6월 30일 오늘 출시되었으며, Anthropic은 입력 토큰당 $2로 가격을 책정했습니다. 대부분의 보도는 여기서 멈춥니다. 실제 청구서를 움직이는 숫자는 다릅니다. 출력 토큰과 십여 번의 왕복을 더한 후 전체 에이전트 실행 비용은 얼마일까요? Anthropic은 Sonnet 5가 Opus 4.8에 "거의 근접"하면서 약 3분의 1의 가격이라고 말합니다. 그래서 진짜 질문은 사양표가 아닙니다. 에이전트의 월간 비용이 실제로 줄었는지, 그리고 얼마나 줄었는지입니다.

주요 요점:
- Claude Sonnet 5는 2026년 6월 30일 출시되었으며, Sonnet 4.6을 대체하는 Anthropic의 중간 계층 에이전트 모델입니다.
- 도입 가격은 2026년 8월 31일까지 입력 토큰당 $2, 출력 토큰당 $10이며, 이후 $3/$15입니다.
- Anthropic은 성능이 Opus 가격의 약 3분의 1 정도인 "Opus 4.8에 거의 근접"하다고 합니다.
- Claude Free와 Pro의 기본값이며, API 및 Claude Code에서 claude-sonnet-5로 사용 가능합니다.

Claude Sonnet 5란? (30초 요약)

Claude Sonnet 5는 2026년 6월 30일 출시된 Anthropic의 새로운 중간 계층 모델이며, 출시 블로그에서 지금까지 가장 에이전트에 최적화된 Sonnet으로 설명됩니다. 계획을 수립하고 브라우저 및 터미널 같은 도구를 사용하며 자율적으로 실행할 수 있습니다. 도입 가격은 입력 토큰당 $2, 출력 토큰당 $10이며, 이제 Claude Free와 Pro의 기본값입니다.

네, 오늘 출시되었습니다. "Claude Sonnet 5가 출시되었나?"라는 혼동이 떠돌고 있었다면 참고하세요. API에서 또는 Claude Code에서 claude-sonnet-5 모델 문자열로 선택합니다. Anthropic은 이를 Sonnet 4.6보다 의미 있는 진전으로 위치시키며, 품질이 플래그십 모델인 Opus 4.8에 거의 근접하다고 하면서도 플래그십 가격은 아니라고 말합니다.

그 아래에 있는 내용은 이렇습니다. Claude Sonnet 5는 대부분의 에이전트 작업이 더 이상 최고 수준의 모델이 필요 없다는 Anthropic의 베팅입니다. 이것이 사실이라면, 흥미로운 이야기는 기능 향상이 아닙니다. 경제성입니다.

Sonnet 4.6과 Opus 4.8 대비 새로운 기능

Anthropic은 Sonnet 5를 그 전신인 Sonnet 4.6에 비해 추론, 도구 사용, 코딩, 지식 작업 전반에서 "상당한 개선"이라고 부르며, 성능은 "Opus 4.8에 근접하지만 더 낮은 가격"이라고 합니다. 묻지 않아도 자신의 출력을 검증하고, 지속적인 코딩, 디버깅, 다단계 도구 사용에 더 강합니다. 이는 Anthropic의 주장이지, 우리의 측정값은 아닙니다.

에이전트 기능 업그레이드

헤드라인 변화는 자율성입니다. Sonnet 5는 작업을 계획하고, 브라우저와 터미널 같은 도구를 선택하며, 긴 실행을 손으로 돕지 않고도 진행할 수 있도록 구축되었습니다. TechCrunch가 보도하듯이 (Anthropic 인용), 이 모델은 에이전트를 계속 실행하는 더 저렴한 방법으로 소개되고 있으며, Zapier 및 Lovable 같은 팀들로부터 초기 고객 신호가 있습니다. 이것이 Anthropic이 노리는 사용 사례입니다. 분이나 시간 동안 반복하는 에이전트로, 매번 턴이 추가될 때마다 토큰이 누적됩니다.

종이 위에서 Opus 4.8과의 비교

예산 계획에 중요한 부분입니다. 기능 간격은 좁혀졌지만 가격 간격은 그렇지 않았습니다.

표준 Sonnet 5 가격 ($3/$15)이 Sonnet 4.6과 동일함을 주목하세요. 같은 가격표에서 더 강력한 모델을 얻습니다. 그리고 Opus 4.8의 $5/$25 대비, Sonnet 5 표준은 입력 요율과 출력 요율 모두에서 대략 60%로 실행됩니다. 도입 기간 중에는 더 저렴합니다. Anthropic은 Sonnet 5가 Opus 4.8을 능가한다고 발표한 숫자가 없으므로, 그렇게 읽지 마세요. 공식 입장은 "거의 근접"이며, 우리는 그렇게 유지합니다.

Claude Sonnet 5는 실제로 얼마나 비용이 드나? (토큰 경제학)

Claude Sonnet 5는 2026년 8월 31일까지 도입 기간 동안 입력 토큰당 $2, 출력 토큰당 $10의 비용이 들고, 그 후 입력 토큰당 $3, 출력 토큰당 $15로 인상됩니다. 이 표준 가격은 Sonnet 4.6과 동일하면서도 더 강력한 모델이며, 대략 Opus 4.8의 표준 요율 ($5/$25)의 3분의 1에 해당합니다. 대량의 에이전트 작업의 경우, 이 비율이 전부입니다.

그럼 "백만 토큰당"은 실제로 당신에게 무엇을 의미할까요? 토큰은 대략 단어의 4분의 3입니다. 백만 토큰은 많은 텍스트, 아마 750,000 단어 정도지만, 에이전트는 매번 턴마다 컨텍스트를 다시 보내기 때문에 빠르게 소비합니다. 시스템 프롬프트, 이전 메시지, 파일 내용, 도구 출력 등이 포함됩니다. 단일 다중 파일 리팩토링만 해도 완료되기 전에 수십만 개의 입력 토큰을 사용할 수 있습니다.

도입 기간은 실제 의사 결정 지점입니다. 8월 31일까지는 $2/$10을 지불합니다. 그 후에는 $3/$15입니다. 어차피 Sonnet 5를 테스트할 것이라면, 지금 하면 평가가 할인가로 실행되고, 수학이 가장 유리한 동안 습관을 고착화합니다. 반대편: 2개월 후에 잃을 도입 가격을 토대로 예산을 세우지 마세요.

두 가지 플랫폼 기능은 헤드라인 요율보다 실제 청구서를 훨씬 더 크게 변화시킵니다. 프롬프트 캐싱을 사용하면 매번 턴마다 전체 입력 가격을 지불하는 대신 캐시된 컨텍스트를 재사용할 수 있으며, 캐시된 부분에서 대략 90%까지 절감할 수 있습니다. 배치 처리는 비동기식으로 실행할 수 있는 긴급하지 않은 작업에 대해 약 50%의 비용을 절감합니다. 둘 다 Anthropic의 플랫폼 가격 책정에 문서화되어 있습니다. 에이전트가 매번 턴마다 동일한 큰 시스템 프롬프트나 코드베이스를 다시 보낸다면, 프롬프트 캐싱이 비용에 대해 가할 수 있는 단일 최대 지렛값입니다. 우리의 LLM API 비용 절감 가이드에서 더 많은 전술을 다룹니다.

입력 토큰당 $2에 Sonnet 5는 대량의 에이전트 반복을 실행 상태로 둘 정도로 저렴하게 만듭니다. 이것이 변화입니다. 질문은 더 이상 "이 에이전트를 실행할 여유가 있나?"가 아니라 "한 번에 몇 개를 실행할 수 있을까?"입니다.

실제 Sonnet 5 에이전트 실행 비용 (재현 가능)

숫자를 구체적으로 봅시다. 우리는 랩 벤치마크를 실행하지 않았으며, 그렇게 가장할 생각도 없습니다. 다음은 Anthropic의 공개된 토큰당 요율을 사용하여 당신의 토큰 수로 재현할 수 있는 투명한 계산입니다. 가정을 명시하고, 산술을 수행하면, 청구서가 나옵니다.

계산 과정

현실적인 에이전트 작업을 생각해봅시다. 약 12턴을 실행하는 다중 파일 리팩토링입니다. 캐싱이 꺼진 상태에서 턴당 대략 40,000개의 입력 토큰과 8,000개의 출력 토큰을 가정하세요. 그 이유는 매 턴마다 증가하는 컨텍스트를 다시 보내기 때문입니다. 총 약 480,000개의 입력 토큰과 96,000개의 출력 토큰입니다. 이제 계산입니다.

Sonnet 5 도입: (0.48M × $2) + (0.096M × $10) = $0.96 + $0.96 = $1.92
Sonnet 5 표준: (0.48M × $3) + (0.096M × $15) = $1.44 + $1.44 = $2.88
Opus 4.8 표준: (0.48M × $5) + (0.096M × $25) = $2.40 + $2.40 = $4.80

이제 프롬프트 캐싱을 켜세요. 480,000개의 입력 중 대부분이 재사용되는 컨텍스트 (시스템 프롬프트, 파일 트리, 이전 턴)이고 문서화된 대략 90%의 절감에 가까워진다면, 입력 측은 약 $0.96에서 대략 $0.10으로 떨어지고, 출력은 $0.96으로 유지됩니다.

이는 공개 토큰당 가격과 명시된 토큰 가정을 사용한 모델 추정치로, 우리가 실행한 벤치마크가 아닌 재현할 수 있는 계산입니다. 턴 수와 토큰 크기를 직접 대입하면 구조는 유지됩니다. 스스로 숫자를 계산해보세요. 동일한 에이전트 작업은 Sonnet 5 도입에서 약 $1.92 대 Opus 4.8 표준에서 약 $4.80의 비용이 들고, 캐싱은 Sonnet 5 실행을 약 $1.06 근처로 내릴 수 있습니다. 월 천 개의 실행 전체에 걸쳐, 이는 약 $1,900 청구서와 약 $4,800 청구서의 차이입니다.

모델 선택 및 자신의 비용 측정

우리의 가정을 믿을 필요는 없습니다. 자신의 워크로드에 모델을 가리키고 실제 토큰 수를 다시 읽으세요. Claude Code에서 플래그 또는 프로젝트 설정으로 모델을 설정하세요.

Anthropic API에서 모델 문자열은 동일하며, 모든 응답은 정확한 토큰 사용을 제공합니다.

입력 토큰에 입력 요율을 곱하고, 출력 토큰에 출력 요율을 곱하고, 턴 전체에 걸쳐 합산하면, 해당 작업의 진정한 비용이 있습니다. cache_read_input_tokens 필드는 캐싱이 실제로 얼마나 절감했는지를 보여줍니다. 클라이언트를 위한 모델 라우팅의 우리 경험에 따르면, 비용은 토큰당 스티커가 아니라 작업당 비용이 월간 청구서를 움직이고, 이를 아는 유일한 정직한 방법은 자신의 트래픽에서 사용 개체를 읽는 것입니다.

Sonnet 5가 올바른 선택인 곳 (실제 사용 사례)

...

출처 바로가기