Opus 4.8의 두 스위치, 빠른 모드와 울트라코드를 켜기 전에 알아야 할 것

지난 5월 28일, Anthropic이 Claude의 새 모델 Opus 4.8을 내놨다. 그런데 이번에 화제가 된 건 모델 점수가 아니다. 같이 나온 두 개의 스위치, 빠른 모드(fast mode)와 울트라코드(ultracode)다.

둘 다 한 번 켜면 AI가 더 빨리, 더 크게 일한다. 문제는 그만큼 요금도 따라 움직인다는 점이다. 어떤 사용자는 2만 원짜리 요금제를 10분 만에 다 써버렸다.

이 글은 그 두 스위치가 각각 뭘 사는 기능인지, 그리고 왜 무턱대고 켜면 안 되는지를 정리한다. 코딩을 모르는 사람도 따라올 수 있게 비유로 풀었다.

핵심 요약
빠른 모드는 같은 모델을 2.5배 빨리 돌리는 대신 토큰당 단가를 2배로 올린다. 울트라코드는 AI가 수백 개의 일꾼을 동시에 풀어 큰 작업을 자동으로 끝내는 대신 토큰 총량을 폭증시킨다. 둘 다 아직 시험 단계(research preview)이고, 켜기 전에 사용 한도부터 정해두지 않으면 요금이 샌다.

빠른 모드는 같은 모델을 더 빨리 돌리는 가속 페달이다

빠른 모드는 새 모델이 아니다. 똑같은 Opus를 더 빠르게 돌리도록 우선순위를 바꾸는 설정이다. 머리는 그대로인데 입만 빨라진 셈이다. 답변 품질은 평소와 같고 응답 속도만 최대 2.5배 빨라진다. Claude Code라는 개발 도구에서 /fast라고 입력하면 켜지고 켜지면 화면에 번개 표시가 뜬다.

여기서 헷갈리기 쉬운 부분이 단가다. Anthropic은 이번에 빠른 모드 가격을 3분의 1로 내렸다고 발표했다. 100만 토큰당 출력 단가가 150달러에서 50달러로 떨어졌으니 틀린 말은 아니다. 토큰은 AI가 글자를 세는 단위쯤으로 보면 된다. 그런데 이 “3배 싸졌다”는 어디까지나 예전 빠른 모드와 비교한 값이다.

정작 평소 모드와 비교하면 얘기가 달라진다. Opus 4.8을 그냥 쓰면 100만 토큰당 5달러에서 25달러인데, 빠른 모드는 100만 토큰당 출력 50달러 Claude Code Docs로 평소보다 오히려 2배 비싸다. 속도를 산 만큼 돈을 더 낸다는 게 본질이다. “싸졌다”는 헤드라인만 보고 상시 켜두면 매달 청구서가 늘어난다.

비용 함정이 하나 더 있다. 대화를 한참 하다가 중간에 빠른 모드를 켜면, 그때까지 쌓인 대화 전체에 비싼 단가가 한꺼번에 적용된다. 그러니 켤 거면 처음부터 켜는 게 가장 싸다. 또 빠른 모드는 Sonnet이나 Haiku 같은 다른 모델에는 없고 Opus 4.8과 그 직전 버전들에서만 동작한다.

울트라코드는 AI가 일꾼 수백 명을 한 번에 푸는 스위치다

울트라코드는 정반대 방향으로 일한다. 빠른 모드가 한 사람을 더 빨리 뛰게 한다면, 울트라코드는 한 사람 대신 팀 전체를 투입한다. 이걸 이해하려면 그 아래 두 부품을 봐야 한다.

첫째는 사고량 조절이다. Opus 4.8은 한 문제에 얼마나 깊이 생각할지를 단계로 고를 수 있다. 가볍게 빠르게 답할 수도 있고 어려운 문제에 오래 매달리게 할 수도 있다.

둘째는 다이내믹 워크플로(dynamic workflows, AI가 작업을 잘게 쪼개 여러 일꾼에게 동시에 맡기는 기능)다. Claude가 직접 작업 분배 계획을 짜서, 수십에서 수백 개의 하위 일꾼(서브에이전트)을 한 번에 돌린다. 동시에는 16개까지, 한 작업당 누적 1,000개까지가 한계로 박혀 있다. 한 번에 너무 많이 풀어 컴퓨터가 멈추는 걸 막으려는 안전장치다.

울트라코드는 이 둘을 한꺼번에 켜는 스위치다. 사고량을 최고 수준으로 고정하고 일꾼을 언제 풀지는 Claude가 알아서 판단한다. 프롬프트에 ‘workflow’라는 단어만 넣어도 작동한다. 한마디로 “깊게 생각하고, 필요하면 알아서 팀을 꾸려라”를 한 줄로 시키는 셈이다.

규모가 어느 정도인지 실제 사례가 보여준다. Bun이라는 프로그램을 다른 언어로 통째로 옮기는 작업에서, 약 75만 줄짜리 코드를 11일 만에 끝냈고 기존 검사 통과율이 99.8% Anthropic에 달했다. 사람 손으로는 몇 달이 걸릴 일이다. 파일마다 검토 담당 일꾼이 둘씩 붙고 수백 명이 병렬로 움직인 결과다.

두 스위치는 요금이 새는 방향이 정반대다

같은 출시에 묶여 나왔지만, 두 기능은 돈이 빠지는 구조가 다르다. 빠른 모드는 단가를 올린다. 같은 양의 일을 더 비싼 값에 빨리 끝낸다. 울트라코드는 단가가 아니라 일의 양 자체를 폭증시킨다. 수백 명이 몇 시간을 일하면 그만큼 토큰이 쌓인다.

체감 비용은 후자가 훨씬 가파르다. 월 27만 원짜리 상위 요금제에서 하루 만에 일주일 한도의 20% findskill.ai를 태운 사례, 2만 원대 요금제가 10분 만에 한도에 닿은 사례가 보고됐다. 이게 무서운 이유는, 이 비용이 구독료에 포함된 게 아니라 별도 사용 한도에서 빠진다는 점이다. 월 구독료만 보고 예산을 짜면 어긋난다.

물론 막을 방법은 있다. 작업 범위를 특정 폴더로만 제한하고, 가벼운 단계는 작은 모델에 맡기고 명령어로 월 한도와 실시간 사용량을 들여다보는 식이다. 빠른 모드는 회사 차원에서 “세션마다 꺼진 상태로 시작”하도록 강제할 수도 있다. 켜는 것보다 통제가 더 중요한 기능이라는 뜻이다.

품질도 솔직히 봐야 한다. 터미널에서 코딩하는 한 평가에서 Opus 4.8은 74.6%로, 경쟁 모델 GPT-5.5의 78.2%에 졌다. 다이내믹 워크플로도 아직 시험 단계라 “거친 부분이 있으니 중요한 작업에 검증 없이 쓰지 말라”는 권고가 붙어 있다. 만능 도구가 아니다.

어떤 작업에 어떤 스위치를 켤까

둘을 혼동하면 돈만 태운다. 단순한 파일 하나 고치는 데 울트라코드를 켜는 건, 택배 하나 보내자고 트럭 수십 대를 부르는 격이다. 빠른 모드는 “작은 일을 빨리”, 울트라코드는 “큰 일을 한 번에”라고 외워두면 헷갈리지 않는다.

구분빠른 모드울트라코드
사는 것응답 속도작업 규모
돈 새는 방식토큰당 단가 2배토큰 총량 폭증
잘 맞는 일빠른 반복, 즉답이 필요한 순간대규모 작업, 통째로 훑는 검토
켜는 법/fast 토글메뉴에서 울트라코드 선택
상태시험 단계시험 단계

흥미로운 단서가 하나 있다. 이 기능을 만든 Anthropic의 엔지니어링 매니저 Alessio Vallero는 “다이내믹 워크플로는 대규모 코드베이스 전반의 탐색과 리뷰 작업에서 특히 유용했다”고 했다. 새 코드를 쓰는 것보다 큰 덩어리를 병렬로 훑어 이해하고 점검하는 일이 진짜 적합 영역이라는 얘기다. 무언가를 새로 만들기보다, 이미 있는 걸 한꺼번에 살펴볼 때 빛난다.

정리

이번 출시의 핵심은 셋이다. 빠른 모드는 속도를 사지만 평소보다 2배 비싸다. 울트라코드는 수백 개 일꾼으로 큰 작업을 자동화하는 대신 토큰을 폭증시킨다. 둘 다 사용 한도를 미리 정해두지 않으면 요금이 통제 불능으로 샌다.

세 가지를 한 줄로 묶으면, AI 도입의 승부가 “어느 모델을 고르느냐”에서 “어느 스위치를 언제 켜고 끄느냐”로 옮겨갔다는 것이다. 예전에는 비용을 사람이 미리 계산할 수 있었다. 이제는 AI가 일꾼을 몇 명 풀지 스스로 정하니, 비용이 모델의 판단에 달린 변수가 됐다.

그래서 가장 센 모델을 고른 사람이 아니라, 스위치를 작업 크기에 맞게 다룰 줄 아는 사람이 이긴다. 새 기능을 켜기 전에 “이 작업에 이 스위치가 맞나, 한도는 정해뒀나”부터 자문하는 습관, 그게 지금 가장 실용적인 한 가지다.


참고 자료

  1. Anthropic — Introducing Claude Opus 4.8
  2. Anthropic — Introducing dynamic workflows in Claude Code
  3. Claude Code Docs — Speed up responses with fast mode
  4. Claude Code Docs — Orchestrate subagents at scale with dynamic workflows
  5. VentureBeat — Claude Opus 4.8 with 3X cheaper fast mode
  6. MarkTechPost — Dynamic Workflows capped at 1,000 subagents
  7. findskill.ai — Dynamic Workflows & Ultracode how-to
  8. techsy.io — Opus 4.8 What Changed and Where It Loses