사카나 Fugu 리뷰: Fugu Ultra 오케스트레이션 모델의 실제 성능 비교 (2026)

사카나 Fugu는 멀티에이전트 오케스트레이션 모델입니다. 하나의 OpenAI 호환 API가 백그라운드에서 다양한 프론티어 LLM들을 조율하면서도, 사용자 입장에서는 단일 파운데이션 모델처럼 동작합니다. Sakana AI는 2026년 6월 22일에 이를 출시했으며, 수출 통제나 벤더 종속 위험 없이 프론티어급 성능을 제공한다고 표방합니다. 이 Sakana Fugu 리뷰는 실제로 무엇인지, 오케스트레이션이 어떻게 작동하는지, 벤치마크가 실제로 말하는 바가 무엇인지, 가격이 얼마인지, 그리고 지금 시점에 시도할 가치가 있는지를 다룹니다.

Sakana Fugu는 무엇인가?

Sakana Fugu는 Sakana AI의 멀티에이전트 오케스트레이션 모델입니다. 하나의 OpenAI 호환 API가 백그라운드에서 다양한 프론티어 LLM들을 조율하며 하나의 파운데이션 모델처럼 동작합니다. 단일 모델도 아니고, 손으로 만든 라우터도 아닙니다. 학습된 오케스트레이터인데, 요청마다 직접 답할지 전문가 모델에 위임할지를 결정하고, 검증하고, 결과를 종합하도록 훈련된 LLM입니다.

이 카테고리가 해커 뉴스에서 불타오르는 질문입니다: Fugu는 하나의 거대한 모델인가, 라우터인가, 아니면 래퍼인가? 정확히는 위 중 어느 것도 아닙니다. Fugu는 그 자체로 LLM이며, 요청마다 직접 답할지 전문가들에게 위임할지를 결정하고, 그 결과를 검증하고 조합하도록 훈련되었습니다. 고정 규칙으로 프롬프트를 전달하는 손으로 만든 if/else 라우터(단일 파운데이션 모델)와는 다릅니다.

일반 건설업체로 생각해보세요. 한 곳의 접수처에서 일을 설명하면, 어떤 전문가를 어느 순서로 불러들일지, 그들의 작업을 어떻게 검증할지를 결정합니다. 당신은 최종 결과만 받으면 됩니다.

David Ha가 공동 창립한 도쿄 연구소 Sakana AI는 자연 테마 이름 짓기를 좋아합니다(fugu는 복어를 의미). 이 글을 작성하는 현재로부터 출시된 지 겨우 2일밖에 되지 않았으므로, 시장의 반응은 아직 형성 중입니다. 초기 반응은 엇갈리고 있습니다.

Sakana Fugu의 오케스트레이션이 실제로 어떻게 작동하는가

Sakana Fugu는 요청마다 지능형 의사결정을 수행합니다. 각 프롬프트에 대해 학습된 오케스트레이터가 직접 답할지 전문가 모델에 위임할지를 결정한 후, 작업을 라우팅하고, 결과를 검증하고, 최종 답을 종합합니다. 정적인 플레이북을 따르는 대신에요. 이를 가능하게 하는 세 가지 요소가 있습니다.

손으로 만든 라우팅이 아닌 학습된 오케스트레이션

오케스트레이터는 설정 파일이 아니라 훈련된 모델입니다. 그것이 핵심입니다. 학습된 오케스트레이터는 당신의 프롬프트의 실제 난이도에 맞게 적응합니다. 간단한 질문은 저렴하고 직접적인 답변을 받고, 복잡한 다단계 문제는 여러 전문가를 거쳐 검증 단계를 거칩니다. 이런 유연성은 품질을 높이지만, 비용과 응답 시간을 예측하기 어렵게 만듭니다.

동적 라우팅, 제공자 교체, 그리고 재귀적 자기 호출

이것이 멀티에이전트 오케스트레이션 모델이라는 이름을 정당화하는 부분입니다. Fugu는 동적으로 라우팅하고, 제한된 또는 사용 불가능한 제공자를 교체하며, 어려운 문제를 하위 문제로 분해하기 위해 자신을 재귀적으로 호출할 수도 있습니다. 이 재귀가 진정한 다단계 추론을 가능하게 해줍니다. 단 한 번의 시도가 아닌 말이죠.

정직한 주의사항이 있습니다. 풀은 Sakana의 입장에서는 교체 가능하지만, 당신의 입장에서는 아닙니다. 어느 모델이 답변했는지 선택할 수 없고, 라우팅을 감시할 수 없습니다. 아래에서 이것이 거버넌스 문제인 이유를 더 자세히 설명합니다.

그 뒤의 연구: Trinity와 Conductor (ICLR 2026)

모든 개발자가 ICLR 2026의 두 논문을 언급하지만, 거의 아무도 그것을 설명하지 않습니다. 개발자 친화적인 버전입니다:

Trinity는 Thinker, Worker, Verifier 역할을 각 단계에 할당하는 진화된 조정자입니다. 생각 모델이 계획을 세우고, 작업 모델이 실행하고, 검증 모델이 결과를 확인하며, 조정자가 누가 무엇을 할지를 결정합니다.

Conductor는 손으로 설계한 워크플로우에 의존하지 않고 평문 자연어로 자신의 조율 전략을 발견한 RL 훈련 시스템입니다. 아무도 플레이북을 쓰지 않았습니다. 모델이 다른 모델을 지시하는 방법을 스스로 찾아냈으며, 이것이 Fugu를 스크립트보다는 프로젝트 매니저처럼 느끼게 하는 이유입니다.

Fugu vs Fugu Ultra: 당신에게 필요한 것은?

Fugu와 Fugu Ultra의 차이는 속도 대 품질의 트레이드오프입니다. Fugu는 균형 잡힌 낮은 지연시간 옵션으로, 에이전트를 제외할 수 있게 하는 더 얇은 풀을 갖춘 것이고, Fugu Ultra는 어려운 다단계 작업을 위해 고정된 더 깊은 풀로 품질을 최대화하지만 더 느립니다. 둘 다 100만 토큰 컨텍스트 윈도우를 제공합니다.

경험칙: 응답성과 규정 준수 제어를 원할 때는 Fugu를 선택하고, 문제가 진정으로 어렵고 품질이 속도를 이길 때만 Fugu Ultra로 확대하세요. 단일 100만 토큰 컨텍스트 모델이 어떻게 직접 비교되는지의 경우, GLM 5.2 같은 단일 모델의 성능이 유용한 형제 참고자료입니다.

Sakana Fugu 벤치마크 (그리고 Fable 5의 함정)

Sakana Fugu 벤치마크는 종이 위에서는 인상적으로 보입니다. 하지만 단일 수치를 신뢰하기 전에 이 라벨을 두 번 읽어보세요. 아래의 모든 수치는 독립적으로 검증되지 않은 Sakana 보고입니다. 이것은 단일 LLM 점수가 아니라 오케스트레이션 시스템 점수이므로, 같은 것 끼리의 깔끔한 비교로 읽지 마세요.

벤치마크 표

SWE-Bench Pro (Sakana 보고; Fable 5는 Fugu의 풀에 없음)

Sakana의 주장은 Fugu Ultra가 Opus 4.8, Gemini 3.1 Pro, GPT-5.5 대비 11개 벤치마크 중 10개에서 선두한다는 것입니다. 유일한 패배는 MRCRv2인데, 여기서는 GPT-5.5가 근소하게 앞섭니다. 코딩 점수들(TerminalBench 2.1에서 82.1, LiveCodeBench에서 93.2)은 CTO의 관심을 끄는 실제 공개된 주장입니다. 단일 모델 측면에서, Claude Opus 4.8이 여전히 선도하는 부분을 보는 것은 가치가 있습니다.

"Fable 5와 동등"에 별표가 필요한 이유

거의 모든 열정적인 헤드라인이 건너뛰는 함정이 있습니다. 이것이 이 리뷰에서 가장 중요한 것입니다. Sakana는 Fugu Ultra가 "Fable 5와 동등하다"고 말합니다. 하지만 Fable 5는 수출 통제 대상이었습니다. Anthropic은 2026년 6월 12일에 공개 접근을 중단했으며, Fugu의 풀에도 포함되지 않습니다. 따라서 "동등성"은 주장상의 동등성이지, 직접 비교가 아닙니다.

마케팅 메시지에 더 나쁜 점은 Sakana가 직접 수치를 공개한 경우들에서 Fable 5가 4개 중 3개를 이깁니다. SWE-Bench Pro에서는 80.0 vs Fugu Ultra의 73.7입니다. 반올림 오차가 아닙니다. 정직한 해석은 Fugu Ultra가 뛰어나지만, 그것과 비교되는 모델을 이기고 있지는 않다는 것입니다. 하나가 없는 상태를 근사하고 있을 뿐입니다. Claude Fable 5와 Mythos 5가 왜 제거되었는지에 대한 배경 스토리는, 그 수출 통제 맥락이 정확히 Sakana가 "락인 없음" 피치를 강조하는 이유입니다. 그래서 "Sakana Fugu vs Fable 5" 또는 "vs GPT-5.5" 승리를 Sakana 보고, 풀에 없는 모델과의 비교, 그리고 여전히 공개 직접 비교에서 지고 있는 것으로 읽으세요.

Sakana Fugu 가격 및 플랜

Sakana Fugu 가격은 두 가지 형태로 제공됩니다. 구독은 월 $20(Standard), 월 $100(Pro), 월 $200(Max)입니다. 종량제를 선호하세요? Fugu Ultra는 입력 토큰 100만 개당 $5, 출력 토큰 100만 개당 $30이며, 27만 2천 토큰 이상의 컨텍스트에서는 더 높은 요금입니다. console.sakana.ai에서 모두 관리합니다.

이제 가격 책정 페이지가 당신에게 말해주지 않을 부분입니다. Fugu는 오케스트레이션하기 때문에 모델들을 호출하고, 검증하고, 종합하면서 토큰을 빠르게 소비합니다. 해커 뉴스의 초기 사용자들은 월 $200 Max 플랜이 주당 약 3시간의 많은 사용량만 커버하고, 한 사람은 단일 프롬프트에 5시간 할당량을 소진했다고 보고합니다. Sakana Fugu 비용은 각 요청이 얼마나 많은 오케스트레이션을 트리거하는지에 따라 변합니다. 고정 항목이 아니라 변동성을 예산으로 잡아두세요.

Sakana Fugu API 사용 방법

정말로 즐거운 부분은 Sakana Fugu API가 OpenAI 호환이라는 것입니다. SDK 마이그레이션이 필요 없습니다. Sakana Fugu API를 사용하려면:

console.sakana.ai에서 API 키를 얻고 구독 또는 종량제 플랜을 선택합니다.
base_url을 교체하여 기존 OpenAI 클라이언트를 Fugu 엔드포인트로 지정합니다.
다음을 설정합니다.

출처 바로가기