
Google이 약 5시간 전 I/O 2026에서 Gemini Omni를 출시했는데, Google의 공식 가격 책정 페이지에서 Gemini Omni API 가격 행이 말 그대로 비어 있습니다. 다음은 오늘 우리가 알고 있는 정보, Veo 3.1과 Gemini 3.5 Flash를 기준으로 한 내일의 요금 예측, 그리고 Omni가 하나의 API 호출로 통합하는 4개 모델 스택입니다. 마지막 확인: 2026-05-19. Google이 API 요금을 공개하는 날에 이 글을 업데이트하겠습니다.
빠른 답변: 2026년 5월 19일 현재 Gemini Omni API 가격은 아직 공개되지 않았습니다. 소비자 접근은 $20/월(AI Plus), $30/월(AI Pro), $100/월(AI Ultra)부터 시작됩니다. Vertex AI API 출시는 수주 내에 예상됩니다. Veo 3.1과 Gemini 3.5 Flash를 기준으로 예측한 API 요금은 입력 토큰 백만 개당 $1.50–$2.50, 비디오 출력 초당 $0.20–$0.60입니다.
Gemini Omni이란 무엇인가?
Gemini Omni는 Google이 2026년 5월 19일 I/O 2026에서 발표한 Google의 첫 번째 "모든 형식에서 모든 형식으로(any-to-any)" 멀티모달 모델입니다. 텍스트, 이미지, 오디오, 비디오를 입력으로 받고 현재는 비디오를 출력합니다(이미지와 오디오 출력은 Google의 표현에 따라 "추후에" 제공될 예정입니다). 출시 시 두 가지 버전이 제공됩니다: 빠른 10초 클립용 Omni Flash와 더 길고 품질이 높은 출력용 Omni Pro입니다.
스택 설계 관점에서 흥미로운 점은 이것입니다. Omni는 Gemini 라인업에 새로운 기능을 추가하지 않습니다. 4개의 별도 모델을 하나의 API 호출로 통합합니다. 텍스트 생성 + 비전 + 음성-텍스트 + 비디오 합성이 단 하나의 왕복으로 변합니다. 이 모델은 Veo 3.1 비디오 기반을 기반으로 구축되어 있어 비디오 품질 기준이 이미 설정되어 있습니다(그리고 Google의 Omni 출시 발표에 따라 모든 출력에는 SynthID 워터마크가 있습니다).
이 글을 읽기 전에 알아둘 몇 가지 세부 사항:
- Omni Flash의 10초 클립 제한은 Google이 "배포 결정이지, 모델의 한계가 아님"이라고 부릅니다. 즉, 향후 늘어날 가능성이 높다는 뜻입니다.
- DeepMind 모델 카드는 텍스트 + 이미지 + 오디오 + 비디오 입력, 현재 비디오 전용 출력을 확인합니다.
- TechCrunch의 분석과 9to5Google의 출시 상세 정보 모두 "향후 더 많은 출력 모달리티" 로드맵을 더 큰 스토리로 제시합니다.
요금표를 찾으셨다면 다음 섹션이 당신이 찾은 진짜 정보입니다. 예측 계산을 원하셨다면 2개 섹션을 건너뛰세요.
Gemini Omni API는 오늘 얼마인가? (스포일러: 아직입니다)
Gemini Omni API 가격은 아직 공개되지 않았습니다. ai.google.dev/gemini-api/docs/pricing의 Google 공식 가격 책정 페이지(2026년 5월 19일 확인)는 Omni를 제외한 모든 Gemini 모델을 나열하고 있습니다. 해당 행이 비어 있습니다. 소비자 접근은 Gemini 앱 구독을 통해 지금 이용 가능하고, API 접근은 Vertex AI를 통해 Google의 발표에 따라 "앞으로 수주 내에" 제공될 예정입니다.
동부 시간 오전 8시에 가격 책정 페이지를 확인했고, 오후 1시에 다시 확인했습니다. 두 번 모두 같은 결과입니다. 페이지는 14개의 Gemini 모델을 나열하고 있습니다. Omni는 아직 그 목록에 없습니다.
출처: ai.google.dev/gemini-api/docs/pricing, 2026-05-19 확인
현재 존재하는 유일한 Omni 요금은 소비자 구독입니다:
- AI Plus: $20/월
- AI Pro: $30/월
- AI Ultra: $100/월
Google의 AI 구독 블로그에서 각 구독 요금이 무엇을 제공하는지 확인할 수 있습니다. API 경로는 평소대로 나뉩니다: 기업 약정용 Vertex AI(아마도 먼저 출시될 것 같음) 및 종량제용 AI Studio(일반적으로 몇 주 뒤에 따라옴). Omni에 대한 무료 요금제는 아직 발표되지 않았습니다. VentureBeat의 기업 분석이 "앞으로 수주" 라는 타임라인을 확인해줍니다. 이것이 우리가 가진 가장 정확한 타임라인 신호입니다.
따라서 오늘 "Gemini Omni API 가격"을 검색해서 낡은 Gemini 3.1 Pro 정보가 나오는 5개 탭을 전부 확인했다면, 당신 탓이 아닙니다. 가격이 말 그대로 공개되지 않았을 뿐입니다.
Gemini Omni API 가격이 실제로 얼마가 될까? (예측 계산)
예상 Gemini Omni API 가격(Veo 3.1과 Gemini 3.5 Flash를 기준으로 보간): 낮은 가격 $1.50 입력 / $0.20/초 출력, 중간 가격 $2.00 입력 / $0.40/초 출력, 높은 가격 $2.50 입력 / $0.60/초 출력(모두 백만 토큰당). 오디오 입력은 백만 토큰당 $3–$5로 예상됩니다. 여기의 모든 수치는 예상이며, 확정된 것이 아닙니다.
어떻게 이 수치에 도달했는지 설명하겠습니다. Veo 3.1은 현재 비디오 출력 초당 $0.40을 청구하고, Omni Pro는 동일한 비디오 기반을 기반으로 구축되었습니다. 따라서 Omni Pro의 초당 요금은 아마도 Veo 3.1 범위 내에 떨어질 것입니다. Gemini 3.5 Flash 텍스트 I/O는 백만 토큰당 $1.50/$9입니다. Omni Flash의 텍스트 I/O는 아마도 그 요금의 0.7–1.5배 정도가 될 것 같습니다. Google은 역사적으로 새로운 멀티모달 Flash 변형의 가격을 텍스트 전용 버전과 비슷하게 책정하기 때문입니다.
달리 명시되지 않은 한, 모든 요금은 백만 토큰당입니다. OpenAI의 가격과 Anthropic의 Claude 가격을 비교하여 범위의 타당성을 교차 검증했습니다.
기본 요금 위에서 예상할 사항들:
- 배치 / Flex / 우선순위 요금제. 다른 모든 Gemini 모델이 제공합니다. 배치는 일반적으로 비용을 약 50% 줄입니다. 우선순위는 프리미엄으로 지연 시간 보장을 추가합니다. Omni는 거의 확실히 같은 패턴을 따를 것입니다.
- 컨텍스트 길이별 가격 책정. Gemini 3.1 Pro는 200k 토큰 이상에서 2배를 청구합니다. Omni도 아마도 같은 규칙을 적용할 것입니다. 특히 비디오 프레임 수가 토큰 총량을 빠르게 증가시키기 때문입니다.
- 오디오 입력 토큰화. 오디오는 초당 단위가 아니라 토큰당 청구됩니다. 현재 Gemini 요금으로 대략 초당 32개 토큰이므로 그에 맞춰 예산을 세우시면 됩니다.
Veo 3.1과 Gemini 3.5 Flash를 기준으로 Omni Flash의 비용은 입력 토큰 백만 개당 $1.50–$2.50, 비디오 출력 초당 $0.20–$0.60이 될 가능성이 높습니다. 우리는 이 계산을 두 번 수행했습니다(한 번은 Veo만 기준으로, 한 번은 Flash와 혼합). 범위는 상한선에서 초당 $0.50 내에서 유지되었습니다. Omni가 출시되면 요청을 지능적으로 라우팅하기를 원할 것입니다. LLM API 비용을 낮추는 방법에 대한 우리의 가이드에서는 지금부터 사전에 구성할 가치가 있는 게이트웨이 라우팅과 캐시 계층을 다룹니다.
백만 토큰당 예상 비용(입력 + 출력 혼합)
예상 Gemini Omni 가격 범위 vs 2026-05-19 현재 경쟁사 혼합 입력/출력 요금. Omni 수치는 Veo 3.1과 Gemini 3.5 Flash를 기준으로 보간되었습니다. 이 차트는 Google이 요금을 공개하는 날 업데이트됩니다.
Gemini Omni는 무엇을 대체하는가? 스택 통합 워크시트
Omni는 다중 모델 파이프라인을 대체합니다: 텍스트용 GPT-4o, 이미지 분석용 GPT-4o Vision, 음성 전사용 Whisper, 비디오 생성용 Veo 3.1. 전형적인 30초 비디오-나레이션 워크플로우는 오늘 4개의 API 호출로 약 $12.27이 소요됩니다. 예상 중간 가격의 Omni를 사용하면 동일한 워크플로우가 단일 호출로 클립당 $4–$18이 됩니다(네, 상한이 당신이 기대하는 것보다 넓지만 계속 읽어보세요).
우리의 프로덕션 파이프라인에서는 현재 클라이언트 비디오 설명 워크플로우에 정확히 이 4단계 구조를 사용하고 있습니다. 여기 예상 중간 가격으로 Omni Pro를 사용했을 때 오늘의 현재 파이프라인과 비교한 비용 내역입니다:
솔직한 주의입니다. 예측 범위의 상한에서 Omni Pro는 실제로 현재 4개 벤더 파이프라인보다 클립당 더 비쌀 수도 있습니다. 비디오 출력이 지배적인 비용 항목이고, Google이 Omni Pro의 가격을 Veo 3.1의 전체 $0.40+/초(더하기 멀티모달 컨텍스트의 입력 토큰 마크업)로 책정한다면, 비디오 작업이 많은 워크플로우는 첫날에 비용 절감을 기대하기 어려울 수 있습니다.
그렇다면 실제 절감은 어디서 나올까요? 전문가 팁: 현재 Whisper + Vision + GPT-4o + Veo 3.1에 비용을 지출하고 있다면, Omni에서의 실제 이득은 항상 비용만은 아닙니다. 단일 호출로 3개 벤더, 3개 SDK, 3개의 SLA를 없애는 것입니다. 그것이 CTO가 승인할 부분이지, 클립당의 수학적 절감이 아닙니다. 지연 시간이 줄어들고, 오류 처리 코드가 간결해지며, 재시도 로직이 4개의 오류 분류 체계를 통해 분기할 필요가 없어집니다.
API가 출시되면 하드 컷오버보다는 트래픽 미러링으로 현재 스택에 대해 Omni를 A/B 테스트하기를 원할 것입니다. GPT-4o Responses API 튜토리얼은 Omni가 통합하도록 설계된 정확한 멀티모달 스택을 통해 설명하며, LLM 게이트웨이는 모든 호출 지점을 다시 작성하지 않고도 나란히 테스트를 간단하게 만듭니다.
Gemini Omni는 Instagram 자동화에 가치가 있는가?
...