한곳에서 제공업체별 최신 AI 모델을 살펴보세요. 각 호출은 가장 저렴하고 안정적인 옵션으로 지능형 라우팅되어 추가 작업 없이 더 좋은 가격을 얻습니다.
차세대 Nano Banana 모델로 더 세밀한 디테일과 뛰어난 프롬프트 준수로 우수한 이미지 생성을 제공합니다. 속도와 비용 효율을 최적화해 크리에이티브 전문가에게 큰 도약을 제공합니다.
오디오 생성은 선택 사항. 텍스트-투-비디오 및 이미지-투-비디오, 4~12초, 480p/720p/1080p 품질.
Kling O3 (V3 Omni) next-generation video model with text-to-video, image-to-video, reference-to-video, and video editing. Supports 3-15 second videos with per-second billing.
Kling 3.0 video model with text-to-video and image-to-video. Supports 3-15 second videos with per-second billing.
Tongyi Wanxiang 2.6 비디오 생성 모델로 텍스트-투-비디오, 이미지-투-비디오, 참조 비디오 변형을 지원합니다.
Google DeepMind 차세대 비디오 모델로 Fast와 Pro 변형을 제공합니다. 8초 비디오 생성과 향상된 품질을 지원합니다.
오디오 포함 OpenAI 최신 10~15초 비디오 생성 모델. 워터마크 제거 지원(가격 1.65배).
OpenAI의 프로페셔널급 10~15초 비디오 생성 모델로, 향상된 품질 옵션(표준/고품질)을 지원합니다.
품질 대비 속도 비율이 뛰어난 초고속 이미지 생성 모델. 대량 생성에 적합하며 뛰어난 프롬프트 준수성을 제공합니다.
2K/4K 품질을 지원하는 고급 이미지 생성. 배치 생성(1~15장), 참조 이미지, 유연한 사이즈 옵션을 지원합니다.
xAI Grok Imagine video generation API supporting both text-to-video and image-to-video. 6-10s duration with fun/normal/spicy modes.
입력 이미지가 무료인 가성비 Nano Banana 모델. 품질 대비 가격이 좋아 대량 이미지 생성에 적합합니다.
Google's latest iteration of Gemini 3 Pro with advanced multimodal capabilities and extended context support
Best balance of speed, intelligence, and cost for coding and agentic tasks. 200K context window with 128K max output.
ByteDance's latest LLM series with 256K context, tiered pricing by prompt length (32K/128K/256K), and cache billing. Available in Pro, Lite, Mini, and Code variants.
High-performance general-purpose chat model (DeepSeek-V3) with 128K context window and competitive pricing for everyday AI tasks
Advanced reasoning model (DeepSeek-R1) with chain-of-thought capabilities, 128K context window, optimized for complex problem-solving tasks
Anthropic's most powerful Claude model with exceptional reasoning, coding, and agentic capabilities. 200K context window.
Tongyi Wanxiang 이미지 생성 모델(Wan 2.5 Image)로 텍스트-투-이미지 및 이미지-투-이미지를 지원합니다.
보컬, 가사, 악기를 지원하는 AI 음악 생성. 여러 모델 버전으로 텍스트 프롬프트에서 프로급 곡을 생성합니다.
Tongyi Wanxiang 비디오 생성 모델(Wan 2.5 Video)로 이미지-투-비디오와 텍스트-투-비디오를 지원합니다.
진짜 색 정확도, 구조화 작업, 분석적 비주얼 출력에 최적화된 OpenAI 고급 이미지 생성 모델. DALL-E 3 기술 기반.
OpenAI GPT Image 1은 텍스트-투-이미지, 이미지-투-이미지, 이미지 편집 모드를 지원합니다. 비동기 처리와 고품질 출력을 제공합니다.
속도 3배의 Google 최상위 모델로, 오디오 입력 포함 멀티모달이며 비용 효율적입니다.
MiniMax Hailuo 2.3 API로 Fast/Standard 변형을 제공합니다. T2V/I2V에서 768p/1080p 출력을 지원합니다.
MiniMax Hailuo 02 - T2V, I2V, FLF 모드를 모두 지원. 512p/768p/1080p 해상도를 제공합니다.
400K 컨텍스트 윈도우, 128K 최대 출력, 고급 추론을 갖춘 코딩 및 에이전트 작업용 OpenAI 플래그십 모델.
OpenAI 최신 플래그십 모델로 고급 추론, 프롬프트 캐싱, 복잡한 작업을 위한 400K 컨텍스트 윈도우를 제공합니다.
Anthropic의 가장 강력한 Claude 모델로 뛰어난 추론, 코딩, 에이전트 기능과 200K 컨텍스트를 제공합니다.
Kling O1 비디오 생성 모델. 이미지-투-비디오, 비디오 편집, 빠른 비디오 편집 변형을 지원합니다. 참조 이미지로 스타일을 지시하며 3~20초 비디오를 생성합니다.
Moonshot의 고급 추론 모델로 확장된 사고 기능과 웹 검색 지원으로 복잡한 문제 해결을 돕습니다.
고급 멀티모달 기능과 확장된 컨텍스트를 갖춘 Google 차세대 언어 모델.
최적의 성능을 위해 200K 컨텍스트와 프롬프트 캐싱을 지원하는 빠르고 비용 효율적인 코딩 어시스턴트.
에이전트 구축과 코딩에 가장 지능적인 모델. 200K 컨텍스트, 확장된 사고, 고급 추론 기능을 제공합니다.
복잡한 추론, 창의적 작업, 연구를 위한 가장 강력한 Claude 모델. 200K 컨텍스트로 뛰어난 성능을 제공합니다.
일반 작업에 강한 균형형 모델. 200K 컨텍스트와 프롬프트 캐싱을 지원합니다.
비용 최적화를 위한 프롬프트 캐싱 지원의 빠르고 효율적인 Google 언어 모델.
텍스트-투-비디오 및 이미지-투-비디오 기능의 고급 비디오 생성 모델. 2~12초, 720p/1080p 품질 옵션을 제공합니다.
확장 컨텍스트와 고급 추론 능력을 갖춘 Google 최강 언어 모델.
오디오 기반 립싱크를 지원하는 AI 디지털 휴먼 비디오 생성. 정지 이미지를 자연스러운 표정과 움직임의 말하는 아바타로 변환합니다.
Tongyi Qianwen 이미지 편집 모델로 지능형 이해와 다중 이미지 협업 편집을 지원합니다.
Gemini 2.5 Flash Image Preview는 자연어 기반 이미지 생성과 편집에 뛰어난 고급 AI 모델입니다.
4K 품질의 스토리 중심 이미지 생성: 다중 참조 융합과 실시간 편집으로 9개 이상의 일관된 비주얼을 생성합니다.
OpenAI 최신 이미지 생성 및 편집 모델.