Wan 2.5 API

通过 Evolink AI 上的 Wan 2.5 API,将简短的提示词或参考图转化为音画同步、即可发布的成品视频。

Estimated Cost
6 Credits
Sample Result

No sample available

0 (suggested: 2,000)

480p supports 16:9, 9:16, 1:1; 720p/1080p add 4:3 and 3:4

Click Generate to see preview

History

最多保留20条

0 运行中 · 0 已完成

您的生成历史将显示在这里

支持原声音频的 Wan 2.5 AI 视频 API

通过简洁的 Evolink AI 接口,只需简单的文本或图片输入,即可生成带有原生音频、口型同步且构图适配社媒的高清短视频。

AI 视频生成产品功能展示:社媒案例

Evolink AI 上的 Wan 2.5 API 是什么?

带音频的文生视频

Wan 2.5 API 允许您发送简短的文本提示词,即刻接收一段包含自动生成的音效、人声或环境音的电影感视频片段。您的内容无需额外剪辑即可直接发布到 TikTok、Reels 和 Shorts。无需东拼西凑各类工具,您可以在一次生成中同时获得视觉、节奏和音频,这使得在不同社媒账号上批量测试吸睛点(Hooks)、创意概念和广告角度变得异常简单。

AI 视频生成产品功能展示:竖屏信息流

图生视频:演绎产品故事

通过 Wan 2.5 API,您可以上传一张主视觉图(如产品实拍或角色设计),将其转化为一段简短、动感且与原图风格一致的视频片段。这非常适合将静态目录图片转化为吸睛广告、动态海报或故事片段,在几秒钟内通过镜头运动、光影变化和音频增强您的品牌信息。

AI 视频生成产品功能展示:产品动态演示

专为社媒创作者打造

Evolink AI 提供的 Wan 2.5 API 专为注重速度、产量和一致性的社媒创作者及独立 SaaS 开发者设计,而非追求学术跑分。它专注于 3–10 秒的短片段、竖屏/方屏格式,以及与画面高度契合的音频,因此您的视频可以直接通过 API 落入内容日历、UGC 模版或自动化发布系统中,无需人工逐帧修复。

AI 视频生成产品功能展示:创作者工作流

为何选择通过 Evolink AI 调用 Wan 2.5 API?

Wan 2.5 API 结合了阿里通义万相的音视频模型与 Evolink AI 简洁的路由服务,让您专注于创意构思,而非云端配置或复杂的基础设施。

音画一步生成

大多数 AI 视频工具仍需让您分别处理视觉和声音模型,这增加了操作摩擦、文件管理难度和同步问题。Wan 2.5 API 同步生成视频和音频(包含口型同步和环境音),交付的成果已然是成品级的短视频。对于依靠速度生存的创作者和 SaaS 产品而言,这种一步到位的工作流消除了大量隐形开销。

轻松集成 Wan 2.5

Wan 2.5 本质上是阿里的通义万相模型,但 Evolink AI 将其封装为直观的 Wan 2.5 API,因此您无需处理区域设置、独立的控制台项目或复杂的计费仪表盘。您只需通过清晰的参数调用单一端点,Evolink AI 便会处理到底层 Wan 2.5 模型的路由,使开发者和创作者能极简地将视频生成功能嵌入其产品或内容工作流中。

专为短视频快速试错优化

Wan 2.5 API 专注于生成简短有力的高清片段,让您可以快速迭代创意,而无需等待漫长的渲染。对于营销人员、代理机构和增长团队来说,这完美契合了跨人群、跨地域和跨卖点的持续测试需求。您可以生成大量细分变体,观察数据表现,然后将资源加注在真正能提升指标的创意上。

如何使用 Wan 2.5 API

通过 Evolink AI 连接 Wan 2.5 API,只需几个简单步骤,即可从提示词变为已发布的视频。

1

连接您的 Evolink AI 账户

注册或登录 Evolink AI,创建 API 密钥并启用 Wan 2.5 API 访问权限,以便您的应用能安全地调用视频生成端点,而无需直接接触阿里云。

2

发送提示词、图片及基础设置

选择“文生视频”或“图生视频”,编写清晰的提示词,上传可选的参考图,设置时长和画面比例,然后向 Wan 2.5 API 路由发送一个简单的 JSON 请求。

3

接收、预览并发布您的视频

获取生成的 Wan 2.5 视频 URL,预览音频和视觉效果,然后将其接入您的编辑器、调度器或 SaaS 界面,以便立即下载、发布或进行进一步的自动化处理。

Wan 2.5 API 核心功能

Evolink AI 上的 Wan 2.5 API 专注于真实的社交和营销用例,而非实验室演示,因此每一项功能都对应着明确的创作者收益。

视听一体

原生音频与口型同步

Wan 2.5 API 默认生成带音频的视频,包含人声、特效或音乐,这意味着您的团队无需再为让视频“活起来”而维护单独的配音流程。

短视频优化

社媒专用高清短片

模型针对 3–10 秒的高清视频进行了调优,精准命中 TikTok、Reels 和广告投放的黄金时长,既不浪费预算,也无需等待无人观看的长视频渲染。

灵活输入

灵活的文本或图片输入

您可以从简单的文字脚本开始,或复用现有图片作为基础,这让您能在同一技术栈内将 Wan 2.5 API 灵活应用于创意构思、产品展示和创作者工具中。

全球化就绪

多语言提示词与音频支持

Wan 2.5 API 能很好地处理中文和英文提示词,并保持音频对齐,当您的受众遍布全球不同语言区域时,这一点尤为有用。

电影感

流畅的动态与控制

相比旧版 Wan 模型,该模型提供了更流畅的动作和更好的镜头动态,即使在大规模营销活动中快速生成,视频也更具电影感,不再像粗糙的演示品。

自动化

专为自动化与 SaaS 构建

由于 Wan 2.5 API 通过 Evolink AI 运行,您可以将其接入定时任务(Cron jobs)、无代码工具或完整的 SaaS 后端,根据计划表、信息流或提示词自动生成视频资产。

Wan 2.5 API 与其他 AI 视频模型对比

在成本、时长和理想用例方面将 Wan 2.5 API 与领先的 AI 视频骨干模型进行对比,以便您为每个项目选择合适的模型。

ModelDurationResolutionPriceStrength
Wan 2.5 API3–10 秒片段,专注于短视频吸睛点和社媒故事最高 1080p 高清,提供 480p 和 720p 档位以控制预算在许多按需付费设置中,高清视频生成约为 $0.05/秒质量、成本与速度平衡,具备原生音频和口型同步,适合社媒优先的工作流
Kling 2.6 (可灵)5–10 秒片段,提供更长的高动态镜头选项最高 1080p,具备极强的运动真实感和复杂场景的物理规律表现根据分辨率和优先级,通常在 $0.07–$0.14/秒左右极强的运动质量和物理模拟,适合逼真的数字人视频和动态产品展示
Seedance 1.5 Pro4–12 秒音视频片段,具备灵活的对话设置最高 1080p,音频与视频紧密同步在竞品中通常定位在 $0.05/秒左右(720p 音画生成)音画联合模型,具备精确的口型同步和对话控制,非常适合口播和解说视频
Sora 210–20 秒电影级片段,适合核心主视觉素材720p 到 4K,具备高端电影级画质和细腻的动态标准 Sora 2 的 720p 指导价约为 $0.10/秒,1080p 和 4K 价格更高顶级的真实感和叙事能力,适合旗舰级营销活动和优质品牌内容
Veo 3短至中长片段,专为电影叙事调优高分辨率输出,最高可达 4K(取决于提供商和套餐)外部定价表中高端视频生成常接近 $0.40/秒高端电影美学,适合预告片、发布会视频和专业创意工作室

Wan 2.5 API 常见问题

Everything you need to know about the product and billing.

Wan 2.5 是由阿里通义万相团队开发的 AI 视频模型,能将文本提示词 or 单张图片转化为带有原生音频和口型同步的高清短视频。Evolink AI 提供的 Wan 2.5 API 是一个集成层,通过一个用户友好的接口开放此模型,因此您可以从您的应用、SaaS 产品或创作者工具中调用 Wan 2.5,而无需直接操作阿里云。它专为希望获得可靠音视频生成服务而非管理底层基础设施的开发者、营销人员和社媒创作者设计。
Wan 2.5 API 最擅长制作适合社交平台和效果广告的短故事片段。您可以用它来制作产品解说、吸睛的片头、动态海报以及音画结合的快节奏故事节点。许多团队使用 Wan 2.5 在投入全面制作前测试吸睛点(Hooks)和概念,对同一创意生成多个变体,让真实的互动数据来决定扩大哪个方向的投入。
Wan 2.5 API 在 3–10 秒视频的音画质量、成本和速度之间取得了极佳的平衡,而像 Wan 2.6 这样较新的模型则更侧重于多镜头叙事和高级叙事控制。对于许多日常社交和 UGC 任务,Wan 2.5 已经提供了足够的真实感和动态效果,使其在信息流中看起来很原生,且价格比重型电影级模型更友好。这使其非常适合作为您技术栈中的“主力模型”,尤其是与用于制作优质镜头的更高端选项结合使用时。
Wan 2.5 API 支持“文生视频”和“图生视频”两种模式,您可以通过 Evolink AI 端点中的参数进行选择。在文本模式下,您提供描述场景、风格和节奏的提示词,模型会从零生成一段带有合适音频的新视频。在图片模式下,您上传静态帧、主视觉图或角色,让视频围绕它进行动画化,在保持主体一致性的同时添加运镜、转场和声音。
典型的 Wan 2.5 API 片段时长在 3–10 秒之间,非常适合社交媒体上的吸睛点、转场和快餐式故事。分辨率选项通常涵盖从 480p、720p 到全高清 1080p,具体取决于您选择的设置和套餐。这既能控制渲染时间和成本,又能提供在现代手机屏幕以及竖屏/方屏广告位上清晰展示的视觉效果。
Wan 2.5 API 通常通过基于用量的积分按秒计费,定价与高清视频生成的中端市场水平大致相当。这意味着较短的片段和较低的分辨率消耗的积分较少,而较长或高分辨率的片段消耗较多,让您可以控制预算和质量。结果就是一种“按生成付费”的模式,非常适合实验、营销活动以及需求波动的 SaaS 工作负载。
通过 Evolink AI 提供的 Wan 2.5 API 专为商业用途设计,涵盖效果广告、品牌内容和嵌入式 SaaS 功能。与任何 AI 服务一样,您仍应查阅 Evolink AI 和底层提供商的最新条款,检查针对您所在地区和行业的具体使用准则,并在发布客户广告或高曝光资产之前建立简单的内部审核步骤。
您可以从后端服务、Serverless 函数(无服务器函数)、低代码工具,甚至支持 HTTP 请求的无代码自动化平台调用 Wan 2.5 API。一种常见的模式是在创建新内容、用户提交简报或定期活动计划时触发视频生成。Evolink AI 的文档包含了示例请求、响应对象和错误模式,因此您的工程时间可以用于构建产品逻辑,而不是调试原始基础设施。
POST
/v1/videos/generations

Create Video

Wan 2.5 Video Text to Video (wan2.5-text-to-video) model supports text-to-video generation mode.

Asynchronous processing mode, use the returned task ID to .

Generated video links are valid for 24 hours, please save them promptly.

Request Parameters

modelstringRequiredDefault: wan2.5-text-to-video

Video generation model name.

Examplewan2.5-text-to-video
promptstringRequired

Prompt describing what kind of video to generate.

Notes
  • Limited to 2000 tokens
ExampleA cat playing piano
aspect_ratiostringOptionalDefault: 16:9

Video aspect ratio.

ValueDescription
16:9Landscape video
9:16Portrait video
1:1Square video
4:3Standard video (720p/1080p only)
3:4Portrait standard (720p/1080p only)
Notes
  • 480p supports: 16:9, 9:16, 1:1
  • 720p/1080p supports all ratios
Example16:9
qualitystringOptionalDefault: 720p

Video quality.

ValueDescription
480pLower quality, lower price
720pStandard quality (default)
1080pHigh quality, higher price
Notes
  • Different quality levels support different aspect ratios
Example720p
durationintegerOptional

Duration of the generated video (seconds).

ValueDescription
55 seconds
1010 seconds
Notes
  • Pre-charged based on duration, actual charge based on generated video duration
Example5
prompt_extendbooleanOptionalDefault: true

Whether to enable intelligent prompt rewriting.

Notes
  • When enabled, a large language model will optimize the prompt
  • Effective for prompts that lack detail or are too simple
Exampletrue
callback_urlstringOptional

HTTPS callback address after task completion.

Notes
  • Triggered on completion, failure, or cancellation
  • Sent after billing confirmation
  • HTTPS only, no internal IPs
  • Max length: 2048 chars
  • Timeout: 10s, Max 3 retries
Examplehttps://your-domain.com/webhooks/video-task-completed

Request Example

{
  "model": "wan2.5-text-to-video",
  "prompt": "A cat playing piano",
  "aspect_ratio": "16:9",
  "quality": "720p",
  "duration": 5
}

Response Example

{
  "created": 1757169743,
  "id": "task-unified-1757169743-7cvnl5zw",
  "model": "wan2.5-text-to-video",
  "object": "video.generation.task",
  "progress": 0,
  "status": "pending",
  "task_info": {
    "can_cancel": true,
    "estimated_time": 30,
    "video_duration": 8
  },
  "type": "video",
  "usage": {
    "billing_rule": "per_call",
    "credits_reserved": 5,
    "user_group": "default"
  }
}
Wan 2.5 API:支持音画同步的 AI 视频生成接口 | Evolink AI