Alibaba Cloud / Qwen生产可用
适用场景中文问答, 结构化输出, agent workflows
路由已配置
视觉JSON 模式
综合价格
对比表
| 模型 | 提供方 | 输入 | 输出 | 上下文 | 能力 | 适用场景 | 延迟 | 状态 |
|---|---|---|---|---|---|---|---|---|
| Tongyi Embedding Vision Flash (2026-03-06)tongyi-embedding-vision-flash-2026-03-06 | Alibaba Cloud / Qwen | ¥0.121 / 1M tokens | 单向计费 | n/a | 视觉JSON 模式 | 中文问答, 结构化输出 | 300-1600ms | 生产可用 |
| Tongyi Embedding Vision Plus (2026-03-06)tongyi-embedding-vision-plus-2026-03-06 | Alibaba Cloud / Qwen | ¥0.403 / 1M tokens | 单向计费 | n/a | 视觉JSON 模式 | 中文问答, 结构化输出 | 300-1600ms | 生产可用 |
| Tongyi Xiaomi Analysis Flashtongyi-xiaomi-analysis-flash | Alibaba Cloud / Qwen | ¥0.164 / 1M tokens | ¥0.328 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 |
| Qwen3 VL Embeddingqwen3-vl-embedding | Alibaba Cloud / Qwen | ¥0.564 / 1M tokens | 单向计费 | n/a | 视觉JSON 模式 | 中文问答, 结构化输出 | 300-1600ms | 生产可用 |
| Qwen3 VL Rerankqwen3-vl-rerank | Alibaba Cloud / Qwen | ¥0.564 / 1M tokens | 单向计费 | n/a | 视觉JSON 模式 | 中文问答, 结构化输出 | 300-1600ms | 生产可用 |
| Qwen Flash Character (2026-02-26)qwen-flash-character-2026-02-26 | Alibaba Cloud / Qwen | ¥0.148 / 1M tokens | ¥1.23 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 |
| Qwen Flash Characterqwen-flash-character | Alibaba Cloud / Qwen | ¥0.205 / 1M tokens | ¥1.23 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 |
| Qwen3.5 Flashqwen3.5-flash | Alibaba Cloud / Qwen | ¥0.161 / 1M tokens | ¥1.61 / 1M tokens | n/a | 流式输出JSON 模式 | 中文问答, 结构化输出 | 800-3200ms | 生产可用 |