| # | 模型 | 平台 | 耗时 | tokens | 速度 | 状态 |
|---|---|---|---|---|---|---|
| 1 | Qwen3.5-35B-A3B | 魔搭 | 101.0s | 10983 | Thinking | |
| 1 | Qwen3.5-35B-A3B | 魔搭 | 47.8s | 7381 | Thinking | |
| 2 | Qwen3.5-122B-A10B | 魔搭 | 74.0s | 6533 | Thinking | |
| 2 | Qwen3.5-397B-A17B | SiliconFlow | 11.75s | 1371 | Thinking | |
| 3 | Hunyuan-A13B-Instruct | SiliconFlow | 2.1s | 188 | 推荐 | |
| 3 | Qwen3.5-122B-A10B | 魔搭 | 88.9s | 9933 | Thinking | |
| 4 | Ling-flash-2.0 | SiliconFlow | 1.8s | 142 | 推荐 | |
| 4 | Hunyuan-A13B-Instruct | SiliconFlow | 0.92s | 98 | 推荐 | |
| 5 | Qwen3.6-27B | SiliconFlow | 11.1s | 500 | 推荐 | |
| 5 | agnes-2.0-flash | Agnes AI | 2.0s | 158 | 夜间首选 | |
| 6 | Step-3.5-Flash | SiliconFlow | 8.5s | 304 | 推荐 | |
| 6 | Ling-flash-2.0 | SiliconFlow | 0.88s | 68 | 推荐 | |
| 7 | Qwen3-Omni-30B-A3B | SiliconFlow | 5.2s | 124 | 多模态 | |
| 7 | Qwen3.5-27B | 魔搭 | 99.7s | 8124 | Thinking | |
| 8 | DeepSeek-V4-Flash | SiliconFlow | 9.13s | 185 | 可用 | |
| 8 | Step-3.5-Flash | SiliconFlow | 6.4s | 300 | 推荐 | |
| 9 | Qwen3.5-27B | 魔搭 | 40.7s | 2444 | Thinking | |
| 9 | Qwen3-Omni-30B-A3B | SiliconFlow | 0.67s | 38 | 多模态 | |
| 10 | Kimi-K2.5 | 魔搭 | 9.6s | 157 | 白天较慢 | |
| 10 | MiniMax-M2.5 | 魔搭 | 27.4s | 1499 | Thinking | |
| 11 | agnes-2.0-flash | Agnes AI | 3.72s | 34 | 白天较慢 | |
| 11 | DeepSeek-V4-Flash | 魔搭 | 13.3s | 539 | 推荐 | |
| 12 | Ling-2.6-1T | 魔搭 | 10.5s | 140 | 白天较慢 | |
| 12 | Qwen3.6-27B | SiliconFlow | 7.84s | 300 | 推荐 | |
| 13 | GLM-5 | 魔搭 | 11.2s | 150 | 白天较慢 | |
| 13 | GLM-5 | 魔搭 | 26.5s | 918 | Thinking | |
| 14 | GLM-5.1 | 魔搭 | 11.2s | 144 | 白天较慢 | |
| 14 | Ling-2.6-1T | 魔搭 | 7.1s | 140 | 可用 | |
| 15 | DeepSeek-V4-Flash | SiliconFlow | 7.23s | 146 | 可用 | |
| 16 | Kimi-K2.5 | 魔搭 | 8.7s | 167 | 可用 | |
| 17 | GLM-5.1 | 魔搭 | 8.4s | 153 | 可用 | |
| 18 | DeepSeek-R1 | SiliconFlow | 18.57s | 299 | Thinking |
| 模型 | 发布时间 | 总参数 | 激活参数 | 架构 | 上下文 |
|---|---|---|---|---|---|
| Qwen3.5-397B-A17B | 2026.02 | 397B | 17B | MoE | 262K |
| Qwen3.5-122B-A10B | 2026.02 | 122B | 10B | MoE | 262K |
| Qwen3.5-35B-A3B | 2026.02 | 35B | 3B | MoE | 262K |
| Qwen3.5-27B | 2026.02 | 27B | 27B | Dense | 262K |
| Qwen3.6-27B | 2026.04 | 27B | 27B | Dense | 262K |
| Qwen3-Omni-30B-A3B | 2026.02 | 30B | 3B | MoE | 262K |
| DeepSeek-V4-Flash | 2026 | 284B | 13B | MoE | 1M |
| DeepSeek-R1 | 2025.01 | 671B | 37B | MoE | 128K |
| Hunyuan-A13B-Instruct | 2025.06 | 80B | 13B | MoE | 256K |
| MiniMax-M2.5 | 2025 | 456B | 45B | MoE | 1M |
| Kimi-K2.5 | 2025 | 1T+ | 32B | MoE | 128K |
| GLM-5 | 2026 | 335B | 25B | MoE | 128K |
| GLM-5.1 | 2026 | 335B | 25B | MoE | 128K |
| Ling-flash-2.0 | 2025 | ~14B | ~14B | Dense | 32K |
| Ling-2.6-1T | 2025 | ~1T | ~MoE | MoE | 32K |
| Step-3.5-Flash | 2025 | ~32B | ~32B | Dense | 32K |
| agnes-2.0-flash | 2025 | ~8B | ~8B | Dense | 32K |
| Ling-2.6-1T | 2026.05 | ~1T | ~MoE | MoE | 32K |
| Seed-OSS-36B | 2025.08 | 36B | 36B | Dense | 128K |
| GLM-4.5-Air | 2025 | 未公开 | 未公开 | MoE | 131K |
| 模型 | 平台 | 类型 | 耗时 | 状态 | 说明 |
|---|---|---|---|---|---|
| Kolors | SiliconFlow | 文生图 | 3.09s | 推荐 | 快手出品,免费文生图 |
| Z-Image-Turbo | 魔搭 | 文生图 | ~3s | 推荐 | 阿里出品,异步任务模式 |
| agnes-image-2.1-flash | Agnes AI | 文生图 | 9.03s | 可用 | 新加坡 Sapiens AI,免费 |
| FireRed-Image-Edit-1.1 | 魔搭 | 图片编辑 | ~6s | 可用 | 支持图片编辑 |
| agnes-video-v2.0 | Agnes AI | 视频生成 | ~30s | 可用 | 5 秒视频,异步任务 |
实时动画:点击不同速度,直观感受各 tok/s 的输出体验。相同速度下,代码比文本更紧凑。
chat_template_kwargs: {"enable_thinking": false} 关闭