免费大模型平台测评汇总

6 个平台 · 40+ 模型实测 · 找到最佳免费 API 方案
测试日期:2026-06-09 ~ 06-11 测试标准:速度 > 20 tok/s 测试环境:Windows 11 + Python 3.12
白天
夜间
6
测试平台
40+
测试模型
108.8
最高 tok/s
3
推荐平台
14+
可用模型
2000+
每日免费调用
平台总览
Agnes AI
次选
免费模型:3 个
文本速度:14.8 tok/s
图片生成:9s/张
视频生成:~30s
推荐:agnes-2.0-flashagnes-image-2.1-flashagnes-video-v2.0
夜间速度可达 80.8 tok/s
SiliconFlow 硅基流动
备选
免费模型:12 个
最佳速度:90.0 tok/s
稳定性:优秀
额度:无限制
推荐:Hunyuan-A13B(90 tok/s)、Ling-flash-2.0
多模态:Qwen3-Omni-30B(支持视觉)
生图:Kolors(3s/张)
智谱 GLM
不推荐
免费模型:1 个
glm-4-flash:几乎不可用
稳定性:过载严重
额度:极有限
问题:免费层仅 glm-4-flash,速度慢(12-13 tok/s),过载频繁
OpenRouter
放弃
免费模型:28 个
最佳速度:87 tok/s
稳定性:Provider 频繁错误
中文支持:部分优秀
问题:免费层资源不足,大模型不可用,Provider 错误频繁
Ollama Cloud
放弃
免费模型:~6 个小模型
旗舰模型:需付费订阅
免费层能力:不足
API 格式:Ollama 原生
问题:免费层仅有小模型(3B-31B),旗舰模型需订阅
速度排行榜
# 模型 平台 类型 耗时 tokens 速度 状态
1 Qwen3.5-35B-A3B 魔搭 推理 101.0s 10983
108.8
Thinking
1 Qwen3.5-35B-A3B 魔搭 推理 47.8s 7381
154.3
Thinking
2 Qwen3.5-122B-A10B 魔搭 推理 74.0s 6533
88.3
Thinking
2 Qwen3.5-397B-A17B SiliconFlow 推理 11.75s 1371
116.6
Thinking
3 Hunyuan-A13B-Instruct SiliconFlow 对话 2.1s 188
90.0
推荐
3 Qwen3.5-122B-A10B 魔搭 推理 88.9s 9933
111.8
Thinking
4 Ling-flash-2.0 SiliconFlow 对话 1.8s 142
79.3
推荐
4 Hunyuan-A13B-Instruct SiliconFlow 对话 0.92s 98
106.8
推荐
5 Qwen3.6-27B SiliconFlow 对话 11.1s 500
45.0
推荐
5 agnes-2.0-flash Agnes AI 对话 2.0s 158
80.8
夜间首选
6 Step-3.5-Flash SiliconFlow 对话 8.5s 304
36.0
推荐
6 Ling-flash-2.0 SiliconFlow 对话 0.88s 68
77.1
推荐
7 Qwen3-Omni-30B-A3B SiliconFlow 对话 5.2s 124
23.7
多模态
7 Qwen3.5-27B 魔搭 推理 99.7s 8124
81.5
Thinking
8 DeepSeek-V4-Flash SiliconFlow 对话 9.13s 185
20.3
可用
8 Step-3.5-Flash SiliconFlow 对话 6.4s 300
46.9
推荐
9 Qwen3.5-27B 魔搭 推理 40.7s 2444
26.3
Thinking
9 Qwen3-Omni-30B-A3B SiliconFlow 对话 0.67s 38
56.6
多模态
10 Kimi-K2.5 魔搭 对话 9.6s 157
16.3
可用
10 MiniMax-M2.5 魔搭 推理 27.4s 1499
54.7
Thinking
11 agnes-2.0-flash Agnes AI 对话 3.72s 34
14.8
白天较慢
11 DeepSeek-V4-Flash 魔搭 对话 13.3s 539
40.7
推荐
12 Ling-2.6-1T 魔搭 对话 10.5s 140
13.3
可用
12 Qwen3.6-27B SiliconFlow 对话 7.84s 300
38.3
推荐
13 GLM-5 魔搭 对话 11.2s 150
13.4
可用
13 GLM-5 魔搭 推理 26.5s 918
34.7
Thinking
14 GLM-5.1 魔搭 对话 11.2s 144
12.9
可用
14 Ling-2.6-1T 魔搭 对话 7.1s 140
19.6
可用
15 DeepSeek-V4-Flash SiliconFlow 对话 7.23s 146
20.2
可用
16 Kimi-K2.5 魔搭 对话 8.7s 167
19.3
可用
17 GLM-5.1 魔搭 对话 8.4s 153
18.2
可用
18 DeepSeek-R1 SiliconFlow 推理 18.57s 299
16.1
Thinking
图片/视频生成模型
模型 平台 类型 耗时 状态 说明
Kolors SiliconFlow 文生图 3.09s 推荐 快手出品,免费文生图
Z-Image-Turbo 魔搭 文生图 ~3s 推荐 阿里出品,异步任务模式
agnes-image-2.1-flash Agnes AI 文生图 9.03s 可用 新加坡 Sapiens AI,免费
FireRed-Image-Edit-1.1 魔搭 图片编辑 ~6s 可用 支持图片编辑
agnes-video-v2.0 Agnes AI 视频生成 ~30s 可用 5 秒视频,异步任务
推荐方案

首选:魔搭 ModelScope

108.8 tok/s
7 个可用模型 · 2000 次/天 · 需实名认证
文本对话:DeepSeek-V4-Flash、Qwen3.5-27B(Thinking)
多模态:Qwen3-Omni-30B(支持视觉输入)
图片生成:Z-Image-Turbo(3s/张)
优势:额度充足、模型种类多、阿里云支持

白天推荐:SiliconFlow

90.0 tok/s
12 个免费模型 · 无调用限制 · 稳定
文本对话:Hunyuan-A13B(90 tok/s)、Ling-flash-2.0(79 tok/s)
多模态:Qwen3-Omni-30B(支持视觉输入)
图片生成:Kolors(3s/张)
优势:白天速度最快,无调用限制

备选:Agnes AI

14.8 tok/s
3 个免费模型 · 无限制 · 新加坡
文本对话:agnes-2.0-flash(14.8 tok/s 白天 / 80.8 tok/s 夜间)
图片生成:agnes-image-2.1-flash(9s/张)
视频生成:agnes-video-v2.0(~30s/5秒视频)
注意:白天速度较慢,夜间速度更快
各平台额度信息

魔搭 ModelScope

每日总调用2000 次
今日已用48 次
今日剩余1952 次

各模型额度:
Ling-2.6-1T195/200
Qwen3.5-27B199/200
Qwen3.5-35B-A3B96/100
Qwen3.5-122B-A10B98/100
Kimi-K2.548/50
DeepSeek-V4-Flash48/50
GLM-5.148/50

SiliconFlow

每日调用限制无限制
免费模型数12 个
API Keysk-eobqqh...
API 端点api.siliconflow.cn/v1

Agnes AI

每日调用限制无限制
免费模型数3 个
API Keysk-zvLrNC...
API 端点apihub.agnes-ai.com/v1

测试说明