免费大模型平台测评汇总

6 个平台 · 40+ 模型实测 · 找到最佳免费 API 方案
测试日期:2026-06-09 ~ 06-11 测试标准:速度 > 20 tok/s 测试环境:Windows 11 + Python 3.12
白天
夜间
6
测试平台
40+
测试模型
108.8
最高 tok/s
3
推荐平台
14+
可用模型
2000+
每日免费调用
平台总览
次选
免费模型:3 个
文本速度:14.8 tok/s
图片生成:4.7~13.9s/张
视频生成:~30s
推荐:agnes-2.0-flashagnes-image-2.1-flashagnes-video-v2.0
夜间速度可达 80.8 tok/s
免费模型:12 个
最佳速度:90.0 tok/s
稳定性:优秀
额度:无限制
推荐:Hunyuan-A13B(90 tok/s)、Ling-flash-2.0
生图:Kolors(5s/张,质量高)
不推荐
免费模型:1 个
glm-4-flash:几乎不可用
稳定性:过载严重
额度:极有限
问题:免费层仅 glm-4-flash,速度慢(12-13 tok/s),过载频繁
不推荐
免费模型:28 个
最佳速度:57 tok/s(Laguna XS.2)
稳定性:Provider 频繁错误
特点:均为小模型,能力有限
可用:Laguna XS.2(57 tok/s)、Nemotron Nano 9B(46 tok/s)
注意:免费层模型普遍偏小(9B-31B),大模型需付费或不可用
放弃
免费模型:~6 个小模型
旗舰模型:需付费订阅
免费层能力:不足
API 格式:Ollama 原生
问题:免费层仅有小模型(3B-31B),旗舰模型需订阅
速度排行榜
#模型平台耗时tokens速度状态
1Qwen3.5-35B-A3B魔搭101.0s10983
108.8
Thinking
1Qwen3.5-35B-A3B魔搭47.8s7381
154.3
Thinking
2Qwen3.5-122B-A10B魔搭74.0s6533
88.3
Thinking
2Qwen3.5-397B-A17BSiliconFlow11.75s1371
116.6
Thinking
3Hunyuan-A13B-InstructSiliconFlow2.1s188
90.0
推荐
3Qwen3.5-122B-A10B魔搭88.9s9933
111.8
Thinking
4Ling-flash-2.0SiliconFlow1.8s142
79.3
推荐
4Hunyuan-A13B-InstructSiliconFlow0.92s98
106.8
推荐
5Qwen3.6-27BSiliconFlow11.1s500
45.0
推荐
5agnes-2.0-flashAgnes AI2.0s158
80.8
夜间首选
6Step-3.5-FlashSiliconFlow8.5s304
36.0
推荐
6Ling-flash-2.0SiliconFlow0.88s68
77.1
推荐
7Qwen3-Omni-30B-A3BSiliconFlow5.2s124
23.7
多模态
7Qwen3.5-27B魔搭99.7s8124
81.5
Thinking
8DeepSeek-V4-FlashSiliconFlow9.13s185
20.3
可用
8Step-3.5-FlashSiliconFlow6.4s300
46.9
推荐
9Qwen3.5-27B魔搭40.7s2444
26.3
Thinking
9Qwen3-Omni-30B-A3BSiliconFlow0.67s38
56.6
多模态
10Kimi-K2.5魔搭9.6s157
16.3
白天较慢
10MiniMax-M2.5魔搭27.4s1499
54.7
Thinking
11agnes-2.0-flashAgnes AI3.72s34
14.8
白天较慢
11DeepSeek-V4-Flash魔搭13.3s539
40.7
推荐
12Ling-2.6-1T魔搭10.5s140
13.3
白天较慢
12Qwen3.6-27BSiliconFlow7.84s300
38.3
推荐
13GLM-5魔搭11.2s150
13.4
白天较慢
13GLM-5魔搭26.5s918
34.7
Thinking
14GLM-5.1魔搭11.2s144
12.9
白天较慢
14Ling-2.6-1T魔搭7.1s140
19.6
可用
15DeepSeek-V4-FlashSiliconFlow7.23s146
20.2
可用
16Kimi-K2.5魔搭8.7s167
19.3
可用
17GLM-5.1魔搭8.4s153
18.2
可用
18DeepSeek-R1SiliconFlow18.57s299
16.1
Thinking
模型参数一览
模型发布时间总参数激活参数架构上下文
Qwen3.5-397B-A17B2026.02397B17BMoE262K
Qwen3.5-122B-A10B2026.02122B10BMoE262K
Qwen3.5-35B-A3B2026.0235B3BMoE262K
Qwen3.5-27B2026.0227B27BDense262K
Qwen3.6-27B2026.0427B27BDense262K
Qwen3-Omni-30B-A3B2026.0230B3BMoE262K
DeepSeek-V4-Flash2026284B13BMoE1M
DeepSeek-R12025.01671B37BMoE128K
Hunyuan-A13B-Instruct2025.0680B13BMoE256K
MiniMax-M2.52025456B45BMoE1M
Kimi-K2.520251T+32BMoE128K
GLM-52026335B25BMoE128K
GLM-5.12026335B25BMoE128K
Ling-flash-2.02025~14B~14BDense32K
Ling-2.6-1T2026.05~1T~MoEMoE32K
Step-3.5-Flash2025~32B~32BDense32K
agnes-2.0-flash2025~8B~8BDense32K
Seed-OSS-36B2025.0836B36BDense128K
GLM-4.5-Air2025未公开未公开MoE131K
图片/视频生成模型
模型平台类型耗时状态说明
KolorsSiliconFlow文生图4.7s (动漫) / 5.7s (写实)推荐快手出品,1024x1024,质量高
agnes-image-2.1-flashAgnes AI文生图9.7s (动漫) / 13.9s (写实)可用Sapiens AI,免费,速度快
Z-Image-Turbo魔搭文生图-已下线2026-06 确认已从 API 下线
FireRed-Image-Edit-1.1魔搭图片编辑-已下线2026-06 确认已从 API 下线
agnes-video-v2.0Agnes AI视频生成~30s可用5 秒视频,异步任务
生图效果实测
提示词: "A cute anime girl with fox ears and a fluffy tail, wearing a racing outfit" / "Monaco Grand Prix circuit at golden hour sunset"
查看完整提示词与模型版本
Kolors v1 — Kwai-Kolors/Kolors via SiliconFlow API
agnes-image-2.1-flash — Agnes AI (Sapiens AI) API

Prompt 1 (动漫赛马娘):
A cute anime girl with fox ears and a fluffy tail, wearing a racing outfit, in the style of Uma Musume Pretty Derby, vibrant colors, detailed illustration, kawaii, dynamic pose
Prompt 2 (摩纳哥赛道):
Real photography of Monaco Grand Prix circuit at golden hour sunset, Formula 1 race cars speeding through the famous tunnel section, dramatic lighting, professional motorsport photography, cinematic, 8K
Prompt 3 (测速Logo):
A modern minimalist speedtest logo icon, digital speedometer gauge with glowing neon arc, lightning bolt symbol in the center, dark background with gradient blue to purple, clean vector style, tech UI design, 4K quality, no text
速度体感对比

实时动画:点击不同速度,直观感受各 tok/s 的输出体验。相同速度下,代码比文本更紧凑。

30 tok/s
文本
编码
思考
基于 tokenspeed 项目。英文约 1.3 token/词,30 tok/s 约 23 词/秒。代码比文本信息密度更高,同速下视觉感受不同。
其他值得关注的平台
关注
下载即送免费额度,可体验主流模型
不推荐
仅有智谱 GLM-4.7,速度极慢,与官网一致
关注
偶尔有限免模型,值得关注

测试说明