免费大模型平台测评汇总

6 个平台 · 30 模型实测 · 15 个可用 · 找到最佳免费 API 方案
测试日期:2026-06-16 测试任务:输出九九乘法表(81个等式) 测试环境:Windows 11 + Python 3.12
白天
夜间
6
测试平台
30
测试模型
154.2
最高 tok/s
2
推荐平台
15
可用模型
2000+
每日免费调用
平台总览
次选
免费模型:3 个
文本速度:14.8 tok/s
图片生成:4.7~13.9s/张
视频生成:~30s
推荐:agnes-2.0-flashagnes-image-2.1-flashagnes-video-v2.0
夜间速度可达 80.8 tok/s
免费模型:1 个(Qwen3-8B)
价格:0 元/K Tokens
稳定性:良好
额度:不限量(永久免费)
免费:Qwen3-8B(8B 参数,输入输出均为 0 元)
注意:仅 9B 以下小模型永久免费,大模型均需付费
不推荐
免费模型:1 个
glm-4-flash:几乎不可用
稳定性:过载严重
额度:极有限
问题:免费层仅 glm-4-flash,速度慢(12-13 tok/s),过载频繁
不推荐
免费模型:28 个
最佳速度:57 tok/s(Laguna XS.2)
稳定性:Provider 频繁错误
特点:均为小模型,能力有限
可用:Laguna XS.2(57 tok/s)、Nemotron Nano 9B(46 tok/s)
注意:免费层模型普遍偏小(9B-31B),大模型需付费或不可用
放弃
免费模型:~6 个小模型
旗舰模型:需付费订阅
免费层能力:不足
API 格式:Ollama 原生
问题:免费层仅有小模型(3B-31B),旗舰模型需订阅
关注
下载即送免费额度,可体验主流模型
不推荐
仅有智谱 GLM-4.7,速度极慢,与官网一致
关注
偶尔有限免模型,值得关注
后付费
Qwen3.6-35B-A3B,实测 12.2 tok/s
速度排行榜(魔搭免费模型 — 夜间速度)

测试任务:输出九九乘法表(81个等式)。点击模型名旁的复制图标,复制完整的 API 调用示例。

#模型速度tokens状态
1Ling-2.6-flash
154.2
625新秀
2Qwen3.5-35B-A3B
136.3
6430Thinking
3Step-3.5-Flash
131.2
800格式不同
4Ling-2.6-1T
127.9
624新秀
5Step-3.7-Flash
123.5
800格式不同
6Qwen3.5-122B-A10B
99.2
5406Thinking
7MiniMax-M3
91.5
800新旗舰
8GLM-4.7-Flash
86.7
800格式不同
9DeepSeek-V4-Flash
75.8
565推荐
10Qwen3.5-27B
70.9
624Thinking
11GLM-5.1
65.2
565可用
12DeepSeek-V4-Pro
61.5
565可用
13DeepSeek-V3.2
44.5
312可用
14Kimi-K2.5
32.3
566可用
15GLM-5
29.3
565可用
模型参数一览
模型发布时间总参数激活参数架构上下文图片/视频
Ling-2.6-flash2026-04-22104B7.4BMoE262K-
Ling-2.6-1T2026-04-231T-MoE262K-
Qwen3.5-35B-A3B2026-02-2635B3BMoE262K图片+视频
Qwen3.5-122B-A10B2026-02-26122B10BMoE262K图片+视频
Qwen3.5-27B2026-02-2627B27BDense262K图片+视频
Step-3.5-Flash2026-01-30196B11BMoE262K-
Step-3.7-Flash2026-05-29196B11BMoE256K图片+视频
DeepSeek-V4-Flash2026-04-24284B13BMoE1M-
DeepSeek-V4-Pro2026-04-241.6T49BMoE1M-
DeepSeek-V3.22025-12-01671B37BMoE128K-
MiniMax-M32026-06-01428B22BMoE(128e/4a)1M图片+视频
GLM-4.7-Flash2026-01-1930B30BDense203K-
GLM-5.12026-04-08335B25BMoE203K-
GLM-52026-02-12335B25BMoE203K-
Kimi-K2.52026-01-271T32BMoE262K图片
agnes-2.0-flash2025~8B~8BDense32K-
图片/视频生成模型
模型平台类型耗时状态说明
agnes-image-2.1-flash Agnes AI文生图9.7s (动漫) / 13.9s (写实)免费免费,质量可用
agnes-video-v2.0 Agnes AI视频生成~30s免费5 秒视频,异步任务
生图效果实测
模型: agnes-image-2.1-flash | 提示词: "A cute anime girl with fox ears" / "Monaco Grand Prix circuit" / "speedtest logo"
速度体感对比

实时动画:点击不同速度,直观感受各 tok/s 的输出体验。相同速度下,代码比文本更紧凑。

30 tok/s
文本
编码
思考
基于 tokenspeed 项目。英文约 1.3 token/词,30 tok/s 约 23 词/秒。代码比文本信息密度更高,同速下视觉感受不同。

测试说明