免费大模型平台测评汇总

测试平台

40+

测试模型

108.8

最高 tok/s

推荐平台

14+

可用模型

2000+

每日免费调用

平台总览

魔搭 ModelScope

首选

免费模型：7 个可用

最佳速度：108.8 tok/s

稳定性：优秀

额度：2000 次/天

推荐：DeepSeek-V4-Flash、Qwen3.5-35B（Thinking）
多模态：Qwen3-Omni-30B（支持视觉）
生图：Z-Image-Turbo（3s/张）

Agnes AI

次选

免费模型：3 个

文本速度：14.8 tok/s

图片生成：9s/张

视频生成：~30s

推荐：agnes-2.0-flash、agnes-image-2.1-flash、agnes-video-v2.0
夜间速度可达 80.8 tok/s

SiliconFlow 硅基流动

备选

免费模型：12 个

最佳速度：90.0 tok/s

稳定性：优秀

额度：无限制

推荐：Hunyuan-A13B（90 tok/s）、Ling-flash-2.0
多模态：Qwen3-Omni-30B（支持视觉）
生图：Kolors（3s/张）

智谱 GLM

不推荐

免费模型：1 个

glm-4-flash：几乎不可用

稳定性：过载严重

额度：极有限

问题：免费层仅 glm-4-flash，速度慢（12-13 tok/s），过载频繁

OpenRouter

放弃

免费模型：28 个

最佳速度：87 tok/s

稳定性：Provider 频繁错误

中文支持：部分优秀

问题：免费层资源不足，大模型不可用，Provider 错误频繁

Ollama Cloud

放弃

免费模型：~6 个小模型

旗舰模型：需付费订阅

免费层能力：不足

API 格式：Ollama 原生

问题：免费层仅有小模型（3B-31B），旗舰模型需订阅

速度排行榜

#	模型	平台	类型	耗时	tokens	速度	状态
1	Qwen3.5-35B-A3B	魔搭	推理	101.0s	10983	108.8	Thinking
1	Qwen3.5-35B-A3B	魔搭	推理	47.8s	7381	154.3	Thinking
2	Qwen3.5-122B-A10B	魔搭	推理	74.0s	6533	88.3	Thinking
2	Qwen3.5-397B-A17B	SiliconFlow	推理	11.75s	1371	116.6	Thinking
3	Hunyuan-A13B-Instruct	SiliconFlow	对话	2.1s	188	90.0	推荐
3	Qwen3.5-122B-A10B	魔搭	推理	88.9s	9933	111.8	Thinking
4	Ling-flash-2.0	SiliconFlow	对话	1.8s	142	79.3	推荐
4	Hunyuan-A13B-Instruct	SiliconFlow	对话	0.92s	98	106.8	推荐
5	Qwen3.6-27B	SiliconFlow	对话	11.1s	500	45.0	推荐
5	agnes-2.0-flash	Agnes AI	对话	2.0s	158	80.8	夜间首选
6	Step-3.5-Flash	SiliconFlow	对话	8.5s	304	36.0	推荐
6	Ling-flash-2.0	SiliconFlow	对话	0.88s	68	77.1	推荐
7	Qwen3-Omni-30B-A3B	SiliconFlow	对话	5.2s	124	23.7	多模态
7	Qwen3.5-27B	魔搭	推理	99.7s	8124	81.5	Thinking
8	DeepSeek-V4-Flash	SiliconFlow	对话	9.13s	185	20.3	可用
8	Step-3.5-Flash	SiliconFlow	对话	6.4s	300	46.9	推荐
9	Qwen3.5-27B	魔搭	推理	40.7s	2444	26.3	Thinking
9	Qwen3-Omni-30B-A3B	SiliconFlow	对话	0.67s	38	56.6	多模态
10	Kimi-K2.5	魔搭	对话	9.6s	157	16.3	可用
10	MiniMax-M2.5	魔搭	推理	27.4s	1499	54.7	Thinking
11	agnes-2.0-flash	Agnes AI	对话	3.72s	34	14.8	白天较慢
11	DeepSeek-V4-Flash	魔搭	对话	13.3s	539	40.7	推荐
12	Ling-2.6-1T	魔搭	对话	10.5s	140	13.3	可用
12	Qwen3.6-27B	SiliconFlow	对话	7.84s	300	38.3	推荐
13	GLM-5	魔搭	对话	11.2s	150	13.4	可用
13	GLM-5	魔搭	推理	26.5s	918	34.7	Thinking
14	GLM-5.1	魔搭	对话	11.2s	144	12.9	可用
14	Ling-2.6-1T	魔搭	对话	7.1s	140	19.6	可用
15	DeepSeek-V4-Flash	SiliconFlow	对话	7.23s	146	20.2	可用
16	Kimi-K2.5	魔搭	对话	8.7s	167	19.3	可用
17	GLM-5.1	魔搭	对话	8.4s	153	18.2	可用
18	DeepSeek-R1	SiliconFlow	推理	18.57s	299	16.1	Thinking

图片/视频生成模型

模型	平台	类型	耗时	状态	说明
Kolors	SiliconFlow	文生图	3.09s	推荐	快手出品，免费文生图
Z-Image-Turbo	魔搭	文生图	~3s	推荐	阿里出品，异步任务模式
agnes-image-2.1-flash	Agnes AI	文生图	9.03s	可用	新加坡 Sapiens AI，免费
FireRed-Image-Edit-1.1	魔搭	图片编辑	~6s	可用	支持图片编辑
agnes-video-v2.0	Agnes AI	视频生成	~30s	可用	5 秒视频，异步任务

推荐方案

首选：魔搭 ModelScope

108.8 tok/s

7 个可用模型 · 2000 次/天 · 需实名认证

文本对话：DeepSeek-V4-Flash、Qwen3.5-27B（Thinking）
多模态：Qwen3-Omni-30B（支持视觉输入）
图片生成：Z-Image-Turbo（3s/张）
优势：额度充足、模型种类多、阿里云支持

白天推荐：SiliconFlow

90.0 tok/s

12 个免费模型 · 无调用限制 · 稳定

文本对话：Hunyuan-A13B（90 tok/s）、Ling-flash-2.0（79 tok/s）
多模态：Qwen3-Omni-30B（支持视觉输入）
图片生成：Kolors（3s/张）
优势：白天速度最快，无调用限制

备选：Agnes AI

14.8 tok/s

3 个免费模型 · 无限制 · 新加坡

文本对话：agnes-2.0-flash（14.8 tok/s 白天 / 80.8 tok/s 夜间）
图片生成：agnes-image-2.1-flash（9s/张）
视频生成：agnes-video-v2.0（~30s/5秒视频）
注意：白天速度较慢，夜间速度更快

各平台额度信息

魔搭 ModelScope

每日总调用2000 次

今日已用48 次

今日剩余1952 次

各模型额度：

Ling-2.6-1T195/200

Qwen3.5-27B199/200

Qwen3.5-35B-A3B96/100

Qwen3.5-122B-A10B98/100

Kimi-K2.548/50

DeepSeek-V4-Flash48/50

GLM-5.148/50

SiliconFlow

每日调用限制无限制

免费模型数12 个

API Keysk-eobqqh...

API 端点api.siliconflow.cn/v1

Agnes AI

每日调用限制无限制

免费模型数3 个

API Keysk-zvLrNC...

API 端点apihub.agnes-ai.com/v1

测试说明

测试日期：2026-06-09 ~ 06-11，共测试 6 个平台、40+ 个模型
测试标准：速度 > 20 tok/s 为可用，< 20 tok/s 为较慢，Provider 错误/超时为放弃
已过滤：GLM-4-flash、GLM-4.5-Air、GLM-4-32B、Seed-OSS-36B、Step-3.5-Flash(魔搭) 等不稳定/不可用模型已移除
多模态模型：Qwen3-Omni-30B-A3B 支持视觉输入（图片理解），可在魔搭和 SiliconFlow 使用
Thinking 模型：Qwen3.5 等默认开启 thinking，token 消耗大。魔搭可用 chat_template_kwargs: {"enable_thinking": false} 关闭
夜间速度更快：Agnes AI 夜间 80.8 tok/s（白天 14.8 的 5.5 倍），魔搭 Qwen3.5-35B 达 154.3 tok/s
智谱 GLM 已放弃：免费层仅 glm-4-flash，速度慢且过载严重，不推荐使用