我们把 100+ 个免费 AI 模型聚合到了一个端点

免费 LLM 的版图真实存在，却十分零散：Groq、Gemini、Cloudflare、Mistral、OVHcloud 以及其他十几家，每一家都拿出了实打实的算力，但都藏在各自的注册页面、各自的密钥格式和各自互不兼容的 API 背后。用两天时间，我们发现、测试并合并了所有能找到的、合法且永久免费的服务商，全部接入 UnoRouter。结果就是：来自 15 家服务商的 134 个免费模型条目，统一在一个 OpenAI-compatible 端点和一把密钥之后。

我们加了什么

15 家免费服务商，一家一家接入：Groq、Gemini、Cerebras、SambaNova、Mistral、Cloudflare Workers AI（两个账户）、GitHub Models、Z.ai、OVHcloud、AI Horde、Pollinations、Cohere、Jina、NVIDIA NIM 以及 OpenRouter。这就是 134 个免费模型条目：Llama、gpt-oss、Qwen、Mistral、GLM、Nemotron 等等，外加 30 个免费向量模型和 13 个免费图像与音频模型。在上线之前，每一个都会就 HTTP、流式输出和工具调用做端到端探测，和我们对付费模型跑的真实性与测试套件检查完全一致。

免费是有原因的

这些模型确实是免费的，而这正是它们带有限制的原因。这些限制是服务商设的，不是我们，我们也无法提高。每一个上游都执行自己的速率限制：每分钟请求数、每日 token 配额、Cloudflare neuron 预算、志愿者队列优先级。一旦触顶，该服务商就会返回 429，直到额度重置。今天早上还能用的免费密钥，到下午可能就被耗尽了。免费层是尽力而为的吞吐，不是保证。如果你的工作负载需要可预测的延迟、不想被突如其来的 429 打断，请使用付费模型。

为什么要把它们聚合起来

因为不聚合的代价就是 15 个账户。每家服务商都有自己的注册流程、自己的密钥格式、自己的 base URL 和自己的怪癖：Z.ai 走 Zhipu V4 的路径，Cloudflare 把账户 id 放在 URL 里，AI Horde 要的是匿名密钥，GitHub 把模型锁在某个 token scope 之后。我们把这一切都消化掉，让你像调用其他一切那样调用它们：一个 OpenAI-compatible 端点、一把密钥、一个模型名。我们对自己定下的诚实准则是：每家服务商只用一个真实账户，接受配额上限，不刷量、不拼池。我们把免费层当作一份礼物呈现，而不是转售别人配额的生意。

我们如何缓和这些限制

BLOG.POSTS.FREE_MODELS_AGGREGATED.P_FAILOVER

我们没有做什么

我们没有加那种未经许可、转手重新提供 OpenAI 或 Claude 旗舰模型的反向代理。我们没有引入那些 token 不可转移的个人密钥聚合器，也没有引入刷量并轮换他人密钥的"池中池"服务。这些东西确实存在，确实诱人，而它们恰恰是这个网关想要取代的灰色市场乱象。名单上的每一家服务商，都是按自己的条款、有意把免费层拿出来共享的。如果某个来源过不了这道门槛，它就不会出现在这里。

来试试

BLOG.POSTS.FREE_MODELS_AGGREGATED.CTA