已发布
产品

我们把 100+ 个免费 AI 模型聚合到了一个端点

用两天时间,我们把 15 家免费服务商接入了 UnoRouter:134 个免费模型条目,一个 OpenAI-compatible 端点,每 token $0。它们免费是有原因的,并且带有我们无法提高的速率限制。下面是诚实版的说明。

·阅读时间 3 分钟·作者:UnoRouter 团队
公告产品

免费 LLM 的版图真实存在,却十分零散:Groq、Gemini、Cloudflare、Mistral、OVHcloud 以及其他十几家,每一家都拿出了实打实的算力,但都藏在各自的注册页面、各自的密钥格式和各自互不兼容的 API 背后。用两天时间,我们发现、测试并合并了所有能找到的、合法且永久免费的服务商,全部接入 UnoRouter。结果就是:来自 15 家服务商的 134 个免费模型条目,统一在一个 OpenAI-compatible 端点和一把密钥之后。

我们加了什么

15 家免费服务商,一家一家接入:Groq、Gemini、Cerebras、SambaNova、Mistral、Cloudflare Workers AI(两个账户)、GitHub Models、Z.ai、OVHcloud、AI Horde、Pollinations、Cohere、Jina、NVIDIA NIM 以及 OpenRouter。这就是 134 个免费模型条目:Llama、gpt-oss、Qwen、Mistral、GLM、Nemotron 等等,外加 30 个免费向量模型和 13 个免费图像与音频模型。在上线之前,每一个都会就 HTTP、流式输出和工具调用做端到端探测,和我们对付费模型跑的真实性与测试套件检查完全一致。

免费是有原因的

这些模型确实是免费的,而这正是它们带有限制的原因。这些限制是服务商设的,不是我们,我们也无法提高。每一个上游都执行自己的速率限制:每分钟请求数、每日 token 配额、Cloudflare neuron 预算、志愿者队列优先级。一旦触顶,该服务商就会返回 429,直到额度重置。今天早上还能用的免费密钥,到下午可能就被耗尽了。免费层是尽力而为的吞吐,不是保证。如果你的工作负载需要可预测的延迟、不想被突如其来的 429 打断,请使用付费模型。

为什么要把它们聚合起来

因为不聚合的代价就是 15 个账户。每家服务商都有自己的注册流程、自己的密钥格式、自己的 base URL 和自己的怪癖:Z.ai 走 Zhipu V4 的路径,Cloudflare 把账户 id 放在 URL 里,AI Horde 要的是匿名密钥,GitHub 把模型锁在某个 token scope 之后。我们把这一切都消化掉,让你像调用其他一切那样调用它们:一个 OpenAI-compatible 端点、一把密钥、一个模型名。我们对自己定下的诚实准则是:每家服务商只用一个真实账户,接受配额上限,不刷量、不拼池。我们把免费层当作一份礼物呈现,而不是转售别人配额的生意。

我们如何缓和这些限制

BLOG.POSTS.FREE_MODELS_AGGREGATED.P_FAILOVER

我们没有做什么

我们没有加那种未经许可、转手重新提供 OpenAI 或 Claude 旗舰模型的反向代理。我们没有引入那些 token 不可转移的个人密钥聚合器,也没有引入刷量并轮换他人密钥的"池中池"服务。这些东西确实存在,确实诱人,而它们恰恰是这个网关想要取代的灰色市场乱象。名单上的每一家服务商,都是按自己的条款、有意把免费层拿出来共享的。如果某个来源过不了这道门槛,它就不会出现在这里。

来试试

BLOG.POSTS.FREE_MODELS_AGGREGATED.CTA

相关文章
我们把 100+ 个免费 AI 模型聚合到了一个端点 | UnoRouter