我们把 100+ 个免费 AI 模型聚合到了一个端点
用两天时间,我们把 15 家免费服务商接入了 UnoRouter:134 个免费模型条目,一个 OpenAI-compatible 端点,每 token $0。它们免费是有原因的,并且带有我们无法提高的速率限制。下面是诚实版的说明。
免费 LLM 的版图真实存在,却十分零散:Groq、Gemini、Cloudflare、Mistral、OVHcloud 以及其他十几家,每一家都拿出了实打实的算力,但都藏在各自的注册页面、各自的密钥格式和各自互不兼容的 API 背后。用两天时间,我们发现、测试并合并了所有能找到的、合法且永久免费的服务商,全部接入 UnoRouter。结果就是:来自 15 家服务商的 134 个免费模型条目,统一在一个 OpenAI-compatible 端点和一把密钥之后。
我们加了什么
15 家免费服务商,一家一家接入:Groq、Gemini、Cerebras、SambaNova、Mistral、Cloudflare Workers AI(两个账户)、GitHub Models、Z.ai、OVHcloud、AI Horde、Pollinations、Cohere、Jina、NVIDIA NIM 以及 OpenRouter。这就是 134 个免费模型条目:Llama、gpt-oss、Qwen、Mistral、GLM、Nemotron 等等,外加 30 个免费向量模型和 13 个免费图像与音频模型。在上线之前,每一个都会就 HTTP、流式输出和工具调用做端到端探测,和我们对付费模型跑的真实性与测试套件检查完全一致。
免费是有原因的
这些模型确实是免费的,而这正是它们带有限制的原因。这些限制是服务商设的,不是我们,我们也无法提高。每一个上游都执行自己的速率限制:每分钟请求数、每日 token 配额、Cloudflare neuron 预算、志愿者队列优先级。一旦触顶,该服务商就会返回 429,直到额度重置。今天早上还能用的免费密钥,到下午可能就被耗尽了。免费层是尽力而为的吞吐,不是保证。如果你的工作负载需要可预测的延迟、不想被突如其来的 429 打断,请使用付费模型。
为什么要把它们聚合起来
因为不聚合的代价就是 15 个账户。每家服务商都有自己的注册流程、自己的密钥格式、自己的 base URL 和自己的怪癖:Z.ai 走 Zhipu V4 的路径,Cloudflare 把账户 id 放在 URL 里,AI Horde 要的是匿名密钥,GitHub 把模型锁在某个 token scope 之后。我们把这一切都消化掉,让你像调用其他一切那样调用它们:一个 OpenAI-compatible 端点、一把密钥、一个模型名。我们对自己定下的诚实准则是:每家服务商只用一个真实账户,接受配额上限,不刷量、不拼池。我们把免费层当作一份礼物呈现,而不是转售别人配额的生意。
我们如何缓和这些限制
BLOG.POSTS.FREE_MODELS_AGGREGATED.P_FAILOVER
我们没有做什么
我们没有加那种未经许可、转手重新提供 OpenAI 或 Claude 旗舰模型的反向代理。我们没有引入那些 token 不可转移的个人密钥聚合器,也没有引入刷量并轮换他人密钥的"池中池"服务。这些东西确实存在,确实诱人,而它们恰恰是这个网关想要取代的灰色市场乱象。名单上的每一家服务商,都是按自己的条款、有意把免费层拿出来共享的。如果某个来源过不了这道门槛,它就不会出现在这里。
来试试
BLOG.POSTS.FREE_MODELS_AGGREGATED.CTA
绑定账号即得 1 美元,助推服务器每月再得 1 美元,提交漏洞最高 50 美元。UnoRouter 的 Discord 刚刚上线。
很多图像模型都宣称支持多参考图编辑,但在不同分销商处的可用性差别极大。我们把一段固定的 6 图场景合成 prompt 发给目录里的每一个图像通道。332 次通道运行,136 个独立模型,54 个至少有一个经过验证的可用提供商。
我们对 8 家热门 Claude 中转商连续 probe 了 17 天,发现其中 183 个 channel 根本不是 Claude,多数是 Kiro Cascade 或 Codeium 套了个 Claude 的壳。点名、数据,以及让你自己测自家 provider 的脚本。