我們將 100 多個免費 AI 模型整合進單一端點

免費 LLM 的生態是真實存在的，只是散落各處：Groq、Gemini、Cloudflare、Mistral、OVHcloud 以及其他十幾家，各自釋出貨真價實的運算量，卻藏在十幾個註冊頁、十幾種金鑰格式，還有十幾套互不相容的 API 背後。短短兩天內，我們發掘、測試，並把每一個能找到的合法永久免費供應商都併入了 UnoRouter。成果就是：來自 15 個供應商的 134 個免費模型項目，全都藏在一個 OpenAI-compatible 端點與一把金鑰之後。

我們新增了什麼

十五個免費供應商，一個一個接進來：Groq、Gemini、Cerebras、SambaNova、Mistral、Cloudflare Workers AI（兩個帳號）、GitHub Models、Z.ai、OVHcloud、AI Horde、Pollinations、Cohere、Jina、NVIDIA NIM 與 OpenRouter。總共 134 個免費模型項目：Llama、gpt-oss、Qwen、Mistral、GLM、Nemotron 等等，外加 30 個免費嵌入模型以及 13 個免費圖像與音訊模型。每一個在上線前都會就 HTTP、串流與工具呼叫做端到端探測，跟我們對付費模型一樣的真實性與測試框架檢驗。

免費自有原因

這些模型是真正免費的，而這正是它們有限制的原因。那些限制是供應商設的，不是我們，我們也無法調高。每個上游都有自己的一套速率限制：每分鐘請求數、每日 token 配額、Cloudflare 神經元預算、志願者佇列的優先序。一旦觸頂，該供應商就會回傳 429，直到限制重置為止。今天早上還能用的免費金鑰，到了下午可能就已耗盡。免費方案是盡力而為的吞吐量，不是保證。如果你的工作負載需要可預期的延遲、不容意外的 429，那就用付費模型。

為什麼要把它們整合起來

因為不整合的話，就得管十五個帳號。每個供應商都有自己的註冊流程、自己的金鑰格式、自己的 base URL，還有各自的怪癖：Z.ai 走的是 Zhipu V4 路徑，Cloudflare 把帳號 id 放在 URL 裡，AI Horde 想要一把匿名金鑰，GitHub 則把模型擋在一道 token 權限範圍之後。這些我們全都消化掉了，讓你能用呼叫其他一切的方式來呼叫它們：一個 OpenAI-compatible 端點、一把金鑰、一個模型名稱。我們對自己堅守的誠實準則是：每家供應商只用一個真實帳號，配額照收，不刷量、不共池。我們把免費方案當成一份禮物提供，而不是轉售別人的配額。

我們如何緩和這些限制

BLOG.POSTS.FREE_MODELS_AGGREGATED.P_FAILOVER

我們沒有做什麼

我們沒有加入那種未經許可、轉手再供應 OpenAI 或 Claude 旗艦模型的反向代理。我們沒有納入那些 token 不可轉讓的個人金鑰聚合服務，也沒有納入那種刷量並輪換他人金鑰的多重池中池服務。這類東西確實存在，也確實誘人，而它們正是這個閘道想要取代的那團灰色市場亂象。清單上的每一家供應商，都是依自己的條款、刻意把免費方案釋出來的。一個來源若過不了這道門檻，就不會出現在這裡。

親自試試

BLOG.POSTS.FREE_MODELS_AGGREGATED.CTA