已發佈
產品

我們將 100 多個免費 AI 模型整合進單一端點

短短兩天內,我們把 15 個免費供應商接入了 UnoRouter:134 個免費模型項目、一個 OpenAI-compatible 端點、每個 token $0。它們免費自有原因,並帶有我們無法調高的速率限制。以下是誠實版的說明。

·閱讀約 3 分鐘·作者:UnoRouter 團隊
公告產品

免費 LLM 的生態是真實存在的,只是散落各處:Groq、Gemini、Cloudflare、Mistral、OVHcloud 以及其他十幾家,各自釋出貨真價實的運算量,卻藏在十幾個註冊頁、十幾種金鑰格式,還有十幾套互不相容的 API 背後。短短兩天內,我們發掘、測試,並把每一個能找到的合法永久免費供應商都併入了 UnoRouter。成果就是:來自 15 個供應商的 134 個免費模型項目,全都藏在一個 OpenAI-compatible 端點與一把金鑰之後。

我們新增了什麼

十五個免費供應商,一個一個接進來:Groq、Gemini、Cerebras、SambaNova、Mistral、Cloudflare Workers AI(兩個帳號)、GitHub Models、Z.ai、OVHcloud、AI Horde、Pollinations、Cohere、Jina、NVIDIA NIM 與 OpenRouter。總共 134 個免費模型項目:Llama、gpt-oss、Qwen、Mistral、GLM、Nemotron 等等,外加 30 個免費嵌入模型以及 13 個免費圖像與音訊模型。每一個在上線前都會就 HTTP、串流與工具呼叫做端到端探測,跟我們對付費模型一樣的真實性與測試框架檢驗。

免費自有原因

這些模型是真正免費的,而這正是它們有限制的原因。那些限制是供應商設的,不是我們,我們也無法調高。每個上游都有自己的一套速率限制:每分鐘請求數、每日 token 配額、Cloudflare 神經元預算、志願者佇列的優先序。一旦觸頂,該供應商就會回傳 429,直到限制重置為止。今天早上還能用的免費金鑰,到了下午可能就已耗盡。免費方案是盡力而為的吞吐量,不是保證。如果你的工作負載需要可預期的延遲、不容意外的 429,那就用付費模型。

為什麼要把它們整合起來

因為不整合的話,就得管十五個帳號。每個供應商都有自己的註冊流程、自己的金鑰格式、自己的 base URL,還有各自的怪癖:Z.ai 走的是 Zhipu V4 路徑,Cloudflare 把帳號 id 放在 URL 裡,AI Horde 想要一把匿名金鑰,GitHub 則把模型擋在一道 token 權限範圍之後。這些我們全都消化掉了,讓你能用呼叫其他一切的方式來呼叫它們:一個 OpenAI-compatible 端點、一把金鑰、一個模型名稱。我們對自己堅守的誠實準則是:每家供應商只用一個真實帳號,配額照收,不刷量、不共池。我們把免費方案當成一份禮物提供,而不是轉售別人的配額。

我們如何緩和這些限制

BLOG.POSTS.FREE_MODELS_AGGREGATED.P_FAILOVER

我們沒有做什麼

我們沒有加入那種未經許可、轉手再供應 OpenAI 或 Claude 旗艦模型的反向代理。我們沒有納入那些 token 不可轉讓的個人金鑰聚合服務,也沒有納入那種刷量並輪換他人金鑰的多重池中池服務。這類東西確實存在,也確實誘人,而它們正是這個閘道想要取代的那團灰色市場亂象。清單上的每一家供應商,都是依自己的條款、刻意把免費方案釋出來的。一個來源若過不了這道門檻,就不會出現在這裡。

親自試試

BLOG.POSTS.FREE_MODELS_AGGREGATED.CTA

相關文章
我們將 100 多個免費 AI 模型整合進單一端點|UnoRouter