100以上の無料AIモデルを1つのエンドポイントに集約しました

無料LLMの世界は確かに存在しますが、バラバラに散らばっています。Groq、Gemini、Cloudflare、Mistral、OVHcloudをはじめ十数社が本物のキャパシティを無償提供していますが、それぞれが別々の登録ページ、別々のキー形式、互換性のないAPIの向こう側にあります。2日間かけて、私たちは見つけられる限りの正規かつ恒久無料のプロバイダーをすべて発掘し、テストし、UnoRouterに統合しました。その結果が、15プロバイダー由来の134の無料モデルを、1つのOpenAI-compatibleエンドポイントと1つのキーの背後にまとめたものです。

追加したもの

15の無料プロバイダーを、1つずつ。Groq、Gemini、Cerebras、SambaNova、Mistral、Cloudflare Workers AI（2アカウント）、GitHub Models、Z.ai、OVHcloud、AI Horde、Pollinations、Cohere、Jina、NVIDIA NIM、そしてOpenRouter。合わせて134の無料モデルです。Llama、gpt-oss、Qwen、Mistral、GLM、Nemotronなど、さらに30の無料埋め込みモデルと13の無料の画像・音声モデルも含みます。どのモデルも公開前にHTTP、ストリーミング、ツール呼び出しについて端から端まで検証しており、有料モデルに対して実施しているのと同じ真正性とハーネスのチェックを通しています。

無料には理由がある

これらのモデルは本当に無料であり、だからこそ制限があります。その制限を設定しているのはプロバイダーであって私たちではなく、私たちには引き上げることができません。各アップストリームは独自のレート制限を課しています。毎分のリクエスト数、1日のトークン上限、Cloudflareのニューロン予算、ボランティアキューの優先度などです。上限に達すると、そのプロバイダーはリセットされるまで429を返します。今朝動いていた無料キーが、午後には使い果たされていることもあります。無料枠はベストエフォートのスループットであり、保証ではありません。予測可能なレイテンシと予期せぬ429のない動作が必要なワークロードには、有料モデルをお使いください。

そもそもなぜ集約するのか

そうしなければ15個のアカウントが必要になるからです。各プロバイダーには独自の登録手順、独自のキー形式、独自のベースURL、そして独自のクセがあります。Z.aiはZhipu V4のパスを話し、CloudflareはアカウントIDをURLに載せ、AI Hordeは匿名キーを求め、GitHubはトークンのスコープでモデルをゲートします。私たちはそのすべてを吸収し、あなたが他のすべてを呼び出すのと同じやり方で呼び出せるようにしました。1つのOpenAI-compatibleエンドポイント、1つのキー、そしてモデル名です。私たちが自らに課している正直なルールは、プロバイダーごとに本物のアカウントを1つだけ、上限はそのまま受け入れ、何も水増しせず、何もプールしないことです。私たちは無料枠を贈り物として提供しているのであって、誰か他人の割り当ての転売ではありません。

どうやって制限を和らげるか

BLOG.POSTS.FREE_MODELS_AGGREGATED.P_FAILOVER

私たちがやらなかったこと

私たちは、OpenAIやClaudeのフラッグシップを許可なく再提供するリバースプロキシは追加しませんでした。トークンが譲渡不可な個人キーのアグリゲーターや、他人のキーを水増しして使い回すプール・オブ・プールのサービスも取り込みませんでした。そうしたものは存在し、魅力的にも映りますが、まさにこのゲートウェイが置き換えようとしているグレーマーケットの混乱そのものです。リストにあるすべてのプロバイダーは、自らの規約のもとで意図的に無料枠を提供しています。その基準を通過できなかったソースは、ここにはありません。

試してみる

BLOG.POSTS.FREE_MODELS_AGGREGATED.CTA