Wir haben 100+ kostenlose KI-Modelle in einem einzigen Endpunkt gebündelt

Die Landschaft kostenloser LLMs ist real, aber zersplittert: Groq, Gemini, Cloudflare, Mistral, OVHcloud und ein Dutzend weitere verschenken jeweils echte Kapazitaet, versteckt hinter einem Dutzend Anmeldeseiten, einem Dutzend Schluesselformaten und einem Dutzend inkompatibler APIs. In zwei Tagen haben wir jeden legitimen, dauerhaft kostenlosen Anbieter entdeckt, getestet und in UnoRouter zusammengefuehrt, den wir finden konnten. Das Ergebnis: 134 kostenlose Modell-Eintraege von 15 Anbietern hinter einem OpenAI-compatible Endpunkt und einem einzigen Schluessel.

Was wir hinzugefuegt haben

Fuenfzehn kostenlose Anbieter, einer nach dem anderen: Groq, Gemini, Cerebras, SambaNova, Mistral, Cloudflare Workers AI (zwei Konten), GitHub Models, Z.ai, OVHcloud, AI Horde, Pollinations, Cohere, Jina, NVIDIA NIM und OpenRouter. Das sind 134 kostenlose Modell-Eintraege: Llama, gpt-oss, Qwen, Mistral, GLM, Nemotron und mehr, dazu 30 kostenlose Embedding-Modelle und 13 kostenlose Bild- und Audio-Modelle. Jedes einzelne wird durchgaengig auf HTTP, Streaming und Tool-Calls geprueft, bevor es live geht, dieselben Echtheits- und Harness-Pruefungen, die wir auch bei kostenpflichtigen Modellen durchfuehren.

Nicht ohne Grund kostenlos

Diese Modelle sind wirklich kostenlos, und genau deshalb haben sie Grenzen. Der Anbieter legt diese Grenzen fest, nicht wir, und wir koennen sie nicht anheben. Jeder Upstream erzwingt seine eigenen Rate-Limits: Anfragen pro Minute, taegliche Token-Kontingente, Cloudflare-Neuron-Budgets, Prioritaet in der Freiwilligen-Warteschlange. Wer ein Limit erreicht, bekommt von diesem Anbieter ein 429, bis es zuruckgesetzt wird. Ein kostenloser Schluessel, der heute Morgen noch funktionierte, kann am Nachmittag schon erschoepft sein. Der kostenlose Tarif bietet Best-Effort-Durchsatz, keine Garantie. Wenn Ihr Workload vorhersehbare Latenz und keine ueberraschenden 429er braucht, nutzen Sie ein kostenpflichtiges Modell.

Warum sie ueberhaupt buendeln

Weil die Alternative fuenfzehn Konten waeren. Jeder Anbieter hat seine eigene Anmeldung, sein eigenes Schluesselformat, seine eigene Basis-URL und seine eigenen Eigenheiten: Z.ai spricht den Zhipu V4-Pfad, Cloudflare fuehrt die Konto-ID in der URL, AI Horde verlangt einen anonymen Schluessel, GitHub sperrt Modelle hinter einem Token-Scope. Wir haben all das abgefangen, sodass Sie sie genauso aufrufen wie alles andere: ein OpenAI-compatible Endpunkt, ein Schluessel, ein Modellname. Die ehrliche Regel, an die wir uns halten: ein echtes Konto pro Anbieter, Limits akzeptiert, nichts gefarmt, nichts gepoolt. Wir stellen den kostenlosen Tarif als Geschenk bereit, nicht als Weiterverkauf des Kontingents anderer.

Wie wir die Grenzen abfedern

BLOG.POSTS.FREE_MODELS_AGGREGATED.P_FAILOVER

Was wir nicht getan haben

Wir haben keine Reverse-Proxys hinzugefuegt, die OpenAI- oder Claude-Flaggschiffe ohne Erlaubnis weiterverkaufen. Wir haben keine Aggregatoren persoenlicher Schluessel eingebunden, deren Token nicht uebertragbar sind, und keine Pool-of-Pools-Dienste, die fremde Schluessel farmen und rotieren. Die gibt es, sie sind verlockend, und sie sind genau das Graumarkt-Chaos, das dieses Gateway ersetzen soll. Jeder Anbieter auf der Liste verschenkt seinen kostenlosen Tarif bewusst, zu seinen eigenen Bedingungen. Wenn eine Quelle diese Huerde nicht nehmen konnte, ist sie hier nicht dabei.

Probieren Sie es aus

BLOG.POSTS.FREE_MODELS_AGGREGATED.CTA