Zebraliśmy ponad 100 darmowych modeli AI w jednym punkcie końcowym

Krajobraz darmowych LLM-ów istnieje naprawdę, ale jest rozproszony: Groq, Gemini, Cloudflare, Mistral, OVHcloud i tuzin innych, każdy oddaje realną moc obliczeniową, ukrytą za tuzinem stron rejestracji, tuzinem formatów kluczy i tuzinem niekompatybilnych API. W ciągu dwóch dni odkryliśmy, przetestowaliśmy i scaliliśmy każdego legalnego dostawcę z trwale darmowym dostępem, jakiego udało nam się znaleźć, w UnoRouter. Efekt: 134 wiersze darmowych modeli od 15 dostawców za jednym punktem końcowym zgodnym z OpenAI-compatible i jednym kluczem.

Co dodaliśmy

Piętnastu darmowych dostawców, jeden po drugim: Groq, Gemini, Cerebras, SambaNova, Mistral, Cloudflare Workers AI (dwa konta), GitHub Models, Z.ai, OVHcloud, AI Horde, Pollinations, Cohere, Jina, NVIDIA NIM oraz OpenRouter. To 134 wiersze darmowych modeli: Llama, gpt-oss, Qwen, Mistral, GLM, Nemotron i więcej, plus 30 darmowych modeli osadzeń (embeddings) oraz 13 darmowych modeli obrazu i dźwięku. Każdy z nich jest sprawdzany od początku do końca pod kątem HTTP, streamingu i wywołań narzędzi, zanim trafi na produkcję, czyli przechodzi te same testy autentyczności i sprawności co modele płatne.

Darmowe nie bez powodu

Te modele są naprawdę darmowe i właśnie dlatego mają limity. To dostawca ustala te limity, nie my, i nie możemy ich podnieść. Każdy z dostawców egzekwuje własne ograniczenia: zapytania na minutę, dzienne limity tokenów, budżety neuronów Cloudflare, priorytet w kolejce wolontariuszy. Gdy osiągniesz limit, dostawca zwraca 429, dopóki nie nastąpi reset. Darmowy klucz, który działał dziś rano, może być wyczerpany już po południu. Darmowy poziom to przepustowość na zasadzie najlepszych starań, a nie gwarancja. Jeśli Twoje obciążenie wymaga przewidywalnych opóźnień i braku niespodziewanych 429, użyj modelu płatnego.

Po co w ogóle je agregować

Ponieważ alternatywą jest piętnaście kont. Każdy dostawca ma własną rejestrację, własny format klucza, własny bazowy adres URL i własne dziwactwa: Z.ai mówi ścieżką Zhipu V4, Cloudflare przenosi id konta w adresie URL, AI Horde chce klucza anonimowego, a GitHub blokuje modele za zakresem tokena. Wzięliśmy to wszystko na siebie, żebyś wywoływał je tak samo jak wszystko inne: jeden punkt końcowy zgodny z OpenAI-compatible, jeden klucz, nazwa modelu. Uczciwa zasada, której się trzymamy: jedno prawdziwe konto na dostawcę, akceptacja limitów, nic na masówkę, nic ze wspólnej puli. Udostępniamy darmowy poziom jako prezent, a nie jako odsprzedaż cudzego limitu.

Jak łagodzimy limity

BLOG.POSTS.FREE_MODELS_AGGREGATED.P_FAILOVER

Czego nie zrobiliśmy

Nie dodaliśmy reverse proxy, które bez pozwolenia ponownie serwują flagowe modele OpenAI czy Claude. Nie wciągnęliśmy agregatorów kluczy osobistych, których tokeny są nieprzenoszalne, ani usług typu pula pul, które masowo gromadzą i rotują cudze klucze. Takie rzeczy istnieją, kuszą i są dokładnie tym szarostrefowym bałaganem, który ten gateway ma zastąpić. Każdy dostawca z tej listy świadomie oddaje swój darmowy poziom, na własnych warunkach. Jeśli jakieś źródło nie przeszło tej poprzeczki, nie ma go tutaj.

Wypróbuj to

BLOG.POSTS.FREE_MODELS_AGGREGATED.CTA