Zebraliśmy ponad 100 darmowych modeli AI w jednym punkcie końcowym
W ciągu dwóch dni podłączyliśmy 15 darmowych dostawców do UnoRouter: 134 wiersze darmowych modeli, jeden punkt końcowy zgodny z OpenAI-compatible, $0 za token. Są darmowe nie bez powodu i mają limity zapytań, których nie możemy podnieść. Oto szczera wersja.
Krajobraz darmowych LLM-ów istnieje naprawdę, ale jest rozproszony: Groq, Gemini, Cloudflare, Mistral, OVHcloud i tuzin innych, każdy oddaje realną moc obliczeniową, ukrytą za tuzinem stron rejestracji, tuzinem formatów kluczy i tuzinem niekompatybilnych API. W ciągu dwóch dni odkryliśmy, przetestowaliśmy i scaliliśmy każdego legalnego dostawcę z trwale darmowym dostępem, jakiego udało nam się znaleźć, w UnoRouter. Efekt: 134 wiersze darmowych modeli od 15 dostawców za jednym punktem końcowym zgodnym z OpenAI-compatible i jednym kluczem.
Co dodaliśmy
Piętnastu darmowych dostawców, jeden po drugim: Groq, Gemini, Cerebras, SambaNova, Mistral, Cloudflare Workers AI (dwa konta), GitHub Models, Z.ai, OVHcloud, AI Horde, Pollinations, Cohere, Jina, NVIDIA NIM oraz OpenRouter. To 134 wiersze darmowych modeli: Llama, gpt-oss, Qwen, Mistral, GLM, Nemotron i więcej, plus 30 darmowych modeli osadzeń (embeddings) oraz 13 darmowych modeli obrazu i dźwięku. Każdy z nich jest sprawdzany od początku do końca pod kątem HTTP, streamingu i wywołań narzędzi, zanim trafi na produkcję, czyli przechodzi te same testy autentyczności i sprawności co modele płatne.
Darmowe nie bez powodu
Te modele są naprawdę darmowe i właśnie dlatego mają limity. To dostawca ustala te limity, nie my, i nie możemy ich podnieść. Każdy z dostawców egzekwuje własne ograniczenia: zapytania na minutę, dzienne limity tokenów, budżety neuronów Cloudflare, priorytet w kolejce wolontariuszy. Gdy osiągniesz limit, dostawca zwraca 429, dopóki nie nastąpi reset. Darmowy klucz, który działał dziś rano, może być wyczerpany już po południu. Darmowy poziom to przepustowość na zasadzie najlepszych starań, a nie gwarancja. Jeśli Twoje obciążenie wymaga przewidywalnych opóźnień i braku niespodziewanych 429, użyj modelu płatnego.
Po co w ogóle je agregować
Ponieważ alternatywą jest piętnaście kont. Każdy dostawca ma własną rejestrację, własny format klucza, własny bazowy adres URL i własne dziwactwa: Z.ai mówi ścieżką Zhipu V4, Cloudflare przenosi id konta w adresie URL, AI Horde chce klucza anonimowego, a GitHub blokuje modele za zakresem tokena. Wzięliśmy to wszystko na siebie, żebyś wywoływał je tak samo jak wszystko inne: jeden punkt końcowy zgodny z OpenAI-compatible, jeden klucz, nazwa modelu. Uczciwa zasada, której się trzymamy: jedno prawdziwe konto na dostawcę, akceptacja limitów, nic na masówkę, nic ze wspólnej puli. Udostępniamy darmowy poziom jako prezent, a nie jako odsprzedaż cudzego limitu.
Jak łagodzimy limity
BLOG.POSTS.FREE_MODELS_AGGREGATED.P_FAILOVER
Czego nie zrobiliśmy
Nie dodaliśmy reverse proxy, które bez pozwolenia ponownie serwują flagowe modele OpenAI czy Claude. Nie wciągnęliśmy agregatorów kluczy osobistych, których tokeny są nieprzenoszalne, ani usług typu pula pul, które masowo gromadzą i rotują cudze klucze. Takie rzeczy istnieją, kuszą i są dokładnie tym szarostrefowym bałaganem, który ten gateway ma zastąpić. Każdy dostawca z tej listy świadomie oddaje swój darmowy poziom, na własnych warunkach. Jeśli jakieś źródło nie przeszło tej poprzeczki, nie ma go tutaj.
Wypróbuj to
BLOG.POSTS.FREE_MODELS_AGGREGATED.CTA
Połącz swoje konto za $1, boostuj serwer za $1 każdego miesiąca, poluj na bugi do $50. Właśnie otworzyliśmy Discord UnoRouter.
Wiele modeli obrazów reklamuje edycję multi-referencyjną, ale dostępność u odsprzedawców jest bardzo różna. Wysłaliśmy stały prompt kompozycji sceny z 6 obrazami do każdego kanału obrazów w naszym katalogu. 332 uruchomienia kanałów, 136 unikalnych modeli, 54 z co najmniej jednym zweryfikowanym dostawcą, który przeszedł.
Sondowaliśmy 8 popularnych odsprzedawców Claude przez 17 dni. 183 ich kanałów to w ogóle nie był Claude. Większość to Kiro Cascade lub Codeium noszące tabliczkę z nazwą Claude. Nazwy, liczby i skrypt, którego użyliśmy, żebyś mógł przetestować własnego dostawcę.