Abbiamo aggregato oltre 100 modelli AI gratuiti in un unico endpoint

Il panorama degli LLM gratuiti e reale ma frammentato: Groq, Gemini, Cloudflare, Mistral, OVHcloud e una dozzina di altri offrono ciascuno capacita vera, nascosta dietro una dozzina di pagine di registrazione, una dozzina di formati di chiave e una dozzina di API incompatibili. In due giorni abbiamo scoperto, testato e unito ogni provider permanentemente gratuito e legittimo che abbiamo trovato in UnoRouter. Il risultato: 134 modelli gratuiti elencati da 15 provider dietro un unico endpoint OpenAI-compatible e un'unica chiave.

Cosa abbiamo aggiunto

Quindici provider gratuiti, uno alla volta: Groq, Gemini, Cerebras, SambaNova, Mistral, Cloudflare Workers AI (due account), GitHub Models, Z.ai, OVHcloud, AI Horde, Pollinations, Cohere, Jina, NVIDIA NIM e OpenRouter. Sono 134 modelli gratuiti elencati: Llama, gpt-oss, Qwen, Mistral, GLM, Nemotron e altri, piu 30 modelli di embedding gratuiti e 13 modelli gratuiti per immagini e audio. Ognuno viene testato end to end per HTTP, streaming e tool call prima di andare in produzione, con gli stessi controlli di autenticita e di harness che eseguiamo sui modelli a pagamento.

Gratuiti per un motivo

Questi modelli sono davvero gratuiti, ed e proprio per questo che hanno dei limiti. I limiti li imposta il provider, non noi, e non possiamo aumentarli. Ogni servizio a monte applica i propri limiti di frequenza: richieste al minuto, quote giornaliere di token, budget di neuroni Cloudflare, priorita nella coda dei volontari. Raggiungi un tetto e quel provider restituisce 429 finche non si reimposta. Una chiave gratuita che funzionava stamattina puo essere esaurita entro il pomeriggio. Il piano gratuito offre throughput best-effort, non una garanzia. Se il tuo carico di lavoro richiede latenza prevedibile e nessun 429 a sorpresa, usa un modello a pagamento.

Perche aggregarli del tutto

Perche l'alternativa sono quindici account. Ogni provider ha la propria registrazione, il proprio formato di chiave, il proprio base URL e le proprie stranezze: Z.ai parla il path Zhipu V4, Cloudflare porta l'account id nell'URL, AI Horde vuole una chiave anonima, GitHub blocca i modelli dietro uno scope del token. Abbiamo assorbito tutto questo cosi che tu li chiami come chiami tutto il resto: un unico endpoint OpenAI-compatible, una chiave, un nome di modello. La regola onesta a cui ci atteniamo: un account reale per provider, limiti accettati, niente di coltivato, niente messo in pool. Esponiamo il piano gratuito come un regalo, non come la rivendita della quota di qualcun altro.

Come attenuiamo i limiti

BLOG.POSTS.FREE_MODELS_AGGREGATED.P_FAILOVER

Cosa non abbiamo fatto

Non abbiamo aggiunto reverse proxy che ri-servono i modelli di punta di OpenAI o Claude senza permesso. Non abbiamo incluso aggregatori di chiavi personali i cui token non sono trasferibili, ne servizi pool-of-pools che coltivano e ruotano le chiavi altrui. Esistono, sono allettanti e sono esattamente il caos da mercato grigio che questo gateway intende sostituire. Ogni provider nell'elenco offre il proprio piano gratuito di proposito, secondo i propri termini. Se una sorgente non ha superato quella soglia, qui non c'e.

Provalo

BLOG.POSTS.FREE_MODELS_AGGREGATED.CTA