Reunimos mais de 100 modelos de IA gratuitos em um unico endpoint

O cenario de LLMs gratuitas e real, mas esta espalhado: Groq, Gemini, Cloudflare, Mistral, OVHcloud e mais uma duzia de outros oferecem capacidade genuina, cada um por tras de uma pagina de cadastro propria, um formato de chave proprio e uma API incompativel. Em dois dias, descobrimos, testamos e unimos ao UnoRouter todos os provedores legitimos com camada gratuita permanente que conseguimos. O resultado: 134 linhas de modelos gratuitos de 15 provedores por tras de um unico endpoint OpenAI-compatible e uma unica chave.

O que adicionamos

Quinze provedores gratuitos, um de cada vez: Groq, Gemini, Cerebras, SambaNova, Mistral, Cloudflare Workers AI (duas contas), GitHub Models, Z.ai, OVHcloud, AI Horde, Pollinations, Cohere, Jina, NVIDIA NIM e OpenRouter. Sao 134 linhas de modelos gratuitos: Llama, gpt-oss, Qwen, Mistral, GLM, Nemotron e mais, alem de 30 modelos de embedding gratuitos e 13 modelos gratuitos de imagem e audio. Cada um e testado de ponta a ponta para HTTP, streaming e chamadas de ferramentas antes de entrar no ar, as mesmas verificacoes de autenticidade e de harness que rodamos nos modelos pagos.

Gratuitos por um motivo

Esses modelos sao realmente gratuitos, e e justamente por isso que tem limites. Quem define esses limites e o provedor, nao nos, e nao podemos aumenta-los. Cada upstream impoe seus proprios limites de taxa: requisicoes por minuto, cotas diarias de tokens, orcamentos de neurons da Cloudflare, prioridade em fila de voluntarios. Quando voce atinge um limite, aquele provedor retorna 429 ate que ele seja reiniciado. Uma chave gratuita que funcionou de manha pode estar esgotada a tarde. A camada gratuita e throughput de melhor esforco, nao uma garantia. Se sua carga de trabalho precisa de latencia previsivel e nenhum 429 de surpresa, use um modelo pago.

Por que agrega-los, afinal

Porque a alternativa sao quinze contas. Cada provedor tem seu proprio cadastro, seu proprio formato de chave, sua propria base URL e suas proprias peculiaridades: a Z.ai fala o caminho Zhipu V4, a Cloudflare carrega o id da conta na URL, a AI Horde quer uma chave anonima, o GitHub limita modelos por escopo de token. Absorvemos tudo isso para que voce os chame da mesma forma que chama todo o resto: um unico endpoint OpenAI-compatible, uma chave, um nome de modelo. A regra honesta que seguimos para nos mesmos: uma conta real por provedor, limites aceitos, nada cultivado, nada agrupado. Oferecemos a camada gratuita como um presente, nao como revenda da cota de outra pessoa.

Como suavizamos os limites

BLOG.POSTS.FREE_MODELS_AGGREGATED.P_FAILOVER

O que nao fizemos

Nao adicionamos proxies reversos que reservem modelos de ponta da OpenAI ou da Claude sem permissao. Nao incluimos agregadores de chaves pessoais cujos tokens sao intransferiveis, nem servicos de pool de pools que cultivam e rotacionam chaves alheias. Eles existem, sao tentadores e sao exatamente a bagunca de mercado paralelo que este gateway veio substituir. Cada provedor da lista oferece sua camada gratuita de proposito, sob seus proprios termos. Se uma fonte nao passou nesse criterio, ela nao esta aqui.

Experimente

BLOG.POSTS.FREE_MODELS_AGGREGATED.CTA