Disponível agora
Meta

llama-3.2-3b

Llama 3.2 3B is a 3-billion-parameter multilingual large language model, optimized for advanced natural language processing tasks like dialogue generation, reasoning, and summarization. Designed with the latest transformer architecture, it...

TextToolsOpen Weights128K
EntradaGrátis
SaídaGrátis
Contexto128K
Endpointsopenai

Capacidades

Ferramentas

Modalidades

Entrada
text
Saída
text

Estatísticas rápidas

Janela de contexto128K
Saída máxima80K
Modochat
TokenizadorLlama3
Corte de conhecimento2023

Desempenho

Carregando dados de desempenho...

Parâmetros suportados

ParâmetroSemprePadrão
frequency_penalty-
logit_bias-
max_tokens-
min_p-
presence_penalty-
repetition_penalty-
seed-
stop-
temperature-
top_k-
top_p-
§ 01

Preços

Preço de entrada$0.00 · 1M tokens
Preço de saída$0.00 · 1M tokens
Janela de contexto128K tokens
Endpoints compatíveisopenai
FornecedorMeta
§ 02

Chamar llama-3.2-3b do seu código

Aponte qualquer SDK compatível com OpenAI para UnoRouter e solicite o modelo pelo nome. Substitua YOUR_API_KEY por uma chave real do seu painel.

bash
curl https://api.unorouter.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.2-3b",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Entre para preencher automaticamente sua chave API

§ 03

Perguntas frequentes

Quanto custa llama-3.2-3b por 1M tokens?

A entrada custa $0.00 por 1M tokens, a saída $0.00 por 1M tokens. A cobrança é por token, sem arredondamento para tamanhos de lote.

Como acesso llama-3.2-3b via API?

Envie solicitações ao endpoint /v1/chat/completions de UnoRouter com model=llama-3.2-3b. Qualquer biblioteca cliente compatível com OpenAI funciona. A autenticação usa um token Bearer padrão.

Qual é a janela de contexto de llama-3.2-3b?

llama-3.2-3b suporta uma janela de contexto de 128K tokens, compartilhada entre seu prompt e a resposta do modelo.

§ 04

Modelos similares

Experimente llama-3.2-3b agora

Crie uma chave API e comece a fazer solicitações em menos de um minuto.

Ver todos os modelos