llama-3.2-1b
Llama 3.2 1B is a 1-billion-parameter language model focused on efficiently performing natural language tasks, such as summarization, dialogue, and multilingual text analysis. Its smaller size allows it to operate...
Modalità
Statistiche rapide
Performance
Parametri supportati
| Parametro | Sempre | Predefinito |
|---|---|---|
| frequency_penalty | - | |
| logit_bias | - | |
| max_tokens | - | |
| min_p | - | |
| presence_penalty | - | |
| repetition_penalty | - | |
| seed | - | |
| stop | - | |
| temperature | - | |
| top_k | - | |
| top_p | - |
Prezzi
| Prezzo di input | $0.00 · 1M token |
| Prezzo di output | $0.00 · 1M token |
| Finestra di contesto | 128K token |
| Endpoint compatibili | openai |
| Provider | Meta |
Chiamare llama-3.2-1b dal tuo codice
Punta qualsiasi SDK compatibile con OpenAI a UnoRouter e richiedi il modello per nome. Sostituisci YOUR_API_KEY con una vera chiave dal tuo dashboard.
curl https://api.unorouter.ai/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "llama-3.2-1b",
"messages": [{"role": "user", "content": "Hello!"}]
}'Domande frequenti
Quanto costa llama-3.2-1b per 1M token?
L'input ha un prezzo di $0.00 per 1M token, l'output di $0.00 per 1M token. La fatturazione è per token, nessun arrotondamento alle dimensioni del batch.
Come accedo a llama-3.2-1b tramite API?
Invia richieste all'endpoint /v1/chat/completions di UnoRouter con model=llama-3.2-1b. Qualsiasi libreria client compatibile con OpenAI funziona. L'autenticazione usa un token Bearer standard.
Qual è la finestra di contesto di llama-3.2-1b?
llama-3.2-1b supporta una finestra di contesto di 128K token, condivisa tra il tuo prompt e la risposta del modello.
Modelli simili
Prova llama-3.2-1b ora
Crea una chiave API e inizia a fare richieste in meno di un minuto.