Disponibile ora
Meta

llama-3.1-8b

Meta's latest class of model (Llama 3.1) launched with a variety of sizes & flavors. This 8B instruct-tuned version is fast and efficient. It has demonstrated strong performance compared to...

TextToolsOpen Weights32K
InputGratis
OutputGratis
Contesto32K
Endpointopenai

Capacità

StrumentiStrutturato

Modalità

Input
text
Output
text

Statistiche rapide

Finestra di contesto32K
Output massimo32K
Modalitàchat
TokenizerLlama3
Limite di conoscenza2023

Performance

Caricamento dati di performance...

Parametri supportati

ParametroSemprePredefinito
frequency_penalty--
logit_bias--
max_tokens-
min_p--
presence_penalty--
repetition_penalty--
response_format--
seed-
stop-
structured_outputs--
temperature-
tool_choice--
tools--
top_k--
top_p-
§ 01

Prezzi

Prezzo di input$0.00 · 1M token
Prezzo di output$0.00 · 1M token
Finestra di contesto32K token
Endpoint compatibiliopenai
ProviderMeta
§ 02

Chiamare llama-3.1-8b dal tuo codice

Punta qualsiasi SDK compatibile con OpenAI a UnoRouter e richiedi il modello per nome. Sostituisci YOUR_API_KEY con una vera chiave dal tuo dashboard.

bash
curl https://api.unorouter.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.1-8b",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Accedi per compilare automaticamente la tua chiave API

§ 03

Domande frequenti

Quanto costa llama-3.1-8b per 1M token?

L'input ha un prezzo di $0.00 per 1M token, l'output di $0.00 per 1M token. La fatturazione è per token, nessun arrotondamento alle dimensioni del batch.

Come accedo a llama-3.1-8b tramite API?

Invia richieste all'endpoint /v1/chat/completions di UnoRouter con model=llama-3.1-8b. Qualsiasi libreria client compatibile con OpenAI funziona. L'autenticazione usa un token Bearer standard.

Qual è la finestra di contesto di llama-3.1-8b?

llama-3.1-8b supporta una finestra di contesto di 32K token, condivisa tra il tuo prompt e la risposta del modello.

§ 04

Modelli simili

Prova llama-3.1-8b ora

Crea una chiave API e inizia a fare richieste in meno di un minuto.

Vedi tutti i modelli