llama-3.1-8b
Meta's latest class of model (Llama 3.1) launched with a variety of sizes & flavors. This 8B instruct-tuned version is fast and efficient. It has demonstrated strong performance compared to...
Capacités
Modalités
Statistiques rapides
Performance
Paramètres supportés
| Paramètre | Toujours | Par défaut |
|---|---|---|
| frequency_penalty | - | - |
| logit_bias | - | - |
| max_tokens | - | |
| min_p | - | - |
| presence_penalty | - | - |
| repetition_penalty | - | - |
| response_format | - | - |
| seed | - | |
| stop | - | |
| structured_outputs | - | - |
| temperature | - | |
| tool_choice | - | - |
| tools | - | - |
| top_k | - | - |
| top_p | - |
Tarification
| Prix en entrée | $0.00 · 1M jetons |
| Prix en sortie | $0.00 · 1M jetons |
| Fenêtre de contexte | 32K jetons |
| Points d'accès compatibles | openai |
| Éditeur | Meta |
Appelez llama-3.1-8b depuis votre code
Pointez n'importe quel SDK compatible OpenAI vers UnoRouter et demandez le modèle par son nom. Remplacez YOUR_API_KEY par une vraie clé issue de votre tableau de bord.
curl https://api.unorouter.ai/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "llama-3.1-8b",
"messages": [{"role": "user", "content": "Hello!"}]
}'Questions fréquentes
Combien coûte llama-3.1-8b par 1M jetons ?
L'entrée est facturée à $0.00 par 1M jetons, la sortie à $0.00 par 1M jetons. La facturation se fait au jeton, sans arrondi par lots.
Comment accéder à llama-3.1-8b via l'API ?
Envoyez vos requêtes au point d'accès /v1/chat/completions de UnoRouter avec model=llama-3.1-8b. Toute bibliothèque cliente compatible OpenAI fonctionne. L'authentification utilise un jeton Bearer standard.
Quelle est la fenêtre de contexte de llama-3.1-8b ?
llama-3.1-8b prend en charge une fenêtre de contexte de 32K jetons, partagée entre votre invite et la réponse du modèle.
Modèles similaires
Essayez llama-3.1-8b maintenant
Créez une clé API et commencez à faire des requêtes en moins d'une minute.