Disponible maintenant
Meta

llama-3.1-8b

Meta's latest class of model (Llama 3.1) launched with a variety of sizes & flavors. This 8B instruct-tuned version is fast and efficient. It has demonstrated strong performance compared to...

TextToolsOpen Weights32K
EntréeGratuit
SortieGratuit
Contexte32K
Points d'accèsopenai

Capacités

OutilsStructuré

Modalités

Entrée
text
Sortie
text

Statistiques rapides

Fenêtre de contexte32K
Sortie max32K
Modechat
TokenizerLlama3
Date de connaissance2023

Performance

Chargement des performances...

Paramètres supportés

ParamètreToujoursPar défaut
frequency_penalty--
logit_bias--
max_tokens-
min_p--
presence_penalty--
repetition_penalty--
response_format--
seed-
stop-
structured_outputs--
temperature-
tool_choice--
tools--
top_k--
top_p-
§ 01

Tarification

Prix en entrée$0.00 · 1M jetons
Prix en sortie$0.00 · 1M jetons
Fenêtre de contexte32K jetons
Points d'accès compatiblesopenai
ÉditeurMeta
§ 02

Appelez llama-3.1-8b depuis votre code

Pointez n'importe quel SDK compatible OpenAI vers UnoRouter et demandez le modèle par son nom. Remplacez YOUR_API_KEY par une vraie clé issue de votre tableau de bord.

bash
curl https://api.unorouter.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.1-8b",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Connectez-vous pour remplir automatiquement votre clé API

§ 03

Questions fréquentes

Combien coûte llama-3.1-8b par 1M jetons ?

L'entrée est facturée à $0.00 par 1M jetons, la sortie à $0.00 par 1M jetons. La facturation se fait au jeton, sans arrondi par lots.

Comment accéder à llama-3.1-8b via l'API ?

Envoyez vos requêtes au point d'accès /v1/chat/completions de UnoRouter avec model=llama-3.1-8b. Toute bibliothèque cliente compatible OpenAI fonctionne. L'authentification utilise un jeton Bearer standard.

Quelle est la fenêtre de contexte de llama-3.1-8b ?

llama-3.1-8b prend en charge une fenêtre de contexte de 32K jetons, partagée entre votre invite et la réponse du modèle.

§ 04

Modèles similaires

Essayez llama-3.1-8b maintenant

Créez une clé API et commencez à faire des requêtes en moins d'une minute.

Voir tous les modèles