llama-3.2-1b
Llama 3.2 1B is a 1-billion-parameter language model focused on efficiently performing natural language tasks, such as summarization, dialogue, and multilingual text analysis. Its smaller size allows it to operate...
Modalités
Statistiques rapides
Performance
Paramètres supportés
| Paramètre | Toujours | Par défaut |
|---|---|---|
| frequency_penalty | - | |
| logit_bias | - | |
| max_tokens | - | |
| min_p | - | |
| presence_penalty | - | |
| repetition_penalty | - | |
| seed | - | |
| stop | - | |
| temperature | - | |
| top_k | - | |
| top_p | - |
Tarification
| Prix en entrée | $0.00 · 1M jetons |
| Prix en sortie | $0.00 · 1M jetons |
| Fenêtre de contexte | 128K jetons |
| Points d'accès compatibles | openai |
| Éditeur | Meta |
Appelez llama-3.2-1b depuis votre code
Pointez n'importe quel SDK compatible OpenAI vers UnoRouter et demandez le modèle par son nom. Remplacez YOUR_API_KEY par une vraie clé issue de votre tableau de bord.
curl https://api.unorouter.ai/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "llama-3.2-1b",
"messages": [{"role": "user", "content": "Hello!"}]
}'Questions fréquentes
Combien coûte llama-3.2-1b par 1M jetons ?
L'entrée est facturée à $0.00 par 1M jetons, la sortie à $0.00 par 1M jetons. La facturation se fait au jeton, sans arrondi par lots.
Comment accéder à llama-3.2-1b via l'API ?
Envoyez vos requêtes au point d'accès /v1/chat/completions de UnoRouter avec model=llama-3.2-1b. Toute bibliothèque cliente compatible OpenAI fonctionne. L'authentification utilise un jeton Bearer standard.
Quelle est la fenêtre de contexte de llama-3.2-1b ?
llama-3.2-1b prend en charge une fenêtre de contexte de 128K jetons, partagée entre votre invite et la réponse du modèle.
Modèles similaires
Essayez llama-3.2-1b maintenant
Créez une clé API et commencez à faire des requêtes en moins d'une minute.