Dostępne teraz
Meta

llama-3.3-70b

The Meta Llama 3.3 multilingual large language model (LLM) is a pretrained and instruction tuned generative model in 70B (text in/text out). The Llama 3.3 instruction tuned text only model...

Text128KTools
WejścieDarmowe
WyjścieDarmowe
Kontekst128K
Endpointyopenai

Możliwości

NarzędziaStrukturalne

Modalności

Wejście
text
Wyjście
text

Szybkie statystyki

Okno kontekstu128K
Maks. wyjście24K
Trybchat
TokenizerLlama3
Granica wiedzy2023
Kwantyzacjabf16

Wydajność

Ładowanie danych wydajności...

Obsługiwane parametry

ParametrZawszeDomyślne
frequency_penalty--
logit_bias--
max_tokens-
min_p--
presence_penalty--
repetition_penalty--
response_format--
seed--
stop--
structured_outputs--
temperature-
tool_choice--
tools--
top_k--
top_p-
§ 01

Cennik

Cena wejścia$0.00 · 1M tokenów
Cena wyjścia$0.00 · 1M tokenów
Okno kontekstu128K tokenów
Kompatybilne endpointyopenai
DostawcaMeta
§ 02

Wywołaj llama-3.3-70b ze swojego kodu

Skieruj dowolny SDK kompatybilny z OpenAI na UnoRouter i zażądaj modelu po nazwie. Zastąp YOUR_API_KEY prawdziwym kluczem z twojego panelu.

bash
curl https://api.unorouter.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.3-70b",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Zaloguj się, aby automatycznie wypełnić klucz API

§ 03

Często zadawane pytania

Ile kosztuje llama-3.3-70b za 1M tokenów?

Wejście kosztuje $0.00 za 1M tokenów, wyjście $0.00 za 1M tokenów. Rozliczanie jest per token, bez zaokrąglania do rozmiarów batcha.

Jak uzyskać dostęp do llama-3.3-70b przez API?

Wysyłaj zapytania na endpoint UnoRouter /v1/chat/completions z model=llama-3.3-70b. Działa każda biblioteka klienta kompatybilna z OpenAI. Uwierzytelnianie używa standardowego tokenu Bearer.

Jakie jest okno kontekstu llama-3.3-70b?

llama-3.3-70b obsługuje okno kontekstu 128K tokenów, dzielone między twój prompt a odpowiedź modelu.

§ 04

Podobne modele

Wypróbuj llama-3.3-70b teraz

Utwórz klucz API i zacznij wysyłać zapytania w mniej niż minutę.

Zobacz wszystkie modele