अभी उपलब्ध
Meta

llama-3.3-70b

The Meta Llama 3.3 multilingual large language model (LLM) is a pretrained and instruction tuned generative model in 70B (text in/text out). The Llama 3.3 instruction tuned text only model...

Text128KTools
इनपुटमुफ्त
आउटपुटमुफ्त
कॉन्टेक्स्ट128K
एंडपॉइंट्सopenai

क्षमताएं

टूल्ससंरचित

मोडेलिटी

इनपुट
text
आउटपुट
text

त्वरित आंकड़े

कॉन्टेक्स्ट विंडो128K
अधिकतम आउटपुट24K
मोडchat
टोकनाइज़रLlama3
ज्ञान सीमा2023
क्वांटाइज़ेशनbf16

प्रदर्शन

प्रदर्शन डेटा लोड हो रहा है...

समर्थित पैरामीटर

पैरामीटरहमेशाडिफ़ॉल्ट
frequency_penalty--
logit_bias--
max_tokens-
min_p--
presence_penalty--
repetition_penalty--
response_format--
seed--
stop--
structured_outputs--
temperature-
tool_choice--
tools--
top_k--
top_p-
§ 01

मूल्य निर्धारण

इनपुट मूल्य$0.00 · 1M टोकन
आउटपुट मूल्य$0.00 · 1M टोकन
कॉन्टेक्स्ट विंडो128K टोकन
संगत एंडपॉइंट्सopenai
वेंडरMeta
§ 02

अपने कोड से llama-3.3-70b कॉल करें

किसी भी OpenAI-संगत SDK को UnoRouter पर इंगित करें और नाम से मॉडल का अनुरोध करें। YOUR_API_KEY को अपने डैशबोर्ड से एक वास्तविक key से बदलें।

bash
curl https://api.unorouter.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.3-70b",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

अपनी API key auto-fill करने के लिए साइन इन करें

§ 03

अक्सर पूछे जाने वाले प्रश्न

llama-3.3-70b की 1M टोकन के लिए कितनी लागत है?

इनपुट की कीमत 1M टोकन के लिए $0.00 है, आउटपुट 1M टोकन के लिए $0.00। बिलिंग प्रति टोकन होती है, बैच आकारों के लिए कोई rounding नहीं।

मैं llama-3.3-70b को API के माध्यम से कैसे एक्सेस करूँ?

model=llama-3.3-70b के साथ UnoRouter /v1/chat/completions एंडपॉइंट पर अनुरोध भेजें। कोई भी OpenAI-संगत क्लाइंट लाइब्रेरी काम करती है। प्रमाणीकरण एक मानक Bearer टोकन का उपयोग करता है।

llama-3.3-70b की कॉन्टेक्स्ट विंडो क्या है?

llama-3.3-70b 128K टोकन की एक कॉन्टेक्स्ट विंडो का समर्थन करता है, जो आपके prompt और मॉडल की प्रतिक्रिया के बीच साझा होती है।

§ 04

समान मॉडल

अभी llama-3.3-70b आज़माएं

एक API key बनाएं और एक मिनट से कम में अनुरोध करना शुरू करें।

सभी मॉडल देखें