Disponibile ora
Zhipu

glm-4.7-flash

As a 30B-class SOTA model, GLM-4.7-Flash offers a new option that balances performance and efficiency. It is further optimized for agentic coding use cases, strengthening coding capabilities, long-horizon task planning,...

TextReasoningToolsOpen Weights203K
InputGratis
OutputGratis
Contesto203K
Endpointopenai

Capacità

RagionamentoStrumentiStrutturato

Modalità

Input
text
Output
text

Statistiche rapide

Finestra di contesto203K
Output massimo131.1K
Modalitàchat
TokenizerOther
Quantizzazionebf16

Performance

Caricamento dati di performance...

Parametri supportati

ParametroSemprePredefinito
frequency_penalty-(non inviare)
include_reasoning-
logit_bias--
max_tokens-
min_p--
presence_penalty--
reasoning-
repetition_penalty--
response_format-
seed--
stop--
structured_outputs--
temperature1
tool_choice-
tools-
top_k--
top_p0.95
§ 01

Prezzi

Prezzo di input$0.00 · 1M token
Prezzo di output$0.00 · 1M token
Finestra di contesto203K token
Endpoint compatibiliopenai
ProviderZhipu
§ 02

Chiamare glm-4.7-flash dal tuo codice

Punta qualsiasi SDK compatibile con OpenAI a UnoRouter e richiedi il modello per nome. Sostituisci YOUR_API_KEY con una vera chiave dal tuo dashboard.

bash
curl https://api.unorouter.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-4.7-flash",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Accedi per compilare automaticamente la tua chiave API

§ 03

Domande frequenti

Quanto costa glm-4.7-flash per 1M token?

L'input ha un prezzo di $0.00 per 1M token, l'output di $0.00 per 1M token. La fatturazione è per token, nessun arrotondamento alle dimensioni del batch.

Come accedo a glm-4.7-flash tramite API?

Invia richieste all'endpoint /v1/chat/completions di UnoRouter con model=glm-4.7-flash. Qualsiasi libreria client compatibile con OpenAI funziona. L'autenticazione usa un token Bearer standard.

Qual è la finestra di contesto di glm-4.7-flash?

glm-4.7-flash supporta una finestra di contesto di 203K token, condivisa tra il tuo prompt e la risposta del modello.

§ 04

Modelli simili

Prova glm-4.7-flash ora

Crea una chiave API e inizia a fare richieste in meno di un minuto.

Vedi tutti i modelli