现已可用
Zhipu

glm-4.7-flash

As a 30B-class SOTA model, GLM-4.7-Flash offers a new option that balances performance and efficiency. It is further optimized for agentic coding use cases, strengthening coding capabilities, long-horizon task planning,...

TextReasoningToolsOpen Weights203K
输入免费
输出免费
上下文203K
端点openai

能力

推理工具结构化

模态

输入
text
输出
text

快速统计

上下文窗口203K
最大输出131.1K
模式chat
分词器Other
量化bf16

性能

正在加载性能数据...

支持的参数

参数始终默认值
frequency_penalty-(不发送)
include_reasoning-
logit_bias--
max_tokens-
min_p--
presence_penalty--
reasoning-
repetition_penalty--
response_format-
seed--
stop--
structured_outputs--
temperature1
tool_choice-
tools-
top_k--
top_p0.95
§ 01

价格

输入价格$0.00 · 百万 Token
输出价格$0.00 · 百万 Token
上下文窗口203K Token
兼容端点openai
供应商Zhipu
§ 02

在您的代码中调用 glm-4.7-flash

将任意 OpenAI 兼容 SDK 指向 UnoRouter,并按名称请求模型。将 YOUR_API_KEY 替换为您控制台中的真实密钥。

bash
curl https://api.unorouter.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-4.7-flash",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

登录以自动填入您的 API 密钥

§ 03

常见问题

glm-4.7-flash 每百万 Token 多少钱?

输入价格 $0.00 / 百万 Token,输出价格 $0.00 / 百万 Token。按 Token 计费,不按批次大小取整。

如何通过 API 访问 glm-4.7-flash?

向 UnoRouter 的 /v1/chat/completions 端点发送请求,指定 model=glm-4.7-flash。任意 OpenAI 兼容客户端库均可使用。鉴权采用标准 Bearer Token。

glm-4.7-flash 的上下文窗口是多少?

glm-4.7-flash 支持 203K Token 的上下文窗口,由您的提示词和模型响应共同占用。

§ 04

相似模型

立即试用 glm-4.7-flash

创建 API 密钥,不到一分钟就能开始请求。

查看全部模型