现已可用
Google

gemma-4-26b

Gemma 4 26B A4B IT is an instruction-tuned Mixture-of-Experts (MoE) model from Google DeepMind. Despite 25.2B total parameters, only 3.8B activate per token during inference — delivering near-31B quality at...

TextReasoningToolsFilesOpen WeightsVision262.1KVideo
输入免费
输出免费
上下文262.1K
端点openai

能力

推理工具视觉视频结构化

模态

输入
imagetextvideo
输出
text

快速统计

上下文窗口262.1K
最大输出256K
模式chat
分词器Gemma
量化bf16

性能

正在加载性能数据...

支持的参数

参数始终默认值
frequency_penalty-
include_reasoning-
logit_bias--
logprobs--
max_tokens-
min_p--
presence_penalty--
reasoning-
repetition_penalty--
response_format--
seed--
stop--
structured_outputs--
temperature1
tool_choice--
tools--
top_k-64
top_logprobs--
top_p0.95
§ 01

价格

输入价格$0.00 · 百万 Token
输出价格$0.00 · 百万 Token
上下文窗口262.1K Token
兼容端点openai
供应商Google
§ 02

在您的代码中调用 gemma-4-26b

将任意 OpenAI 兼容 SDK 指向 UnoRouter,并按名称请求模型。将 YOUR_API_KEY 替换为您控制台中的真实密钥。

bash
curl https://api.unorouter.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemma-4-26b",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

登录以自动填入您的 API 密钥

§ 03

常见问题

gemma-4-26b 每百万 Token 多少钱?

输入价格 $0.00 / 百万 Token,输出价格 $0.00 / 百万 Token。按 Token 计费,不按批次大小取整。

如何通过 API 访问 gemma-4-26b?

向 UnoRouter 的 /v1/chat/completions 端点发送请求,指定 model=gemma-4-26b。任意 OpenAI 兼容客户端库均可使用。鉴权采用标准 Bearer Token。

gemma-4-26b 的上下文窗口是多少?

gemma-4-26b 支持 262.1K Token 的上下文窗口,由您的提示词和模型响应共同占用。

§ 04

相似模型

立即试用 gemma-4-26b

创建 API 密钥,不到一分钟就能开始请求。

查看全部模型