Disponible ahora
Zhipu

glm-4.7-flash

As a 30B-class SOTA model, GLM-4.7-Flash offers a new option that balances performance and efficiency. It is further optimized for agentic coding use cases, strengthening coding capabilities, long-horizon task planning,...

TextReasoningToolsOpen Weights203K
EntradaGratis
SalidaGratis
Contexto203K
Endpointsopenai

Capacidades

RazonamientoHerramientasEstructurado

Modalidades

Entrada
text
Salida
text

Estadísticas rápidas

Ventana de contexto203K
Salida máxima131.1K
Modochat
TokenizadorOther
Cuantizaciónbf16

Rendimiento

Cargando datos de rendimiento...

Parámetros compatibles

ParámetroSiemprePredeterminado
frequency_penalty-(no enviar)
include_reasoning-
logit_bias--
max_tokens-
min_p--
presence_penalty--
reasoning-
repetition_penalty--
response_format-
seed--
stop--
structured_outputs--
temperature1
tool_choice-
tools-
top_k--
top_p0.95
§ 01

Precios

Precio de entrada$0.00 · 1M tokens
Precio de salida$0.00 · 1M tokens
Ventana de contexto203K tokens
Endpoints compatiblesopenai
ProveedorZhipu
§ 02

Llamar a glm-4.7-flash desde tu código

Apunta cualquier SDK compatible con OpenAI a UnoRouter y solicita el modelo por nombre. Reemplaza YOUR_API_KEY con una clave real de tu panel.

bash
curl https://api.unorouter.ai/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-4.7-flash",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Inicia sesión para autocompletar tu clave API

§ 03

Preguntas frecuentes

¿Cuánto cuesta glm-4.7-flash por 1M tokens?

La entrada se cobra a $0.00 por 1M tokens, la salida a $0.00 por 1M tokens. La facturación es por token, sin redondeo a tamaños de lote.

¿Cómo accedo a glm-4.7-flash vía API?

Envía solicitudes al endpoint /v1/chat/completions de UnoRouter con model=glm-4.7-flash. Cualquier biblioteca cliente compatible con OpenAI funciona. La autenticación usa un token Bearer estándar.

¿Cuál es la ventana de contexto de glm-4.7-flash?

glm-4.7-flash soporta una ventana de contexto de 203K tokens, compartida entre tu prompt y la respuesta del modelo.

§ 04

Modelos similares

Prueba glm-4.7-flash ahora

Crea una clave API y empieza a hacer solicitudes en menos de un minuto.

Ver todos los modelos