已发布
工程

到底哪些图像模型真的能接受 6 张参考图?我们跑了基准测试。

很多图像模型都宣称支持多参考图编辑,但在不同分销商处的可用性差别极大。我们把一段固定的 6 图场景合成 prompt 发给目录里的每一个图像通道。332 次通道运行,136 个独立模型,54 个至少有一个经过验证的可用提供商。

·阅读时间 3 分钟·作者:UnoRouter 团队
工程公告

新一代图像模型可以接受多张参考图加一段文本 prompt,把它们合成成一张输出。一个 prompt,N 张参考,一张合成图。这对视觉小说、保持人物一致的品牌素材、产品 mockup、漫画分镜,以及任何要把已知素材拼成一个场景的工作流都很有用。

麻烦是,市面上几乎所有模型都说自己能做。绝大多数其实不能。有的卡在 1 张参考,有的卡在 4 张,有的接受输入但在第一张之后悄悄丢掉。再加上同一个模型在不同分销商那里行为还不一样,原因是配额、slug 变体、endpoint 没接。所以我们干脆搭了一个基准测试。

fixture 套件

六张固定的 JPEG,覆盖一个典型的 RP 场景合成:一张酒馆背景,加五张人物头像(一个用户侧,四个 NPC)。每一对(提供商,模型)都用同样的六个文件,不按通道改写。六张图加起来大约 500 KB。

文本 prompt 也是固定的。它点名每个角色,按索引引用每张图,要求一张合成图。原文照抄:

text
Compose a single anime-style illustration combining the six reference images: place Sara, the blonde girl with the side braid (image 01), inside the tavern (image 00), interacting with four NPCs - the blonde male hero Trevor (image 02), the bearded ranger Puck (image 03), the bald knight in gold armor (image 04), and the brunette adventurer woman (image 05). Preserve each character's distinctive appearance. Single output image.

基准测试怎么跑

对目录里的每一对(提供商,模型):把六个 fixture 加 prompt POST 到该通道的 /v1/images/edits通过 = HTTP 200,响应里有非空的图像 URL 或 base64。失败 = 非 200、空 body 或形状不对。不做人工打分。基准可复现,可按需重跑,新图像模型上游一出现就会再跑一次。

这里不评图像质量。这次运行只回答一个问题:这个模型,在这条具体通道,此时此刻,是否接受六张参考图加 prompt,并返回一张图?质量评分是另外一遍。

332 次通道运行跑出来了什么

8 个上游分销商,我们在 332 次通道运行 里测了 136 个独立图像模型54 个模型 至少有一个经过验证可用的提供商。快照时间 2026-05-09

按家族汇总。已验证模型 = 该家族里至少有一个通过通道的不同 SKU 数量。通过提供商总数 = 该家族里返回 200 的 (模型, 提供商) 对的总数。

家族已验证模型通过提供商总数
gpt-image-*626
gemini-*-image322
doubao-seedream-*36
flux-*78
qwen-image-edit-*25
wan2.5-i2i12

单模型榜首 按通过提供商数量排序。通过的提供商越多,路由余量越大:某个上游被限速或挂掉时,路由器还能走另一条路径到达同一个模型。

模型通过提供商
gemini-3.1-flash-image-preview8
gpt-image-17
gemini-3-pro-image-preview7
gemini-2.5-flash-image7
gpt-image-26
gpt-image-1-mini4
gpt-image-1.54
flux-schnell3
qwen-image-edit-plus3

为什么同一个模型在一家通过、在另一家失败

三种常见原因。配额耗尽:分销商的上游 key 当天的图像额度烧完了,现在返回 429slug 变体:同一个底层模型在不同分销商那里被暴露成 gpt-image-2gpt-image-2-allgpt-image-2-cgpt-image-2-vip,但只有一部分 slug 真的接到了能跑的后端。endpoint 不对位:有的分销商列了 slug,但从来没接 /v1/images/edits,请求直接 404。

这就是为什么我们持续测,并在请求时直接绕开失败通道。今天通过的模型,明天上游一换可能就开始 429。这一块市场里的静态可用性列表,过时得很快。

现在每个模型上都有 maxImageInputs

目录里每个图像模型的 metadata 块里现在都有 maxImageInputs 字段。通过 6 张参考图基准的模型会被标成 maxImageInputs: 6。目录 UI、API 和路由层都共用同一份形状。

json
{
  "model": "gemini-3.1-flash-image-preview",
  "metadata": {
    "maxImageInputs": 6
  }
}

如果只关心哪些模型能接 6 张图的 payload,直接按这个字段过滤。新模型只要过了同一套基准,就会自动拿到同一个 tag。

上手

上面列出的模型都通过同一个 OpenAI 兼容 endpoint 提供。多参考图编辑按上游定义的样子原样暴露,没有额外包一层。带上六张图和一段 prompt,路由器会替你挑一个能跑的提供商。

领取 API key浏览图像目录,查看完整的已验证清单。

相关文章
到底哪些图像模型真的能接受 6 张参考图?我们跑了基准测试。 | UnoRouter