Опубликовано
Инженерия

Какие image-модели реально принимают 6 референсов на входе. Прогнали бенчмарк.

Многие image-модели заявляют мульти-референс редактирование, но доступность сильно отличается у разных реселлеров. Мы отправили фиксированный промпт композиции сцены из 6 картинок на каждый image-канал в каталоге. 332 прогон по каналам, 136 уникальных моделей, 54 хотя бы с одним проверенно проходящим провайдером.

·3 мин чтения·Автор: Команда UnoRouter
инженерияанонс

Современные image-модели берут несколько референс-изображений плюс один текстовый промпт и собирают из этого одну композицию. Один промпт, N референсов, одна сборка. Полезно для визуальных новелл, бренд-контента с согласованными персонажами, продуктовых мокапов, комиксных кадров и любого пайплайна, где сцена собирается из заранее известных элементов.

Подвох: почти все модели на рынке заявляют, что умеют. Большинство не умеет. Кто-то режет на 1 референсе, кто-то на 4, кто-то принимает входы и молча игнорирует всё после первого. Сверху ещё одна и та же модель ведёт себя по-разному у разных реселлеров из-за квот, вариантов слага и нераспаянного эндпоинта. Поэтому собрали бенчмарк.

Набор фикстур

Шесть фиксированных JPEG, покрывающих типичную RP-сцену: фон таверны и пять портретов персонажей (один на стороне пользователя, четыре NPC). Одни и те же шесть файлов для каждой пары (провайдер, модель), никакой переписи под канал. Суммарный пейлоад примерно 500 КБ.

Текстовый промпт тоже фиксирован. Называет каждого персонажа, ссылается на каждую картинку по индексу и просит одну композицию. Дословно:

text
Compose a single anime-style illustration combining the six reference images: place Sara, the blonde girl with the side braid (image 01), inside the tavern (image 00), interacting with four NPCs - the blonde male hero Trevor (image 02), the bearded ranger Puck (image 03), the bald knight in gold armor (image 04), and the brunette adventurer woman (image 05). Preserve each character's distinctive appearance. Single output image.

Как работает бенчмарк

Для каждой пары (провайдер, модель) в каталоге: POST шести фикстур и промпта на /v1/images/edits этого канала. Pass = HTTP 200 с непустым URL картинки или base64-пейлоадом в ответе. Fail = не 200, пустое тело или несовпадение формы. Без человеческой оценки. Бенчмарк воспроизводим, перезапускается по требованию и сам идёт по новой, как только в апстриме появляется новая image-модель.

Визуальное качество мы здесь не оцениваем. Этот прогон отвечает на один вопрос: принимает ли модель шесть референсов плюс промпт и возвращает ли картинку на этом конкретном канале прямо сейчас? Оценка качества это отдельный проход.

Что показали 332 прогона

По 8 апстрим-реселлерам прогнали 136 уникальных image-моделей в 332 прогон по каналам. 54 модели имеют хотя бы одного проверенно проходящего провайдера. Снимок от 2026-05-09.

Сгруппировано по семействам. Verified models = различные SKU в семействе, у которых есть хотя бы один проходящий канал. Сумма проходящих провайдеров = общее число пар (модель, провайдер), вернувших 200 в семействе.

СемействоПроверенных моделейСумма проходящих провайдеров
gpt-image-*626
gemini-*-image322
doubao-seedream-*36
flux-*78
qwen-image-edit-*25
wan2.5-i2i12

Лучшие отдельные модели по числу проходящих провайдеров. Больше проходящих провайдеров значит больше запаса для роутинга: если один апстрим режется лимитами или падает, у роутера есть другой путь к той же модели.

МодельПроходящих провайдеров
gemini-3.1-flash-image-preview8
gpt-image-17
gemini-3-pro-image-preview7
gemini-2.5-flash-image7
gpt-image-26
gpt-image-1-mini4
gpt-image-1.54
flux-schnell3
qwen-image-edit-plus3

Почему модель проходит у одного реселлера и падает у другого

Три типичных причины. Квота кончилась: апстрим-ключ реселлера выжег дневной image-лимит и теперь отвечает 429. Варианты слага: одна и та же модель у разных реселлеров живёт как gpt-image-2, gpt-image-2-all, gpt-image-2-c и gpt-image-2-vip, но к рабочему бэкенду подключена только часть слагов. Несовпадение эндпоинта: некоторые реселлеры выставляют слаг, но никогда не подключали /v1/images/edits, и запрос отдаёт 404.

Именно поэтому мы тестируем непрерывно и обходим падающие каналы прямо во время запроса. Модель, которая проходит сегодня, может завтра начать отдавать 429, если реселлер сменит апстрим. Статичные списки доступности в этом углу рынка стареют быстро.

maxImageInputs теперь у каждой модели

У каждой image-модели в каталоге теперь есть поле maxImageInputs в блоке метаданных. Моделям, прошедшим бенчмарк на 6 референсах, ставим maxImageInputs: 6. Эту же форму используют UI каталога, API и слой роутинга.

json
{
  "model": "gemini-3.1-flash-image-preview",
  "metadata": {
    "maxImageInputs": 6
  }
}

Если важно только, какие модели примут пейлоад из 6 картинок, фильтруйте по этому полю. Новые модели получают тот же тег, как только проходят тот же бенчмарк.

Попробовать

Все указанные модели доступны через один OpenAI-совместимый эндпоинт. Мульти-референс image edit выставляется ровно так, как определяет апстрим, без лишней обёртки. Прислали шесть картинок и промпт, роутер выбирает рабочего провайдера.

Получите API-ключ или просмотрите каталог image-моделей, чтобы увидеть весь проверенный список.

Похожие посты
Инженерия··4 мин чтения
Ваш дешёвый Claude скорее всего фейк. Мы поймали 183 таких.

Мы 17 дней пробили 8 популярных реселлеров Claude. 183 их канала вообще не были Claude. Чаще всего это Kiro Cascade или Codeium под чужой вывеской. Имена, цифры и скрипт, которым вы можете проверить своего провайдера.

Инженерия··2 мин чтения
Натравили сканер агентов от Cloudflare на наш сайт. Получили 100/100.

Cloudflare выпустил сканер, который оценивает готовность сайта к работе с AI-агентами. Мы получили чистые 100/100 и максимальный Level 5. Что он проверяет и почему большинство сайтов проваливаются.

Запуск··1 мин чтения
Нам надоел поддельный Claude. Поэтому мы построили UnoRouter.

Падения каждую вторую неделю. Премиум-модели тихо подменяют на дешёвые клоны. Когда лопнуло терпение, мы выкатили свой роутер и сделали его параноиком в обоих смыслах. История запуска.

Какие image-модели реально принимают 6 референсов на входе. Прогнали бенчмарк. | UnoRouter