कौन से इमेज मॉडल वास्तव में 6 reference inputs लेते हैं? हमने बेंचमार्क चलाया।

आधुनिक इमेज मॉडल कई reference images प्लस एक text prompt ले सकते हैं और उन्हें एकल आउटपुट में compose कर सकते हैं। एक prompt, N references, एक composite। visual novels, सुसंगत किरदारों के साथ ब्रांड collateral, उत्पाद mockups, comic panels, और किसी भी workflow के लिए उपयोगी जिसे ज्ञात भागों से इकट्ठा किए गए दृश्य की आवश्यकता है।

पकड़: marketplace में हर मॉडल यह करने का दावा करता है। अधिकांश नहीं करते। कुछ 1 reference पर cap करते हैं, कुछ 4 पर, कुछ inputs स्वीकार करते हैं लेकिन पहले के बाद सब कुछ चुपचाप अनदेखा करते हैं। और इसके ऊपर वही मॉडल पुनर्विक्रेताओं के बीच quotas, slug variants, और गायब endpoint wiring के कारण अलग व्यवहार करता है। तो हमने बेंचमार्क चलाया।

Fixture सेट

एक विशिष्ट रोलप्ले scene composition को कवर करने वाली छह fixed JPEGs: एक tavern पृष्ठभूमि और पाँच चरित्र चित्र (एक user-side और चार NPCs)। हर (provider, model) pair के लिए वही छह फाइलें, कोई per-channel rewriting नहीं। छह images में कुल payload लगभग 500 KB।

text prompt भी fixed है। यह प्रत्येक चरित्र का नाम लेता है, सूचकांक द्वारा प्रत्येक image का संदर्भ देता है, और एकल composite के लिए पूछता है। शब्दशः:

text

Compose a single anime-style illustration combining the six reference images: place Sara, the blonde girl with the side braid (image 01), inside the tavern (image 00), interacting with four NPCs - the blonde male hero Trevor (image 02), the bearded ranger Puck (image 03), the bald knight in gold armor (image 04), and the brunette adventurer woman (image 05). Preserve each character's distinctive appearance. Single output image.

बेंचमार्क कैसे चलता है

कैटलॉग में हर (provider, model) pair के लिए: छह fixtures प्लस prompt को उस चैनल के /v1/images/edits पर POST करें। Pass = HTTP 200 प्रतिक्रिया में non-empty image URL या base64 payload के साथ। Fail = non-200, खाली body, या shape mismatch। कोई मानव grading नहीं। बेंचमार्क reproducible है, मांग पर चलता है, और जब भी कोई नया इमेज मॉडल अपस्ट्रीम दिखाई देता है तब फिर से चलता है।

हम यहां visual quality को score नहीं करते। यह run केवल एक प्रश्न का उत्तर देता है: क्या मॉडल छह reference inputs प्लस एक prompt स्वीकार करता है और एक image लौटाता है, इस विशिष्ट चैनल पर, अभी? Quality grading एक अलग pass है।

332 channel runs से क्या निकला

8 अपस्ट्रीम पुनर्विक्रेताओं में, हमने 136 अद्वितीय इमेज मॉडल को 332 channel runs पर परीक्षण किया। 54 मॉडल के पास कम से कम एक verified passing प्रदाता है। Run captured 2026-05-09।

Family द्वारा समूहीकृत। Verified मॉडल = उस family में कम से कम एक passing चैनल के साथ अलग SKUs। Passing-provider sum = (model, provider) pairs की कुल गिनती जो family में 200 लौटाए।

Family	Verified मॉडल	Passing-provider sum
gpt-image-*	6	26
gemini-*-image	3	22
doubao-seedream-*	3	6
flux-*	7	8
qwen-image-edit-*	2	5
wan2.5-i2i	1	2

शीर्ष single-model winners passing-provider count द्वारा। अधिक passing providers का मतलब है बेहतर routing headroom: जब एक अपस्ट्रीम rate-limit या डाउन हो जाता है, राउटर के पास उसी मॉडल का एक और path होता है।

मॉडल	Passing providers
gemini-3.1-flash-image-preview	8
gpt-image-1	7
gemini-3-pro-image-preview	7
gemini-2.5-flash-image	7
gpt-image-2	6
gpt-image-1-mini	4
gpt-image-1.5	4
flux-schnell	3
qwen-image-edit-plus	3

एक मॉडल एक पुनर्विक्रेता पर क्यों pass होता है और दूसरे पर fail होता है

तीन सामान्य कारण। Quota exhaustion: पुनर्विक्रेता के अपस्ट्रीम key ने दिन का image quota जला दिया और अब 429 का जवाब देता है। Slug variants: वही underlying मॉडल अलग-अलग पुनर्विक्रेताओं पर gpt-image-2, gpt-image-2-all, gpt-image-2-c, और gpt-image-2-vip के रूप में exposed है, और उन slugs में से केवल कुछ ही वास्तव में एक काम करने वाले backend से wired हैं। Endpoint mismatch: कुछ पुनर्विक्रेता slug expose करते हैं लेकिन कभी /v1/images/edits plumb नहीं किया, इसलिए अनुरोध 404 करता है।

इसीलिए हम लगातार परीक्षण करते हैं और अनुरोध समय पर विफल हो रहे चैनलों के चारों ओर रूट करते हैं। एक मॉडल जो आज pass होता है कल 429-ing शुरू कर सकता है यदि उसके पुनर्विक्रेता के अपस्ट्रीम घूमता है। बाज़ार के इस कोने में Static availability सूचियाँ तेज़ी से बासी हो जाती हैं।

maxImageInputs अब हर मॉडल के metadata में है

कैटलॉग में हर इमेज मॉडल अब अपने metadata block पर एक maxImageInputs field रखता है। 6-reference बेंचमार्क पास करने वाले मॉडल को maxImageInputs: 6 टैग किया जाता है। वही shape कैटलॉग UI, API, और routing layer द्वारा उपयोग किया जाता है।

json

{
  "model": "gemini-3.1-flash-image-preview",
  "metadata": {
    "maxImageInputs": 6
  }
}

यदि आप केवल इस बारे में परवाह करते हैं कि कौन से मॉडल आपके 6-image payload को स्वीकार करेंगे, तो इस field पर filter करें। बाद में जोड़े गए नए मॉडल वही टैग प्राप्त करते हैं जब वे वही बेंचमार्क पास करते हैं।

इसे आज़माएं

ऊपर हर मॉडल एक OpenAI-संगत endpoint के माध्यम से उपलब्ध है। Multi-reference image edit ठीक उसी तरह exposed है जैसे अपस्ट्रीम परिभाषित करता है, कोई अतिरिक्त wrapping नहीं। छह images और एक prompt लाओ; राउटर एक काम करने वाला provider चुनता है।

एक API key प्राप्त करें या image कैटलॉग ब्राउज़ करें पूरी verified सूची देखने के लिए।