प्रकाशित
इंजीनियरिंग

कौन से इमेज मॉडल वास्तव में 6 reference inputs लेते हैं? हमने बेंचमार्क चलाया।

कई इमेज मॉडल multi-reference एडिटिंग का विज्ञापन करते हैं, लेकिन पुनर्विक्रेताओं के बीच उपलब्धता बहुत भिन्न होती है। हमने हमारे कैटलॉग में हर इमेज चैनल को एक fixed 6-image scene-composition prompt भेजा। 332 channel runs, 136 अद्वितीय मॉडल, 54 कम से कम एक verified passing प्रदाता के साथ।

·3 मिनट पढ़ें·UnoRouter टीम द्वारा
इंजीनियरिंगघोषणा

आधुनिक इमेज मॉडल कई reference images प्लस एक text prompt ले सकते हैं और उन्हें एकल आउटपुट में compose कर सकते हैं। एक prompt, N references, एक composite। visual novels, सुसंगत किरदारों के साथ ब्रांड collateral, उत्पाद mockups, comic panels, और किसी भी workflow के लिए उपयोगी जिसे ज्ञात भागों से इकट्ठा किए गए दृश्य की आवश्यकता है।

पकड़: marketplace में हर मॉडल यह करने का दावा करता है। अधिकांश नहीं करते। कुछ 1 reference पर cap करते हैं, कुछ 4 पर, कुछ inputs स्वीकार करते हैं लेकिन पहले के बाद सब कुछ चुपचाप अनदेखा करते हैं। और इसके ऊपर वही मॉडल पुनर्विक्रेताओं के बीच quotas, slug variants, और गायब endpoint wiring के कारण अलग व्यवहार करता है। तो हमने बेंचमार्क चलाया।

Fixture सेट

एक विशिष्ट रोलप्ले scene composition को कवर करने वाली छह fixed JPEGs: एक tavern पृष्ठभूमि और पाँच चरित्र चित्र (एक user-side और चार NPCs)। हर (provider, model) pair के लिए वही छह फाइलें, कोई per-channel rewriting नहीं। छह images में कुल payload लगभग 500 KB।

text prompt भी fixed है। यह प्रत्येक चरित्र का नाम लेता है, सूचकांक द्वारा प्रत्येक image का संदर्भ देता है, और एकल composite के लिए पूछता है। शब्दशः:

text
Compose a single anime-style illustration combining the six reference images: place Sara, the blonde girl with the side braid (image 01), inside the tavern (image 00), interacting with four NPCs - the blonde male hero Trevor (image 02), the bearded ranger Puck (image 03), the bald knight in gold armor (image 04), and the brunette adventurer woman (image 05). Preserve each character's distinctive appearance. Single output image.

बेंचमार्क कैसे चलता है

कैटलॉग में हर (provider, model) pair के लिए: छह fixtures प्लस prompt को उस चैनल के /v1/images/edits पर POST करें। Pass = HTTP 200 प्रतिक्रिया में non-empty image URL या base64 payload के साथ। Fail = non-200, खाली body, या shape mismatch। कोई मानव grading नहीं। बेंचमार्क reproducible है, मांग पर चलता है, और जब भी कोई नया इमेज मॉडल अपस्ट्रीम दिखाई देता है तब फिर से चलता है।

हम यहां visual quality को score नहीं करते। यह run केवल एक प्रश्न का उत्तर देता है: क्या मॉडल छह reference inputs प्लस एक prompt स्वीकार करता है और एक image लौटाता है, इस विशिष्ट चैनल पर, अभी? Quality grading एक अलग pass है।

332 channel runs से क्या निकला

8 अपस्ट्रीम पुनर्विक्रेताओं में, हमने 136 अद्वितीय इमेज मॉडल को 332 channel runs पर परीक्षण किया। 54 मॉडल के पास कम से कम एक verified passing प्रदाता है। Run captured 2026-05-09

Family द्वारा समूहीकृत। Verified मॉडल = उस family में कम से कम एक passing चैनल के साथ अलग SKUs। Passing-provider sum = (model, provider) pairs की कुल गिनती जो family में 200 लौटाए।

FamilyVerified मॉडलPassing-provider sum
gpt-image-*626
gemini-*-image322
doubao-seedream-*36
flux-*78
qwen-image-edit-*25
wan2.5-i2i12

शीर्ष single-model winners passing-provider count द्वारा। अधिक passing providers का मतलब है बेहतर routing headroom: जब एक अपस्ट्रीम rate-limit या डाउन हो जाता है, राउटर के पास उसी मॉडल का एक और path होता है।

मॉडलPassing providers
gemini-3.1-flash-image-preview8
gpt-image-17
gemini-3-pro-image-preview7
gemini-2.5-flash-image7
gpt-image-26
gpt-image-1-mini4
gpt-image-1.54
flux-schnell3
qwen-image-edit-plus3

एक मॉडल एक पुनर्विक्रेता पर क्यों pass होता है और दूसरे पर fail होता है

तीन सामान्य कारण। Quota exhaustion: पुनर्विक्रेता के अपस्ट्रीम key ने दिन का image quota जला दिया और अब 429 का जवाब देता है। Slug variants: वही underlying मॉडल अलग-अलग पुनर्विक्रेताओं पर gpt-image-2, gpt-image-2-all, gpt-image-2-c, और gpt-image-2-vip के रूप में exposed है, और उन slugs में से केवल कुछ ही वास्तव में एक काम करने वाले backend से wired हैं। Endpoint mismatch: कुछ पुनर्विक्रेता slug expose करते हैं लेकिन कभी /v1/images/edits plumb नहीं किया, इसलिए अनुरोध 404 करता है।

इसीलिए हम लगातार परीक्षण करते हैं और अनुरोध समय पर विफल हो रहे चैनलों के चारों ओर रूट करते हैं। एक मॉडल जो आज pass होता है कल 429-ing शुरू कर सकता है यदि उसके पुनर्विक्रेता के अपस्ट्रीम घूमता है। बाज़ार के इस कोने में Static availability सूचियाँ तेज़ी से बासी हो जाती हैं।

maxImageInputs अब हर मॉडल के metadata में है

कैटलॉग में हर इमेज मॉडल अब अपने metadata block पर एक maxImageInputs field रखता है। 6-reference बेंचमार्क पास करने वाले मॉडल को maxImageInputs: 6 टैग किया जाता है। वही shape कैटलॉग UI, API, और routing layer द्वारा उपयोग किया जाता है।

json
{
  "model": "gemini-3.1-flash-image-preview",
  "metadata": {
    "maxImageInputs": 6
  }
}

यदि आप केवल इस बारे में परवाह करते हैं कि कौन से मॉडल आपके 6-image payload को स्वीकार करेंगे, तो इस field पर filter करें। बाद में जोड़े गए नए मॉडल वही टैग प्राप्त करते हैं जब वे वही बेंचमार्क पास करते हैं।

इसे आज़माएं

ऊपर हर मॉडल एक OpenAI-संगत endpoint के माध्यम से उपलब्ध है। Multi-reference image edit ठीक उसी तरह exposed है जैसे अपस्ट्रीम परिभाषित करता है, कोई अतिरिक्त wrapping नहीं। छह images और एक prompt लाओ; राउटर एक काम करने वाला provider चुनता है।

एक API key प्राप्त करें या image कैटलॉग ब्राउज़ करें पूरी verified सूची देखने के लिए।

संबंधित पोस्ट
उत्पाद··3 मिनट पढ़ें
हमने 100+ मुफ्त AI मॉडल को एक ही एंडपॉइंट में जोड़ दिया

दो दिनों में हमने 15 मुफ्त प्रोवाइडर को UnoRouter में जोड़ा: 134 मुफ्त मॉडल पंक्तियाँ, एक OpenAI-compatible एंडपॉइंट, हर टोकन पर $0। ये एक वजह से मुफ्त हैं और इन पर रेट लिमिट लगी हैं जिन्हें हम बढ़ा नहीं सकते। यह रही ईमानदार बात।

अपडेट··2 मिनट पढ़ें
UnoRouter Discord में शामिल हों, मुफ्त balance पाएं

अपना अकाउंट लिंक करें $1 के लिए, सर्वर को boost करें $1 प्रति माह के लिए, bugs ढूंढें $50 तक के लिए। हमने अभी UnoRouter Discord खोला है।

इंजीनियरिंग··4 मिनट पढ़ें
आपका सस्ता Claude शायद नकली है। हमने उनमें से 183 को पकड़ा।

हमने 17 दिनों तक 8 लोकप्रिय Claude पुनर्विक्रेताओं को probe किया। उनके 183 चैनल बिल्कुल Claude नहीं थे। अधिकांश Claude नेम टैग पहने Kiro Cascade या Codeium थे। नाम, संख्याएं, और वह स्क्रिप्ट जिसका हमने उपयोग किया ताकि आप अपने प्रदाता का परीक्षण कर सकें।

कौन से इमेज मॉडल वास्तव में 6 reference inputs लेते हैं? हमने बेंचमार्क चलाया। | UnoRouter