פורסם
הנדסה

אילו מודלי תמונה באמת מקבלים 6 קלטי רפרנס? הרצנו את הבנצ'מרק.

מודלי תמונה רבים מפרסמים עריכה רב-רפרנסית, אבל הזמינות בין מוכרים משתנה פראית. שלחנו הנחיית הרכבת סצנה קבועה של 6 תמונות לכל ערוץ תמונה בקטלוג שלנו. 332 ריצות ערוץ, 136 מודלים ייחודיים, 54 עם לפחות ספק מאומת אחד שעובר.

·קריאה של 3 דקות·מאת צוות UnoRouter
הנדסההכרזה

מודלי תמונה מודרניים יכולים לקבל מספר תמונות רפרנס בנוסף להנחיית טקסט אחת ולהרכיב אותן לפלט יחיד. הנחיה אחת, N רפרנסים, הרכבה אחת. שימושי לרומנים חזותיים, חומרי שיווק עם דמויות עקביות, אבטיפוסי מוצר, פנלי קומיקס, וכל זרימת עבודה שצריכה סצנה המורכבת מחלקים ידועים.

המלכודת: כל מודל בשוק מתיימר לעשות זאת. רובם לא. חלקם מוגבלים ל-1 רפרנס, חלקם ל-4, חלקם מקבלים את הקלטים אבל מתעלמים בשקט מכל מה שאחרי הראשון. ובנוסף לכך, אותו מודל מתנהג שונה בין מוכרים בגלל מכסות, וריאנטים של slug וחוסר בחיווט נקודות קצה. אז הרצנו בנצ'מרק.

סט הנתונים הקבועים

שישה JPEG קבועים המכסים הרכבת סצנת משחק תפקידים אופיינית: רקע בית מרזח אחד וחמישה דיוקנאות דמויות (אחד מצד המשתמש וארבעה NPCs). אותם שישה קבצים לכל זוג (ספק, מודל), בלי שכתוב לפי ערוץ. סך המטען כ-500 KB על פני שש התמונות.

הנחיית הטקסט קבועה גם היא. היא קוראת בשם כל דמות, מפנה לכל תמונה לפי אינדקס, ומבקשת הרכבה יחידה. מילה במילה:

text
Compose a single anime-style illustration combining the six reference images: place Sara, the blonde girl with the side braid (image 01), inside the tavern (image 00), interacting with four NPCs - the blonde male hero Trevor (image 02), the bearded ranger Puck (image 03), the bald knight in gold armor (image 04), and the brunette adventurer woman (image 05). Preserve each character's distinctive appearance. Single output image.

איך הבנצ'מרק רץ

לכל זוג (ספק, מודל) בקטלוג: POST של שש הקובעים בתוספת ההנחיה ל-/v1/images/edits של אותו ערוץ. עבר = HTTP 200 עם URL תמונה לא ריק או מטען base64 בתגובה. נכשל = לא-200, גוף ריק, או חוסר התאמה בצורה. אין דירוג אנושי. הבנצ'מרק ניתן לשחזור, רץ לפי דרישה, ורץ מחדש בכל פעם שמודל תמונה חדש מופיע upstream.

אנחנו לא מדרגים איכות חזותית כאן. הריצה הזו עונה רק על שאלה אחת: האם המודל מקבל שישה קלטי רפרנס בתוספת הנחיה ומחזיר תמונה, על הערוץ הספציפי הזה, כרגע? דירוג איכות הוא מעבר נפרד.

מה 332 ריצות ערוץ חשפו

על פני 8 מוכרי upstream, בדקנו 136 מודלי תמונה ייחודיים ב-332 ריצות ערוץ. ל-54 מודלים יש לפחות ספק מאומת אחד שעובר. הריצה תועדה ב-2026-05-09.

מקובץ לפי משפחה. מודלים מאומתים = SKUs נפרדים במשפחה זו עם לפחות ערוץ אחד שעובר. סכום ספקים שעוברים = ספירת סך זוגות (מודל, ספק) שהחזירו 200 על פני המשפחה.

משפחהמודלים מאומתיםסכום ספקים עוברים
gpt-image-*626
gemini-*-image322
doubao-seedream-*36
flux-*78
qwen-image-edit-*25
wan2.5-i2i12

זוכי המודל היחיד המובילים לפי ספירת ספקים עוברים. יותר ספקים עוברים אומר טווח ניתוב טוב יותר: כשupstream אחד מגביל קצב או נופל, לנתב יש נתיב אחר לאותו מודל.

מודלספקים עוברים
gemini-3.1-flash-image-preview8
gpt-image-17
gemini-3-pro-image-preview7
gemini-2.5-flash-image7
gpt-image-26
gpt-image-1-mini4
gpt-image-1.54
flux-schnell3
qwen-image-edit-plus3

למה מודל עובר על מוכר אחד ונכשל על אחר

שלוש סיבות נפוצות. מיצוי מכסה: מפתח ה-upstream של המוכר שרף את מכסת התמונות שלו ליום ועונה כעת 429. וריאנטים של slug: אותו מודל בסיס נחשף כ-gpt-image-2, gpt-image-2-all, gpt-image-2-c ו-gpt-image-2-vip בין מוכרים שונים, ורק חלק מה-slugs האלה באמת מחווטים ל-backend פעיל. חוסר התאמה בנקודת קצה: כמה מוכרים חושפים את ה-slug אך מעולם לא חיברו את /v1/images/edits, אז הבקשה מקבלת 404.

זו הסיבה שאנחנו בודקים ברציפות ומנתבים סביב ערוצים נכשלים בזמן הבקשה. מודל שעובר היום יכול להתחיל להחזיר 429 מחר אם ה-upstream של המוכר שלו מתחלף. רשימות זמינות סטטיות מתיישנות מהר בפינה הזו של השוק.

maxImageInputs נמצא עכשיו במטא-נתונים של כל מודל

כל מודל תמונה בקטלוג נושא עכשיו שדה maxImageInputs בבלוק המטא-נתונים שלו. מודלים שעברו את בנצ'מרק 6 הרפרנסים מתויגים maxImageInputs: 6. אותה צורה משמשת את ממשק המשתמש של הקטלוג, ה-API ושכבת הניתוב.

json
{
  "model": "gemini-3.1-flash-image-preview",
  "metadata": {
    "maxImageInputs": 6
  }
}

אם אכפת לכם רק מאילו מודלים יקבלו את מטען 6 התמונות שלכם, סננו לפי השדה הזה. מודלים חדשים שמתווספים מאוחר יותר מקבלים את אותה תווית ברגע שהם עוברים את אותו בנצ'מרק.

נסו את זה

כל מודל לעיל זמין דרך נקודת קצה אחת תואמת OpenAI. עריכת תמונה רב-רפרנסית נחשפת בדיוק כפי שה-upstream מגדיר, ללא עטיפה נוספת. הביאו שש תמונות והנחיה; הנתב בוחר ספק פעיל.

קבלו מפתח API או עיינו בקטלוג התמונות כדי לראות את הרשימה המאומתת המלאה.

פוסטים קשורים
אילו מודלי תמונה באמת מקבלים 6 קלטי רפרנס? הרצנו את הבנצ'מרק. | UnoRouter