Model gambar mana yang benar-benar menerima 6 input referensi? Kami menjalankan benchmark.

Model gambar modern dapat mengambil beberapa gambar referensi plus satu prompt teks dan menyusunnya menjadi satu output. Satu prompt, N referensi, satu komposit. Berguna untuk visual novel, materi merek dengan karakter konsisten, mockup produk, panel komik, dan alur kerja apa pun yang membutuhkan adegan yang dirakit dari bagian yang diketahui.

Tangkapannya: setiap model di pasar mengklaim melakukan ini. Sebagian besar tidak. Beberapa membatasi pada 1 referensi, beberapa pada 4, beberapa menerima input tetapi diam-diam mengabaikan semuanya setelah yang pertama. Dan di atas itu model yang sama berperilaku berbeda di seluruh reseller karena kuota, varian slug, dan kabel endpoint yang hilang. Jadi kami menjalankan benchmark.

Set fixture

Enam JPEG tetap yang mencakup komposisi adegan roleplay tipikal: satu latar belakang tavern dan lima potret karakter (satu sisi pengguna dan empat NPC). Enam file yang sama untuk setiap pasangan (penyedia, model), tidak ada penulisan ulang per saluran. Total payload sekitar 500 KB di enam gambar.

Prompt teks juga tetap. Ia menamai setiap karakter, mereferensikan setiap gambar berdasarkan indeks, dan meminta satu komposit. Persis:

text

Compose a single anime-style illustration combining the six reference images: place Sara, the blonde girl with the side braid (image 01), inside the tavern (image 00), interacting with four NPCs - the blonde male hero Trevor (image 02), the bearded ranger Puck (image 03), the bald knight in gold armor (image 04), and the brunette adventurer woman (image 05). Preserve each character's distinctive appearance. Single output image.

Cara benchmark berjalan

Untuk setiap pasangan (penyedia, model) di katalog: POST enam fixture plus prompt ke /v1/images/edits saluran itu. Lulus = HTTP 200 dengan URL gambar tidak kosong atau payload base64 dalam respons. Gagal = non-200, body kosong, atau bentuk tidak cocok. Tidak ada penilaian manusia. Benchmark dapat direproduksi, berjalan sesuai permintaan, dan berjalan kembali setiap kali model gambar baru muncul upstream.

Kami tidak menilai kualitas visual di sini. Run ini hanya menjawab satu pertanyaan: apakah model menerima enam input referensi plus prompt dan mengembalikan gambar, di saluran spesifik ini, sekarang? Penilaian kualitas adalah pass terpisah.

Apa yang ditemukan 332 channel run

Di 8 reseller upstream, kami menguji 136 model gambar unik melalui 332 channel run. 54 model memiliki setidaknya satu penyedia yang terverifikasi lulus. Run direkam 2026-05-09.

Dikelompokkan berdasarkan keluarga. Model terverifikasi = SKU berbeda dalam keluarga itu dengan setidaknya satu saluran lulus. Jumlah penyedia lulus = jumlah total pasangan (model, penyedia) yang mengembalikan 200 di seluruh keluarga.

Keluarga	Model terverifikasi	Jumlah penyedia lulus
gpt-image-*	6	26
gemini-*-image	3	22
doubao-seedream-*	3	6
flux-*	7	8
qwen-image-edit-*	2	5
wan2.5-i2i	1	2

Pemenang model tunggal teratas berdasarkan jumlah penyedia lulus. Lebih banyak penyedia lulus berarti ruang routing yang lebih baik: ketika satu upstream membatasi rate atau turun, router memiliki jalur lain ke model yang sama.

Model	Penyedia lulus
gemini-3.1-flash-image-preview	8
gpt-image-1	7
gemini-3-pro-image-preview	7
gemini-2.5-flash-image	7
gpt-image-2	6
gpt-image-1-mini	4
gpt-image-1.5	4
flux-schnell	3
qwen-image-edit-plus	3

Mengapa model lulus di satu reseller dan gagal di yang lain

Tiga alasan umum. Kelelahan kuota: kunci upstream reseller membakar kuota gambarnya untuk hari itu dan sekarang menjawab 429. Varian slug: model dasar yang sama diekspos sebagai gpt-image-2, gpt-image-2-all, gpt-image-2-c, dan gpt-image-2-vip di reseller berbeda, dan hanya beberapa slug itu yang benar-benar terhubung ke backend yang bekerja. Ketidakcocokan endpoint: beberapa reseller mengekspos slug tetapi tidak pernah menghubungkan /v1/images/edits, jadi permintaan 404.

Inilah mengapa kami menguji terus-menerus dan me-route di sekitar saluran yang gagal pada saat permintaan. Model yang lulus hari ini dapat mulai memberikan 429 besok jika upstream resellernya berotasi. Daftar ketersediaan statis cepat basi di sudut pasar ini.

maxImageInputs sekarang ada di metadata setiap model

Setiap model gambar di katalog sekarang membawa field maxImageInputs di blok metadata-nya. Model yang lulus benchmark 6 referensi ditandai maxImageInputs: 6. Bentuk yang sama digunakan oleh UI katalog, API, dan lapisan routing.

json

{
  "model": "gemini-3.1-flash-image-preview",
  "metadata": {
    "maxImageInputs": 6
  }
}

Jika Anda hanya peduli model mana yang akan menerima payload 6 gambar Anda, filter di field ini. Model baru yang ditambahkan kemudian mendapat tag yang sama setelah mereka lulus benchmark yang sama.

Coba

Setiap model di atas tersedia melalui satu endpoint yang kompatibel dengan OpenAI. Pengeditan gambar multi-referensi diekspos persis seperti yang didefinisikan upstream, tanpa pembungkusan tambahan. Bawa enam gambar dan prompt; router memilih penyedia yang bekerja.

Ambil kunci API atau jelajahi katalog gambar untuk melihat daftar terverifikasi lengkap.