Mô hình ảnh nào thực sự nhận 6 ảnh tham chiếu? Chúng tôi đã chạy benchmark.
Nhiều mô hình ảnh quảng cáo chỉnh sửa đa tham chiếu, nhưng tính sẵn có khác nhau rất lớn giữa các reseller. Chúng tôi đã gửi một prompt cố định ghép cảnh từ 6 ảnh tới mọi kênh ảnh trong catalog. 332 lần chạy kênh, 136 mô hình duy nhất, 54 mô hình có ít nhất một provider đã xác minh đậu.
Các mô hình ảnh hiện đại nhận nhiều ảnh tham chiếu cộng với một prompt văn bản và ghép chúng thành một ảnh đầu ra duy nhất. Một prompt, N tham chiếu, một bố cục. Hữu ích cho visual novel, vật phẩm thương hiệu với nhân vật nhất quán, mockup sản phẩm, khung truyện tranh và mọi luồng cần dựng một cảnh từ các phần đã biết.
Bẫy là gần như mọi mô hình trên thị trường đều khoe làm được. Phần lớn không làm được. Có loại chỉ nhận 1 tham chiếu, có loại chỉ 4, có loại nhận đầu vào rồi âm thầm bỏ qua mọi thứ sau ảnh đầu tiên. Trên nữa, cùng một mô hình lại có hành vi khác nhau giữa các reseller vì hạn ngạch, biến thể slug và endpoint chưa nối. Vì vậy chúng tôi dựng benchmark.
Bộ fixture
Sáu JPEG cố định phủ một bố cục cảnh roleplay điển hình: một nền quán rượu và năm chân dung nhân vật (một phía người dùng, bốn NPC). Cùng sáu tệp đó cho mọi cặp (provider, model), không viết lại theo kênh. Tải tổng khoảng 500 KB cho sáu ảnh.
Prompt văn bản cũng cố định. Gọi tên từng nhân vật, tham chiếu từng ảnh theo chỉ mục và yêu cầu một bố cục duy nhất. Nguyên văn:
Compose a single anime-style illustration combining the six reference images: place Sara, the blonde girl with the side braid (image 01), inside the tavern (image 00), interacting with four NPCs - the blonde male hero Trevor (image 02), the bearded ranger Puck (image 03), the bald knight in gold armor (image 04), and the brunette adventurer woman (image 05). Preserve each character's distinctive appearance. Single output image.Benchmark chạy ra sao
Với mọi cặp (provider, model) trong catalog: POST sáu fixture cộng prompt tới /v1/images/edits của kênh đó. Đậu = HTTP 200 kèm URL ảnh không rỗng hoặc payload base64 trong phản hồi. Trượt = không phải 200, thân rỗng hoặc sai hình dạng. Không chấm điểm thủ công. Benchmark có thể tái chạy theo yêu cầu và tự chạy lại mỗi khi có mô hình ảnh mới ở thượng nguồn.
Chúng tôi không chấm chất lượng hình ở đây. Lần chạy này trả lời duy nhất một câu hỏi: mô hình có nhận sáu ảnh tham chiếu cộng prompt và trả về một ảnh trên kênh cụ thể này, ngay lúc này hay không? Chấm chất lượng là một lần chạy riêng.
332 lần chạy kênh cho ra gì
Qua 8 reseller thượng nguồn, chúng tôi đã kiểm tra 136 mô hình ảnh duy nhất trong 332 lần chạy kênh. 54 mô hình có ít nhất một provider đã xác minh đậu. Bản chụp 2026-05-09.
Nhóm theo họ. Mô hình đã xác minh = SKU khác nhau trong họ có ít nhất một kênh đậu. Tổng provider đậu = tổng số cặp (mô hình, provider) trả 200 trong họ.
| Họ | Mô hình đã xác minh | Tổng provider đậu |
|---|---|---|
| gpt-image-* | 6 | 26 |
| gemini-*-image | 3 | 22 |
| doubao-seedream-* | 3 | 6 |
| flux-* | 7 | 8 |
| qwen-image-edit-* | 2 | 5 |
| wan2.5-i2i | 1 | 2 |
Mô hình đơn dẫn đầu theo số provider đậu. Nhiều provider đậu nghĩa là dư địa định tuyến tốt hơn: khi một thượng nguồn bị giới hạn hoặc hỏng, router còn lối khác tới chính mô hình đó.
| Mô hình | Provider đậu |
|---|---|
| gemini-3.1-flash-image-preview | 8 |
| gpt-image-1 | 7 |
| gemini-3-pro-image-preview | 7 |
| gemini-2.5-flash-image | 7 |
| gpt-image-2 | 6 |
| gpt-image-1-mini | 4 |
| gpt-image-1.5 | 4 |
| flux-schnell | 3 |
| qwen-image-edit-plus | 3 |
Vì sao một mô hình đậu ở reseller này lại trượt ở reseller khác
Ba lý do thường gặp. Hết quota: key thượng nguồn của reseller đã đốt sạch quota ảnh trong ngày và giờ trả về 429. Biến thể slug: cùng một mô hình lõi lại lộ ra ở các reseller khác nhau dưới gpt-image-2, gpt-image-2-all, gpt-image-2-c và gpt-image-2-vip, nhưng chỉ một số slug thực sự nối tới backend hoạt động. Lệch endpoint: một số reseller công bố slug nhưng chưa bao giờ nối /v1/images/edits, nên request trả 404.
Đó là lý do chúng tôi kiểm tra liên tục và né các kênh trượt ngay trong lúc request. Một mô hình hôm nay đậu, ngày mai có thể bắt đầu trả 429 nếu reseller xoay thượng nguồn. Danh sách sẵn có tĩnh lỗi thời rất nhanh ở góc thị trường này.
maxImageInputs giờ có ở mọi mô hình
Mỗi mô hình ảnh trong catalog giờ mang trường maxImageInputs trong khối metadata. Mô hình đã đậu benchmark 6 tham chiếu được gắn maxImageInputs: 6. Cùng hình dạng đó được catalog UI, API và lớp định tuyến cùng dùng.
{
"model": "gemini-3.1-flash-image-preview",
"metadata": {
"maxImageInputs": 6
}
}Nếu chỉ quan tâm mô hình nào nhận payload 6 ảnh, hãy lọc trên trường này. Mô hình mới sẽ nhận cùng tag ngay khi vượt qua cùng benchmark.
Dùng thử
Mọi mô hình ở trên đều dùng được qua một endpoint tương thích OpenAI. Chỉnh sửa ảnh đa tham chiếu được phơi ra đúng như thượng nguồn định nghĩa, không bọc thêm. Mang sáu ảnh và một prompt, router sẽ chọn provider hoạt động.
Lấy khóa API hoặc duyệt catalog ảnh để xem danh sách đã xác minh đầy đủ.
Chúng tôi probe 8 reseller Claude phổ biến trong 17 ngày. 183 channel của họ không phải Claude. Phần lớn là Kiro Cascade hoặc Codeium đeo nhãn Claude. Tên, số liệu và script để bạn tự kiểm tra provider của mình.

Cloudflare vừa tung ra scanner chấm độ sẵn sàng của site cho AI agent. Chúng tôi đạt 100/100 hoàn hảo và Level 5 cao nhất. Đây là những gì nó kiểm tra và vì sao hầu hết site đều rớt.
Sập cứ vài tuần một lần. Mô hình premium âm thầm bị tráo bằng bản clone rẻ tiền. Hết kiên nhẫn, chúng tôi tự ship router và làm nó hoang tưởng ở cả hai mặt. Đây là câu chuyện ra mắt.