어떤 이미지 모델이 실제로 6개의 참조 입력을 받을까요? 벤치마크를 돌렸습니다.

현대 이미지 모델은 여러 참조 이미지와 텍스트 프롬프트 하나를 받아 단일 출력으로 합성할 수 있습니다. 프롬프트 하나, 참조 N개, 합성 하나. 비주얼 노벨, 일관된 캐릭터가 있는 브랜드 자료, 제품 목업, 만화 패널, 그리고 알려진 부품으로 장면을 조립해야 하는 모든 워크플로우에 유용합니다.

함정: 시장의 모든 모델이 이것을 한다고 주장합니다. 대부분은 하지 않습니다. 일부는 1개의 참조에서 멈추고, 일부는 4개, 일부는 입력을 받지만 첫 번째 이후의 모든 것을 조용히 무시합니다. 게다가 같은 모델이 할당량, 슬러그 변형, 누락된 엔드포인트 배선 때문에 리셀러마다 다르게 동작합니다. 그래서 벤치마크를 돌렸습니다.

픽스처 세트

전형적인 롤플레이 장면 구성을 다루는 고정된 6장의 JPEG: 술집 배경 하나와 캐릭터 초상 다섯 장 (사용자 측 하나와 NPC 네 개). 모든 (공급자, 모델) 쌍에 같은 여섯 파일, 채널별 재작성 없음. 여섯 이미지에 걸친 총 페이로드는 대략 500 KB.

텍스트 프롬프트도 고정되어 있습니다. 각 캐릭터의 이름을 지정하고, 인덱스로 각 이미지를 참조하며, 단일 합성을 요청합니다. 그대로:

text

Compose a single anime-style illustration combining the six reference images: place Sara, the blonde girl with the side braid (image 01), inside the tavern (image 00), interacting with four NPCs - the blonde male hero Trevor (image 02), the bearded ranger Puck (image 03), the bald knight in gold armor (image 04), and the brunette adventurer woman (image 05). Preserve each character's distinctive appearance. Single output image.

벤치마크 실행 방식

카탈로그의 모든 (공급자, 모델) 쌍에 대해: 여섯 픽스처와 프롬프트를 해당 채널의 /v1/images/edits에 POST합니다. 통과 = 응답에 비어 있지 않은 이미지 URL 또는 base64 페이로드가 있는 HTTP 200. 실패 = 200이 아니거나, 빈 본문이거나, 형태 불일치. 사람의 채점 없음. 벤치마크는 재현 가능하고, 요청 시 실행되며, 업스트림에 새로운 이미지 모델이 나타날 때마다 다시 실행됩니다.

여기서는 시각적 품질을 평가하지 않습니다. 이 실행은 단 하나의 질문에만 답합니다: 모델이 여섯 개의 참조 입력과 프롬프트를 받아들이고 이미지를 반환하는가, 이 특정 채널에서, 지금? 품질 평가는 별도의 패스입니다.

332개의 채널 실행이 밝혀낸 것

8개 업스트림 리셀러에 걸쳐, 332개의 채널 실행으로 136개의 고유 이미지 모델을 테스트했습니다. 54개의 모델에 최소 한 개의 검증된 통과 공급자가 있습니다. 실행은 2026-05-09에 캡처되었습니다.

패밀리별로 그룹화. 검증된 모델 = 그 패밀리에서 최소 한 개의 통과 채널이 있는 별개의 SKU. 통과 공급자 합계 = 패밀리 전체에서 200을 반환한 (모델, 공급자) 쌍의 총 개수.

패밀리	검증된 모델	통과 공급자 합계
gpt-image-*	6	26
gemini-*-image	3	22
doubao-seedream-*	3	6
flux-*	7	8
qwen-image-edit-*	2	5
wan2.5-i2i	1	2

최상위 단일 모델 우승자를 통과 공급자 개수 기준으로. 통과 공급자가 많을수록 더 나은 라우팅 여유: 한 업스트림이 속도 제한되거나 다운되면, 라우터는 같은 모델로 가는 다른 경로를 가집니다.

모델	통과 공급자
gemini-3.1-flash-image-preview	8
gpt-image-1	7
gemini-3-pro-image-preview	7
gemini-2.5-flash-image	7
gpt-image-2	6
gpt-image-1-mini	4
gpt-image-1.5	4
flux-schnell	3
qwen-image-edit-plus	3

왜 모델이 한 리셀러에서는 통과하고 다른 리셀러에서는 실패하나

세 가지 흔한 이유. 할당량 소진: 리셀러의 업스트림 키가 그날의 이미지 할당량을 다 써버리고 이제 429로 응답합니다. 슬러그 변형: 같은 기반 모델이 리셀러마다 gpt-image-2, gpt-image-2-all, gpt-image-2-c, gpt-image-2-vip로 노출되며, 그 슬러그 중 일부만 실제로 작동하는 백엔드에 연결되어 있습니다. 엔드포인트 불일치: 몇몇 리셀러는 슬러그는 노출하지만 /v1/images/edits를 배선하지 않아서 요청이 404가 됩니다.

이것이 우리가 지속적으로 테스트하고 요청 시간에 실패 채널을 우회하는 이유입니다. 오늘 통과하는 모델이 리셀러의 업스트림이 바뀌면 내일 429를 내기 시작할 수 있습니다. 정적 가용성 목록은 이 시장의 한구석에서 빠르게 낡습니다.

이제 모든 모델의 메타데이터에 maxImageInputs가 있습니다

카탈로그의 모든 이미지 모델은 이제 메타데이터 블록에 maxImageInputs 필드를 가집니다. 6 참조 벤치마크를 통과한 모델은 maxImageInputs: 6으로 태그됩니다. 같은 형태가 카탈로그 UI, API, 라우팅 레이어에서 사용됩니다.

json

{
  "model": "gemini-3.1-flash-image-preview",
  "metadata": {
    "maxImageInputs": 6
  }
}

어떤 모델이 6장 이미지 페이로드를 받아들일지에만 관심이 있다면, 이 필드로 필터링하세요. 나중에 추가된 새 모델은 같은 벤치마크를 통과하면 같은 태그를 받습니다.

사용해 보기

위의 모든 모델은 하나의 OpenAI 호환 엔드포인트를 통해 사용할 수 있습니다. 멀티 참조 이미지 편집은 업스트림이 정의한 그대로 노출되며 추가 래핑이 없습니다. 여섯 이미지와 프롬프트를 가져오세요; 라우터가 작동하는 공급자를 고릅니다.

API 키 받기 또는 전체 검증된 목록을 보려면 이미지 카탈로그 둘러보기.