InstanceControl: Controllable Complex Image Generation without Instance Labeling
InstanceControl enables multi-instance image generation by using vision-language models to establish instance-level correspondences between text prompts and visual conditions, whil…
Hugging Face · Daily Papers
·Xiaoyu Liu, Huan Wang
·
·▲ 8 upvotes
Este artigo está em destaque na seleção diária de papers do Hugging Face, curada pela comunidade de pesquisa em IA.
Autores: Xiaoyu Liu, Huan Wang, Fan Li, Zhixin Wang, Jiaqi Xu, Ming Liu
- 8 upvotes da comunidade
- Temas: ControlNet, Vision-Language Model, instance-level correspondences, instance masks, adaptive mask refinement, multi-instance scenes
Resumo
Resumo original (em inglês), extraído do paper:
InstanceControl enables multi-instance image generation by using vision-language models to establish instance-level correspondences between text prompts and visual conditions, while employing adaptive mask refinement for improved accuracy.Onde ler
// relacionados
Leia também
Blog
O complicado problema do Claude Code com a China envolve proibições dos dois lados do Pacífico
Blog
AI Security Institute do Reino Unido descobre que benchmarks padrão subestimam sistematicamente o que agentes de IA realmente conseguem fazer
Dataset
ByteDance-Seed/EdgeBench
Blog