Machine Learning Computer Vision

DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation

1. 研究背景、动机、主要贡献 1.1 存在问题(动机) 现有的文本到图像生成模型可以根据文本提示生成高质量和多样化的图像,但它们无法在不同的场景中一致地再现特定主体。 因为即使使用详细的文本描述,现有模型的输出域表达力有限,生...