图像生成中的安全问题
方法

。使用贝叶斯规则和


的行为来否定概念 c,因此使用负面版本的指导来训练 θ。此外,受到无分类器引导的启发,作者将等式 5 的 RHS 从分类器转换为条件扩散。

),而另一组参数(θ)被训练以擦除概念。使用 θ 对条件 c 下的部分去噪图像 xt 进行采样,然后对冻结模型

进行两次推理以预测噪声,一次在条件 c 下,另一次是没有任何条件。最后,线性组合这两个预测结果以抵消与概念相关的预测噪声,并将新模型朝着新目标调整。
实验
艺术风格去除
显式内容删除
物体去除
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...