10月27日消息,OpenAI本周公布了一款名为sCM的新型AI文生图方案。
与传统的扩散模型相比,sCM仅需两个步骤即可生成高质量样本,号称能够将文生图效率提升约50倍,且生成的样本质量能与“业界较强的扩散模型”相比较,为AI文生图提供了新的方案。
目前业界通常使用扩散模型生成图片及音视频,但传统扩散模型的取样过程通常缓慢,通常需要数十到数百个逐步降噪的过程才能生成高质量样本(例如小伙伴们使用SD“炼丹”绘图就需要等待特别长的降噪时间),这使得相应模型效率低下,不适合商业化应用。
虽然目前业界已出现一些技术以加快扩散模型的速度,但无非只是利用复杂训练过程“提纯”模型,或通过降低输出样本质量下降以提升效率。
而OpenAI研究团队则提出了一种名为sCM的文生图方案,这一生成模型方法绕开了传统扩散模型范畴,号称仅需两个取样步骤即可生成与扩散模型质量相当的高分辨率样本,极大缩短了生成时间。
sCM训练方法主要利用预训练扩散模型蒸馏出来的知识直接打造模型,号称能够在缩短取样时间的同时保持高质量样本生成。
研究人员使用ImageNet512x512数据集,利用sCM方法训练模型,号称能够生成细节丰富且高质量的图像,展示其在高分辨率生成方面的能力。尽管sCM只有两个取样步骤,生成样本的质量仍接近业界“最佳的扩散模型”,号称“差异不到10%”。