🔥 Gate 广场活动|#发帖赢Launchpad新币KDK 🔥
KDK|Gate Launchpad 最新一期明星代币
以前想参与? 先质押 USDT
这次不一样 👉 发帖就有机会直接拿 KDK!
🎁 Gate 广场专属福利:总奖励 2,000 KDK 等你瓜分
🚀 Launchpad 明星项目,走势潜力,值得期待 👀
📅 活动时间
2025/12/19 12:00 – 12/30 24:00(UTC+8)
📌 怎么参与?
在 Gate 广场发帖(文字、图文、分析、观点都行)
内容和 KDK上线价格预测/KDK 项目看法/Gate Launchpad 机制理解相关
帖子加上任一话题:#发帖赢Launchpad新币KDK 或 #PostToWinLaunchpadKDK
🏆 奖励设置(共 2,000 KDK)
🥇 第 1 名:400 KDK
🥈 前 5 名:200 KDK / 人(共 1,000 KDK)
🥉 前 15 名:40 KDK / 人(共 600 KDK)
📄 注意事项
内容需原创,拒绝抄袭、洗稿、灌水
获奖者需完成 Gate 广场身份认证
奖励发放时间以官方公告为准
Gate 保留本次活动的最终解释权
OpenAI救了Stable Diffusion!开源Dall·E3同款解码器,来自Ilya宋飏等
来源:量子位
在热火朝天的“AI春晚”上,OpenAI一口气开源两项工作,其中之一一致性解码器,专门面向SD的VAE模型。
它能让图像生成质量更高、更稳定,比如多人脸、带文字图像以及线条控制方面。
项目页上只放了一个例子,具体怎么训练没有写,被网友称为“人狠话不多式开源”。
它来自OpenAI联创及首席科学家Ilya、OpenAI华人新星宋飏等人提出的一致性模型(Consistency Models)。
上半年这个模型开源时就引发业内震动,被评为能“终结扩散模型”。
就在前不久,宋飏等人还对模型训练方法做了优化,能进一步提升图像生成质量。
网友们不禁感慨:还是爱看OpenAI开源啊,期待继续开放更多模型。
一致性模型完成再进化
先来看最初名震江湖的第一版一致性模型(Consistency Models)。
它旨在解决扩散模型通过逐步迭代、导致图像生成缓慢的问题。仅需3.5秒即可生成64张左右256×256的图像。
其一,无需对抗训练(adversarial training),就能直接生成高质量的图像样本。
其二,相比扩散模型可能需要几百甚至上千次迭代,一致性模型只需要一两步就能搞定多种图像任务——
包括上色、去噪、超分等,都可以在几步之内搞定,而不需要对这些任务进行明确训练。(当然,如果进行少样本学习的话,生成效果也会更好)
原理上,一致性模型直接把随机的噪声映射到复杂图像上,输出都是同一轨迹上的同一点,所以实现了一步生成。
另一种方法是独立训练,将一致性模型作为独立生成模型训练。
实验结果表明,一致性模型在一步和少步采样方面优于现有的蒸馏技术,如渐进式蒸馏。
当作为独立的生成模型进行训练时,一致性模型可以与现有的一步非对抗生成模型在标准基准测试汇总媲美,如CIFAR-10、ImageNet 64×64和LSUN 256×256。
它通过优化权重函数、噪声嵌入和dropout,使得一致性模型在不需要依赖学习过的特征,也能达到很好的生成质量。
它改进了权重函数的选择,使其随着噪声水平的增加而减小,这使得在较小噪声水平处的一致性损失权重更大,从而提升样本质量。
同时调整了噪声嵌入层的敏感性,使其降低对微小噪声差异的敏感性,有助于提高连续时间一致性训练的稳定性。
并且发现了在一致性模型中使用较大dropout、移除teacher network中的EMA、将学习过的特征距离(如LPIPS)替换Pseudo-Huber损失函数,都能能进一步提高图像质量。
One More Thing
回到这次最新开源的解码器,第一波实测体验已经来了。
目前看到的一些效果,提升不算明显,而且不少人反映运行速度慢。
但这还是最早期的测试,后续或许会有更多提升。
今年,凭借一致性模型,宋飏也名震江湖。这位大佬16岁就当理科状元上清华了,关于他的更多故事可戳:OpenAI当红新星宋飏:最新研究获评「终结扩散模型」,16岁上清华
论文地址:
[1]
[2]