Stability AI 宣布推出 Stable Diffusion 3.5,新版本带来更强大的功能、更快的生成速度和更友好的用户体验,并继续秉持开源精神,赋能更多创作者。
新功能速览:
- Stable Diffusion 3.5 Large: 拥有 80 亿参数,提供卓越的图像质量和提示词遵循度,是 Stable Diffusion 家族中最强大的模型,适用于专业级 100 万像素图像生成。
- Stable Diffusion 3.5 Large Turbo: Stable Diffusion 3.5 Large 的精简版本,仅需 4 步即可生成高质量图像,速度显著提升。
- Stable Diffusion 3.5 Medium (10 月 29 日发布): 拥有 25 亿参数,采用改进的 MMDiT-X 架构和训练方法,专为消费级硬件设计,在质量和易用性之间取得平衡,可生成 0.25 到 200 万像素分辨率的图像。
重要性:
Stable Diffusion 3.5 的发布标志着 AI 图像生成领域的一次重大进步。其强大的性能、高度的自定义性和开放的生态系统将为艺术家、设计师和开发者提供更强大的创作工具,并进一步推动 AI 图像生成技术的普及和应用。
幕后故事:
Stability AI 始终致力于推动 AI 技术的民主化,并将开源理念贯彻到 Stable Diffusion 的发展中。在 Stable Diffusion 3 Medium 发布后,团队认真听取了社区的反馈,并投入大量时间进行改进,最终推出了功能更强大、体验更友好的 Stable Diffusion 3.5。
功能解读:
Stable Diffusion 3.5 引入了查询键归一化 (Query-Key Normalization) 技术,提高了模型训练的稳定性,并简化了微调和开发流程,使其更易于定制。此外,新版本在图像质量、风格多样性、提示词遵循度等方面均有显著提升,并针对不同硬件平台进行了优化。
Stable Diffusion 3.5 的优势:
- 高度可定制性: 轻松微调模型以满足特定需求,或构建基于自定义工作流程的应用程序。
- 高效的性能: 针对标准消费级硬件进行优化,尤其体现在 Stable Diffusion 3.5 Medium 和 Stable Diffusion 3.5 Large Turbo 模型上。
- 多样化的输出: 能够生成更具代表性的图像,涵盖不同的肤色和特征,而无需复杂的提示词。
- 多功能的风格: 能够生成各种风格和美学效果,包括 3D、摄影、绘画、线条艺术等。
Stability AI 社区许可证:
Stable Diffusion 3.5 采用 Stability AI 社区许可证发布,这意味着:
- 非商业用途免费: 个人和组织可以免费将模型用于非商业用途,包括科学研究。
- 年收入低于 100 万美元的商业用途免费: 初创公司、中小企业和创作者可以免费将模型用于商业用途,只要其年收入低于 100 万美元。
- 输出内容所有权归用户所有: 用户保留对生成内容的所有权,不受限制性许可的影响。
访问模型的方式:
除了 Hugging Face 平台,用户还可以通过以下平台访问 Stable Diffusion 3.5 模型:
- Stability AI API
- Replicate
- ComfyUI
- DeepInfra
我们在想:
Stable Diffusion 3.5 的发布将进一步推动 AI 图像生成技术的普及和应用,激发更多创意和创新。未来,我们有望看到 AI 图像生成技术在游戏开发、影视制作、广告设计等更多领域发挥更大的作用。同时,开源社区的力量也将推动 Stable Diffusion 不断进化,为我们带来更多惊喜。
链接:https://stability.ai/news/introducing-stable-diffusion-3-5
Upvoted! Thank you for supporting witness @jswit.
Downvoting a post can decrease pending rewards and make it less visible. Common reasons:
Submit