Stable Diffusion 3.5发布:三大版本详解及使用指南

Stable Diffusion AI绘画 SD3.5

Nov 1, 2024 3 min read

Cover image for Stable Diffusion 3.5发布:三大版本详解及使用指南

今天,我们来聊聊最新发布的Stable Diffusion 3.5模型。这是目前最强大的开源AI绘画模型之一,它不仅可以在普通电脑上运行,而且根据Stability AI社区许可协议提供多种使用权限。现在你可以从Hugging Face下载Stable Diffusion 3.5 Large和Stable Diffusion 3.5 Large Turbo模型,相关代码也已在GitHub开源。

为什么要升级到3.5版本?

今年6月,Stability AI发布了SD3 Medium版本,但这个版本并没有完全达到预期。经过认真听取社区反馈后,团队没有急于修补,而是花时间开发了这个全新的3.5版本,以更好地服务创作者社区。

有哪些新模型可以使用?

Stable Diffusion 3.5提供了三个不同版本的模型,满足不同用户的需求:

Stable Diffusion 3.5 Large

81亿参数的大型模型
最适合专业用途
支持1百万像素分辨率
SD家族中最强大的基础模型

Stable Diffusion 3.5 Large Turbo

Large版本的精简版
仅需4步即可生成高质量图像
速度远快于Large版本
保持了优秀的提示词准确性

Stable Diffusion 3.5 Medium

25亿参数的中型模型
采用改进的MMDiT-X架构
适合消费级硬件运行
支持25万到200万像素分辨率

技术特点和优化

新版本在以下方面做出了重大改进:

可定制性: 通过Query-Key标准化技术,让模型更容易进行微调和开发
硬件友好: Medium版本仅需9.9GB显存(不含文本编码器)即可运行
性能均衡: 在图像质量和提示词准确性方面达到了很好的平衡

如何开始使用?

除了直接从Hugging Face下载模型权重自行部署外,你还可以通过以下平台使用:

Share

更多文章

Qwen3-Next 系列全解析：80B-A3B 的混合架构，Instruct 与 Thinking 双线能力进化

Qwen3-Next 系列全解析：80B-A3B 的混合架构，Instruct 与 Thinking 双线能力进化

DeepSeek V3.1：混合推理、强劲编程与 Agent 能力，支持Claude Code，性价比再升级

DeepSeek V3.1：混合推理、强劲编程与 Agent 能力，支持Claude Code，性价比再升级

Qwen-Image-Edit 图像编辑介绍与 ComfyUI 使用指南

Qwen-Image-Edit 图像编辑介绍与 ComfyUI 使用指南

沉浸式翻译插件重大安全漏洞：网页快照功能导致用户敏感信息大规模泄露

沉浸式翻译插件重大安全漏洞：网页快照功能导致用户敏感信息大规模泄露

GLM-4.5技术报告与应用体验：国产智能体大模型新标杆

GLM-4.5技术报告与应用体验：国产智能体大模型新标杆

Win11Debloat 深度指南：一键精简 Windows 11，告别臃肿，提升系统性能

Win11Debloat 深度指南：一键精简 Windows 11，告别臃肿，提升系统性能

阿里Qwen-MT翻译模型重磅升级：92种语言、秒级响应，挑战GPT-4翻译霸主地位

阿里Qwen-MT翻译模型重磅升级：92种语言、秒级响应，挑战GPT-4翻译霸主地位

Kimi K2如何凭借三大创新炼成万亿开源模型？

Kimi K2如何凭借三大创新炼成万亿开源模型？

Docker运行macOS教程：Linux系统完整配置与部署指南

Docker运行macOS教程：Linux系统完整配置与部署指南

相关文章