Stable Diffusion 3.5发布:三大版本详解及使用指南
3 min read
今天,我们来聊聊最新发布的Stable Diffusion 3.5模型。这是目前最强大的开源AI绘画模型之一,它不仅可以在普通电脑上运行,而且根据Stability AI社区许可协议提供多种使用权限。现在你可以从Hugging Face下载Stable Diffusion 3.5 Large和Stable Diffusion 3.5 Large Turbo模型,相关代码也已在GitHub开源。
为什么要升级到3.5版本?
今年6月,Stability AI发布了SD3 Medium版本,但这个版本并没有完全达到预期。经过认真听取社区反馈后,团队没有急于修补,而是花时间开发了这个全新的3.5版本,以更好地服务创作者社区。
有哪些新模型可以使用?
Stable Diffusion 3.5提供了三个不同版本的模型,满足不同用户的需求:
- 81亿参数的大型模型
- 最适合专业用途
- 支持1百万像素分辨率
- SD家族中最强大的基础模型
- Large版本的精简版
- 仅需4步即可生成高质量图像
- 速度远快于Large版本
- 保持了优秀的提示词准确性
- 25亿参数的中型模型
- 采用改进的MMDiT-X架构
- 适合消费级硬件运行
- 支持25万到200万像素分辨率
技术特点和优化
新版本在以下方面做出了重大改进:
- 可定制性: 通过Query-Key标准化技术,让模型更容易进行微调和开发
- 硬件友好: Medium版本仅需9.9GB显存(不含文本编码器)即可运行
- 性能均衡: 在图像质量和提示词准确性方面达到了很好的平衡
如何开始使用?
除了直接从Hugging Face下载模型权重自行部署外,你还可以通过以下平台使用:
更多文章
一文读懂 DeepSeek R1:强化学习如何重塑大语言模型推理能力?
Let's Encrypt 将在2025年推出6天有效期证书和IP地址证书支持
字节跳动开源基于 Golang 的大模型应用开发框架 Eino
主流开源AI Agent框架对比与选型(langgraph, AutoGen, MetaGPT, ChatDev, Swarm, uagents)
Microsoft TRELLIS 教程 - 开源文生3D、图生3D模型部署指南
VLC 自动字幕和翻译(基于本地离线开源AI模型)|CES 2025
STAR: 基于文本到视频模型的实际场景视频超分辨率技术
CES 2025 | 英伟达(NVIDIA) RTX 5090 震撼曝光 32GB GDDR7 显存开启显卡新纪元
CES 2024 回顾:重温2024科技盛典精彩时刻