Microsoft TRELLIS 教程 - 开源文生3D、图生3D模型部署指南
4 min read

TRELLIS 简介
TRELLIS 是微软开源的一个大规模3D资产生成模型,支持从文本或图像生成高质量的3D内容。它采用结构化3D潜空间方法,能够实现可扩展且多功能的3D生成。
主要特点:
- 支持图生3D和文生3D两种生成模式
- 采用结构化3D潜空间方法,生成质量更高
- 提供多种3D表示格式(高斯点云、辐射场、网格等)
- 开源且易于部署使用
- 支持导出GLB/PLY等标准3D文件格式
在线示例

快速开始
环境要求
- CUDA 兼容的 NVIDIA GPU (推荐 RTX 30/40 系列)
- CUDA Toolkit 11.8 或 12.2
- Python 3.8+
- conda 环境管理工具
安装步骤
- 克隆项目代码:
git clone https://github.com/microsoft/TRELLIS.git
cd TRELLIS
- 创建并激活conda环境:
# 使用CUDA 11.8
. ./setup.sh --new-env --basic --xformers --flash-attn --diffoctreerast --spconv --mipgaussian --kaolin --nvdiffrast
# 如果使用CUDA 12.2,需要手动安装依赖
conda create -n trellis python=3.10
conda activate trellis
pip install -r requirements.txt
- 下载预训练模型:
目前可用的预训练模型包括:
- TRELLIS-image-large: 大型图生3D模型 (1.2B参数)
- TRELLIS-text-base: 基础文生3D模型 (342M参数)
- TRELLIS-text-large: 大型文生3D模型 (1.1B参数)
- TRELLIS-text-xlarge: 超大型文生3D模型 (2.0B参数)
你可以从Hugging Face下载这些模型。
使用教程
图生3D示例
import os
# 设置后端
os.environ['SPCONV_ALGO'] = 'native' # 可选 'native' 或 'auto'
import imageio
from PIL import Image
from trellis.pipelines import TrellisImageTo3DPipeline
from trellis.utils import render_utils, postprocessing_utils
# 加载模型
pipeline = TrellisImageTo3DPipeline.from_pretrained("JeffreyXiang/TRELLIS-image-large")
pipeline.cuda()
# 加载输入图片
image = Image.open("input.png")
# 运行生成
outputs = pipeline.run(
image,
seed=1,
# 可选参数
# sparse_structure_sampler_params={
# "steps": 12,
# "cfg_strength": 7.5,
# },
# slat_sampler_params={
# "steps": 12,
# "cfg_strength": 3,
# },
)
# 渲染预览视频
video = render_utils.render_video(outputs['gaussian'][0])['color']
imageio.mimsave("preview_gs.mp4", video, fps=30)
# 导出3D文件
glb = postprocessing_utils.to_glb(
outputs['gaussian'][0],
outputs['mesh'][0],
simplify=0.95, # 网格简化比例
texture_size=1024, # 纹理大小
)
glb.export("output.glb")
# 保存点云数据
outputs['gaussian'][0].save_ply("output.ply")
Web演示界面
TRELLIS提供了一个基于Gradio的Web演示界面。运行以下命令启动:
# 安装额外依赖
. ./setup.sh --demo
# 启动服务
python app.py
启动后可以通过浏览器访问Web界面。
最佳实践
- 输入图片建议:
- 使用清晰、对比度适中的图片
- 物体轮廓要清晰可见
- 避免复杂背景和遮挡
- 生成参数调优:
- 适当增加采样步数可以提高质量
- 调整cfg_strength参数控制生成的保真度
- 建议多尝试不同的随机种子
- 性能优化:
- 使用native后端可以加快首次运行速度
- 适当降低纹理分辨率可以减少显存占用
- 导出时根据需要调整网格简化比例
常见问题
- 显存不足:
- 降低batch size
- 使用较小的模型版本
- 减少采样步数
- 生成质量问题:
- 检查输入图片质量
- 适当增加采样步数
- 调整cfg_strength参数
- 导出文件过大:
- 增加网格简化比例
- 降低纹理分辨率
- 选择合适的文件格式
参考资源
更多文章

Qwen2.5-Omni 全能旗舰 VS 国产小钢炮 MiniCPM-V:参数、硬件、资源、优势全解析,谁才是真香之选?

DeepSeek-V3-0324 更新:全面提升的推理与创作能力

AI巨头正面交锋:Grok 3图片编辑功能横空出世,谷歌Gemini措手不及?

Mistral Small 3.1:轻量级大模型的王者归来,能否撼动Gemma 3的霸主地位?

SmolDocling:256M参数的全能文档OCR处理利神器,每页仅需0.35秒,GTX1060即可运行

Manus vs OpenManus:一天9个微信群爆满,AI Agent掀起商业与开源双重博弈

阿里QwQ-32B,32B小参数媲美DeepSeek R1 671B,重塑开源AI新格局?

重大安全警报:VS Code 最流行主题插件 Material Theme 被曝含恶意代码

微软 OmniParser V2.0 重磅发布:AI 视觉解析迎来重大升级,自动化与可访问性迈向新高度