mirror of
https://github.com/modelscope/DiffSynth-Studio.git
synced 2026-03-19 06:48:12 +00:00
DiffSynth-Studio 文档
欢迎来到 Diffusion 模型的魔法世界!DiffSynth-Studio 是由魔搭社区团队开发和维护的开源 Diffusion 模型引擎。我们期望构建一个通用的 Diffusion 模型框架,以框架建设孵化技术创新,凝聚开源社区的力量,探索生成式模型技术的边界!
Section 1: 上手使用
本节介绍 DiffSynth-Studio 的基本使用方式,包括如何启用显存管理从而在极低显存的 GPU 上进行推理,以及如何训练任意基础模型、LoRA、ControlNet 等模型。
Section 2: 模型详解
本节介绍 DiffSynth-Studio 所支持的 Diffusion 模型,部分模型 Pipeline 具备可控生成、并行加速等特色功能。
- 模型目录
- Qwen-Image【TODO】
- FLUX【TODO】
- Wan【TODO】
Section 3: 训练框架
本节介绍 DiffSynth-Studio 中训练框架的设计思路,帮助开发者理解 Diffusion 模型训练算法的原理。
- Diffusion 模型基本原理
- 标准监督训练
- 在训练中启用 FP8 精度
- 端到端的蒸馏加速训练
- 两阶段拆分训练
- 差分 LoRA 训练
Section 4: 模型接入
本节介绍如何将模型接入 DiffSynth-Studio 从而使用框架基础功能,帮助开发者为本项目提供新模型的支持,或进行私有化模型的推理和训练。
Section 5: API 参考
本节介绍 DiffSynth-Studio 中的独立核心模块 diffsynth.core,介绍内部的功能是如何设计和运作的,开发者如有需要,可将其中的功能模块用于其他代码库的开发中。
diffsynth.core.attention: 注意力机制实现diffsynth.core.data: 数据处理算子与通用数据集diffsynth.core.gradient: 梯度检查点diffsynth.core.loader: 模型下载与加载diffsynth.core.vram: 显存管理
Section 6: 学术导引
本节介绍如何利用 DiffSynth-Studio 训练新的模型,帮助科研工作者探索新的模型技术。
- 从零开始训练模型【coming soon】
- 推理改进优化技术【coming soon】
- 设计可控生成模型【coming soon】
- 创建新的训练范式【coming soon】
Section 7: 常见问题
本节总结了开发者常见的问题,如果你在使用和开发中遇到了问题,请参考本节内容,如果仍无法解决,请到 GitHub 上给我们提 issue。
- 常见问题【TODO】