qwen_image layercontrol v2

2026-03-24 10:18:12 +00:00 · 2026-02-24 15:19:16 +08:00
parent 288bbc7128
commit ee73a29885
10 changed files with 171 additions and 3 deletions
--- a/examples/qwen_image/model_training/validate_lora/Qwen-Image-Layered-Control-V2.py
+++ b/examples/qwen_image/model_training/validate_lora/Qwen-Image-Layered-Control-V2.py
@@ -0,0 +1,37 @@
+from diffsynth.pipelines.qwen_image import QwenImagePipeline, ModelConfig
+from modelscope import dataset_snapshot_download
+from PIL import Image
+import torch
+
+pipe = QwenImagePipeline.from_pretrained(
+    torch_dtype=torch.bfloat16,
+    device="cuda",
+    model_configs=[
+        ModelConfig(model_id="Qwen/Qwen-Image-Layered", origin_file_pattern="transformer/diffusion_pytorch_model*.safetensors"),
+        ModelConfig(model_id="Qwen/Qwen-Image", origin_file_pattern="text_encoder/model*.safetensors"),
+        ModelConfig(model_id="Qwen/Qwen-Image-Layered", origin_file_pattern="vae/diffusion_pytorch_model.safetensors"),
+    ],
+    tokenizer_config=ModelConfig(model_id="Qwen/Qwen-Image", origin_file_pattern="tokenizer/"),
+)
+pipe.load_lora(pipe.dit, "models/train/Qwen-Image-Layered-Control-V2_lora/epoch-4.safetensors")
+
+prompt = "Text 'APRIL'"
+input_image = Image.open("data/example_image_dataset/layer_v2/image_1.png").convert("RGBA").resize((1024, 1024))
+image = pipe(
+    prompt, seed=0,
+    height=1024, width=1024,
+    layer_input_image=input_image, layer_num=0,
+    num_inference_steps=10, cfg_scale=4,
+)
+image[0].save("image_prompt.png")
+
+mask_image = Image.open("data/example_image_dataset/layer_v2/mask_2.png").convert("RGBA").resize((1024, 1024))
+input_image = Image.open("data/example_image_dataset/layer_v2/image_2.png").convert("RGBA").resize((1024, 1024))
+image = pipe(
+    prompt, seed=0,
+    height=1024, width=1024,
+    layer_input_image=input_image, layer_num=0,
+    context_image=mask_image,
+    num_inference_steps=10, cfg_scale=1.0,
+)
+image[0].save("image_mask.png")