improve python script error messages

2023-07-07 20:16:35 +08:00
parent 2d545604f4
commit 6fbb86667c
9 changed files with 115 additions and 65 deletions
--- a/finetune/json2binidx_tool/tools/preprocess_data.py
+++ b/finetune/json2binidx_tool/tools/preprocess_data.py
@@ -243,4 +243,8 @@ def main():


 if __name__ == "__main__":
-    main()
+    try:
+        main()
+    except Exception as e:
+        with open("error.txt", "w") as f:
+            f.write(str(e))
--- a/finetune/lora/merge_lora.py
+++ b/finetune/lora/merge_lora.py
@@ -5,49 +5,64 @@ from typing import Dict
 import typing
 import torch

-if '-h' in sys.argv or '--help' in sys.argv:
-    print(f'Usage: python3 {sys.argv[0]} [--use-gpu] <lora_alpha> <base_model.pth> <lora_checkpoint.pth> <output.pth>')
+try:
+    if "-h" in sys.argv or "--help" in sys.argv:
+        print(
+            f"Usage: python3 {sys.argv[0]} [--use-gpu] <lora_alpha> <base_model.pth> <lora_checkpoint.pth> <output.pth>"
+        )

-if sys.argv[1] == '--use-gpu':
-    device = 'cuda'
-    lora_alpha, base_model, lora, output = float(sys.argv[2]), sys.argv[3], sys.argv[4], sys.argv[5]
-else:
-    device = 'cpu'
-    lora_alpha, base_model, lora, output = float(sys.argv[1]), sys.argv[2], sys.argv[3], sys.argv[4]
+    if sys.argv[1] == "--use-gpu":
+        device = "cuda"
+        lora_alpha, base_model, lora, output = (
+            float(sys.argv[2]),
+            sys.argv[3],
+            sys.argv[4],
+            sys.argv[5],
+        )
+    else:
+        device = "cpu"
+        lora_alpha, base_model, lora, output = (
+            float(sys.argv[1]),
+            sys.argv[2],
+            sys.argv[3],
+            sys.argv[4],
+        )

+    with torch.no_grad():
+        w: Dict[str, torch.Tensor] = torch.load(base_model, map_location="cpu")
+        # merge LoRA-only slim checkpoint into the main weights
+        w_lora: Dict[str, torch.Tensor] = torch.load(lora, map_location="cpu")
+        for k in w_lora.keys():
+            w[k] = w_lora[k]
+        output_w: typing.OrderedDict[str, torch.Tensor] = OrderedDict()
+        # merge LoRA weights
+        keys = list(w.keys())
+        for k in keys:
+            if k.endswith(".weight"):
+                prefix = k[: -len(".weight")]
+                lora_A = prefix + ".lora_A"
+                lora_B = prefix + ".lora_B"
+                if lora_A in keys:
+                    assert lora_B in keys
+                    print(f"merging {lora_A} and {lora_B} into {k}")
+                    assert w[lora_B].shape[1] == w[lora_A].shape[0]
+                    lora_r = w[lora_B].shape[1]
+                    w[k] = w[k].to(device=device)
+                    w[lora_A] = w[lora_A].to(device=device)
+                    w[lora_B] = w[lora_B].to(device=device)
+                    w[k] += w[lora_B] @ w[lora_A] * (lora_alpha / lora_r)
+                    output_w[k] = w[k].to(device="cpu", copy=True)
+                    del w[k]
+                    del w[lora_A]
+                    del w[lora_B]
+                    continue

-with torch.no_grad():
-    w: Dict[str, torch.Tensor] = torch.load(base_model, map_location='cpu')
-    # merge LoRA-only slim checkpoint into the main weights
-    w_lora: Dict[str, torch.Tensor] = torch.load(lora, map_location='cpu')
-    for k in w_lora.keys():
-        w[k] = w_lora[k]
-    output_w: typing.OrderedDict[str, torch.Tensor] = OrderedDict()
-    # merge LoRA weights
-    keys = list(w.keys())
-    for k in keys:
-        if k.endswith('.weight'):
-            prefix = k[:-len('.weight')]
-            lora_A = prefix + '.lora_A'
-            lora_B = prefix + '.lora_B'
-            if lora_A in keys:
-                assert lora_B in keys
-                print(f'merging {lora_A} and {lora_B} into {k}')
-                assert w[lora_B].shape[1] == w[lora_A].shape[0]
-                lora_r = w[lora_B].shape[1]
-                w[k] = w[k].to(device=device)
-                w[lora_A] = w[lora_A].to(device=device)
-                w[lora_B] = w[lora_B].to(device=device)
-                w[k] += w[lora_B] @ w[lora_A] * (lora_alpha / lora_r)
-                output_w[k] = w[k].to(device='cpu', copy=True)
+            if "lora" not in k:
+                print(f"retaining {k}")
+                output_w[k] = w[k].clone()
                del w[k]
-                del w[lora_A]
-                del w[lora_B]
-                continue

-        if 'lora' not in k:
-            print(f'retaining {k}')
-            output_w[k] = w[k].clone()
-            del w[k]
-
-    torch.save(output_w, output)
+        torch.save(output_w, output)
+except Exception as e:
+    with open("error.txt", "w") as f:
+        f.write(str(e))