zuona
/

musicgen-melody-lora-baishidaoren-epoch3

Text-to-Audio

PEFT

Safetensors

baoshidaoren_music_snippets

Generated from Trainer

Model card Files Files and versions Community

zuona commited on Mar 8

Commit

58e66ca

verified ·

1 Parent(s): 19b866e

End of training

Browse files

Files changed (2) hide show

README.md +3 -1
trainer_state.json +53 -32

README.md CHANGED Viewed

@@ -3,6 +3,8 @@ library_name: peft
 license: cc-by-nc-4.0
 base_model: facebook/musicgen-melody
 tags:
 - generated_from_trainer
 model-index:
 - name: musicgen-melody-lora-baishidaoren-epoch3
@@ -14,7 +16,7 @@ should probably proofread and complete it, then remove this comment. -->
 # musicgen-melody-lora-baishidaoren-epoch3
-This model is a fine-tuned version of [facebook/musicgen-melody](https://huggingface.co/facebook/musicgen-melody) on an unknown dataset.
 ## Model description

 license: cc-by-nc-4.0
 base_model: facebook/musicgen-melody
 tags:
+- text-to-audio
+- baoshidaoren_music_snippets
 - generated_from_trainer
 model-index:
 - name: musicgen-melody-lora-baishidaoren-epoch3
 # musicgen-melody-lora-baishidaoren-epoch3
+This model is a fine-tuned version of [facebook/musicgen-melody](https://huggingface.co/facebook/musicgen-melody) on the zuona/baoshidaoren_music_snippets dataset.
 ## Model description

trainer_state.json CHANGED Viewed

@@ -1,76 +1,97 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 1.8888888888888888,
   "eval_steps": 500,
-  "global_step": 14,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 0.25396825396825395,
-      "grad_norm": NaN,
-      "learning_rate": 0.00018571428571428572,
-      "loss": 71.7659,
       "step": 2
     },
     {
       "epoch": 0.5079365079365079,
-      "grad_norm": 23.091283798217773,
-      "learning_rate": 0.00015714285714285716,
-      "loss": 70.0374,
       "step": 4
     },
     {
       "epoch": 0.7619047619047619,
-      "grad_norm": 34.86846160888672,
-      "learning_rate": 0.00012857142857142858,
-      "loss": 63.5778,
       "step": 6
     },
     {
       "epoch": 1.126984126984127,
-      "grad_norm": 57.71058654785156,
-      "learning_rate": 0.0001,
-      "loss": 75.8754,
       "step": 8
     },
     {
       "epoch": 1.380952380952381,
-      "grad_norm": 32.576454162597656,
-      "learning_rate": 7.142857142857143e-05,
-      "loss": 52.6561,
       "step": 10
     },
     {
       "epoch": 1.6349206349206349,
-      "grad_norm": 18.392147064208984,
-      "learning_rate": 4.2857142857142856e-05,
-      "loss": 48.4818,
       "step": 12
     },
     {
       "epoch": 1.8888888888888888,
-      "grad_norm": 21.46400260925293,
-      "learning_rate": 1.4285714285714285e-05,
-      "loss": 49.3458,
       "step": 14
     },
     {
-      "epoch": 1.8888888888888888,
-      "step": 14,
-      "total_flos": 217126740172968.0,
-      "train_loss": 61.677159445626394,
-      "train_runtime": 515.49,
-      "train_samples_per_second": 0.489,
       "train_steps_per_second": 0.027
     }
   ],
   "logging_steps": 2,
-  "max_steps": 14,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 2,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
@@ -84,7 +105,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 217126740172968.0,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 2.888888888888889,
   "eval_steps": 500,
+  "global_step": 21,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 0.25396825396825395,
+      "grad_norm": 22.455032348632812,
+      "learning_rate": 0.00018095238095238095,
+      "loss": 71.5526,
       "step": 2
     },
     {
       "epoch": 0.5079365079365079,
+      "grad_norm": NaN,
+      "learning_rate": 0.00018095238095238095,
+      "loss": 68.4573,
       "step": 4
     },
     {
       "epoch": 0.7619047619047619,
+      "grad_norm": 27.567764282226562,
+      "learning_rate": 0.00016190476190476192,
+      "loss": 66.9582,
       "step": 6
     },
     {
       "epoch": 1.126984126984127,
+      "grad_norm": 61.912845611572266,
+      "learning_rate": 0.00014285714285714287,
+      "loss": 78.8634,
       "step": 8
     },
     {
       "epoch": 1.380952380952381,
+      "grad_norm": 38.26054000854492,
+      "learning_rate": 0.0001238095238095238,
+      "loss": 53.5637,
       "step": 10
     },
     {
       "epoch": 1.6349206349206349,
+      "grad_norm": 19.41400146484375,
+      "learning_rate": 0.00010476190476190477,
+      "loss": 47.919,
       "step": 12
     },
     {
       "epoch": 1.8888888888888888,
+      "grad_norm": 21.822195053100586,
+      "learning_rate": 8.571428571428571e-05,
+      "loss": 47.9407,
       "step": 14
     },
     {
+      "epoch": 2.253968253968254,
+      "grad_norm": 18.68866729736328,
+      "learning_rate": 6.666666666666667e-05,
+      "loss": 63.3071,
+      "step": 16
+    },
+    {
+      "epoch": 2.507936507936508,
+      "grad_norm": 28.52600860595703,
+      "learning_rate": 4.761904761904762e-05,
+      "loss": 43.1297,
+      "step": 18
+    },
+    {
+      "epoch": 2.761904761904762,
+      "grad_norm": 12.20601749420166,
+      "learning_rate": 2.857142857142857e-05,
+      "loss": 43.0936,
+      "step": 20
+    },
+    {
+      "epoch": 2.888888888888889,
+      "step": 21,
+      "total_flos": 331427311589016.0,
+      "train_loss": 57.708736782982236,
+      "train_runtime": 785.4183,
+      "train_samples_per_second": 0.481,
       "train_steps_per_second": 0.027
     }
   ],
   "logging_steps": 2,
+  "max_steps": 21,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
       "attributes": {}
     }
   },
+  "total_flos": 331427311589016.0,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null