vincentmin
/

llama-2-7b-reward-oasst1

PEFT

TensorBoard

Generated from Trainer

trl

Model card Files Files and versions Metrics Training metrics Community

vincentmin commited on Jul 26, 2023

Commit

d5857b7

1 Parent(s): 2a74db6

End of training

Browse files

Files changed (3) hide show

README.md +13 -0
score-params.pt +0 -3
trainer_state.json +221 -107

README.md CHANGED Viewed

@@ -7,6 +7,7 @@ metrics:
 model-index:
 - name: llama-2-7b-reward-oasst1
   results: []
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -33,6 +34,17 @@ More information needed
 ## Training procedure
 ### Training hyperparameters
 The following hyperparameters were used during training:
@@ -64,6 +76,7 @@ The following hyperparameters were used during training:
 ### Framework versions
 - Transformers 4.32.0.dev0
 - Pytorch 2.0.1+cu118
 - Datasets 2.14.0

 model-index:
 - name: llama-2-7b-reward-oasst1
   results: []
+library_name: peft
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 ## Training procedure
+The following `bitsandbytes` quantization config was used during training:
+- load_in_8bit: False
+- load_in_4bit: True
+- llm_int8_threshold: 6.0
+- llm_int8_skip_modules: None
+- llm_int8_enable_fp32_cpu_offload: False
+- llm_int8_has_fp16_weight: False
+- bnb_4bit_quant_type: nf4
+- bnb_4bit_use_double_quant: False
+- bnb_4bit_compute_dtype: float16
 ### Training hyperparameters
 The following hyperparameters were used during training:
 ### Framework versions
+- PEFT 0.5.0.dev0
 - Transformers 4.32.0.dev0
 - Pytorch 2.0.1+cu118
 - Datasets 2.14.0

score-params.pt DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:004dfe6b5ceb18d6a8e7a0c4010af0e72a2b3c2156d39ac2f0b42541bafb4dc0
-size 34043

trainer_state.json CHANGED Viewed

@@ -1,296 +1,410 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.7584,
-  "global_step": 1896,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 0.02,
-      "learning_rate": 1.9624e-05,
-      "loss": 0.9388,
       "step": 50
     },
     {
       "epoch": 0.04,
       "learning_rate": 1.9232e-05,
-      "loss": 0.9522,
       "step": 100
     },
     {
       "epoch": 0.06,
       "learning_rate": 1.8832000000000002e-05,
-      "loss": 0.8005,
       "step": 150
     },
     {
       "epoch": 0.08,
       "learning_rate": 1.8432000000000002e-05,
-      "loss": 0.6908,
       "step": 200
     },
     {
       "epoch": 0.1,
       "learning_rate": 1.8032e-05,
-      "loss": 0.7927,
       "step": 250
     },
     {
       "epoch": 0.1,
-      "eval_accuracy": 0.6659167604049494,
-      "eval_loss": 0.7351371645927429,
-      "eval_runtime": 434.6411,
-      "eval_samples_per_second": 2.045,
-      "eval_steps_per_second": 2.045,
       "step": 250
     },
     {
       "epoch": 0.12,
-      "learning_rate": 1.764e-05,
-      "loss": 0.5962,
       "step": 300
     },
     {
       "epoch": 0.14,
-      "learning_rate": 1.724e-05,
-      "loss": 0.6989,
       "step": 350
     },
     {
       "epoch": 0.16,
-      "learning_rate": 1.684e-05,
-      "loss": 0.7051,
       "step": 400
     },
     {
       "epoch": 0.18,
-      "learning_rate": 1.6440000000000002e-05,
-      "loss": 0.6664,
       "step": 450
     },
     {
       "epoch": 0.2,
-      "learning_rate": 1.6040000000000002e-05,
-      "loss": 0.6547,
       "step": 500
     },
     {
       "epoch": 0.2,
-      "eval_accuracy": 0.7041619797525309,
-      "eval_loss": 0.6934666037559509,
-      "eval_runtime": 436.2176,
-      "eval_samples_per_second": 2.038,
-      "eval_steps_per_second": 2.038,
       "step": 500
     },
     {
       "epoch": 0.22,
-      "learning_rate": 1.5640000000000003e-05,
-      "loss": 0.665,
       "step": 550
     },
     {
       "epoch": 0.24,
-      "learning_rate": 1.5240000000000001e-05,
-      "loss": 0.654,
       "step": 600
     },
     {
       "epoch": 0.26,
-      "learning_rate": 1.4840000000000002e-05,
-      "loss": 0.6714,
       "step": 650
     },
     {
       "epoch": 0.28,
-      "learning_rate": 1.444e-05,
-      "loss": 0.7395,
       "step": 700
     },
     {
       "epoch": 0.3,
-      "learning_rate": 1.4040000000000001e-05,
-      "loss": 0.5393,
       "step": 750
     },
     {
       "epoch": 0.3,
-      "eval_accuracy": 0.7142857142857143,
-      "eval_loss": 0.621578574180603,
-      "eval_runtime": 436.3187,
-      "eval_samples_per_second": 2.038,
-      "eval_steps_per_second": 2.038,
       "step": 750
     },
     {
       "epoch": 0.32,
-      "learning_rate": 1.3640000000000002e-05,
-      "loss": 0.5185,
       "step": 800
     },
     {
       "epoch": 0.34,
-      "learning_rate": 1.3240000000000002e-05,
-      "loss": 0.6009,
       "step": 850
     },
     {
       "epoch": 0.36,
-      "learning_rate": 1.284e-05,
-      "loss": 0.6588,
       "step": 900
     },
     {
       "epoch": 0.38,
-      "learning_rate": 1.2440000000000001e-05,
-      "loss": 0.6022,
       "step": 950
     },
     {
       "epoch": 0.4,
-      "learning_rate": 1.204e-05,
-      "loss": 0.7316,
       "step": 1000
     },
     {
       "epoch": 0.4,
-      "eval_accuracy": 0.734533183352081,
-      "eval_loss": 0.5916205644607544,
-      "eval_runtime": 436.6514,
-      "eval_samples_per_second": 2.036,
-      "eval_steps_per_second": 2.036,
       "step": 1000
     },
     {
       "epoch": 0.42,
-      "learning_rate": 1.164e-05,
-      "loss": 0.6086,
       "step": 1050
     },
     {
       "epoch": 0.44,
-      "learning_rate": 1.1240000000000002e-05,
-      "loss": 0.5806,
       "step": 1100
     },
     {
       "epoch": 0.46,
-      "learning_rate": 1.0840000000000001e-05,
-      "loss": 0.5992,
       "step": 1150
     },
     {
       "epoch": 0.48,
-      "learning_rate": 1.0440000000000002e-05,
-      "loss": 0.5807,
       "step": 1200
     },
     {
       "epoch": 0.5,
-      "learning_rate": 1.004e-05,
-      "loss": 0.5667,
       "step": 1250
     },
     {
       "epoch": 0.5,
-      "eval_accuracy": 0.734533183352081,
-      "eval_loss": 0.5785398483276367,
-      "eval_runtime": 436.2096,
-      "eval_samples_per_second": 2.038,
-      "eval_steps_per_second": 2.038,
       "step": 1250
     },
     {
       "epoch": 0.52,
-      "learning_rate": 9.640000000000001e-06,
-      "loss": 0.4989,
       "step": 1300
     },
     {
       "epoch": 0.54,
-      "learning_rate": 9.240000000000001e-06,
-      "loss": 0.6015,
       "step": 1350
     },
     {
       "epoch": 0.56,
-      "learning_rate": 8.848e-06,
-      "loss": 0.5728,
       "step": 1400
     },
     {
       "epoch": 0.58,
-      "learning_rate": 8.448000000000001e-06,
-      "loss": 0.6285,
       "step": 1450
     },
     {
       "epoch": 0.6,
-      "learning_rate": 8.048e-06,
-      "loss": 0.498,
       "step": 1500
     },
     {
       "epoch": 0.6,
-      "eval_accuracy": 0.7435320584926884,
-      "eval_loss": 0.5632913708686829,
-      "eval_runtime": 436.3374,
-      "eval_samples_per_second": 2.037,
-      "eval_steps_per_second": 2.037,
       "step": 1500
     },
     {
       "epoch": 0.62,
-      "learning_rate": 7.648e-06,
-      "loss": 0.5134,
       "step": 1550
     },
     {
       "epoch": 0.64,
-      "learning_rate": 7.248000000000001e-06,
-      "loss": 0.4582,
       "step": 1600
     },
     {
       "epoch": 0.66,
-      "learning_rate": 6.848e-06,
-      "loss": 0.534,
       "step": 1650
     },
     {
       "epoch": 0.68,
-      "learning_rate": 6.448000000000001e-06,
-      "loss": 0.6765,
       "step": 1700
     },
     {
       "epoch": 0.7,
-      "learning_rate": 6.048e-06,
-      "loss": 0.6598,
       "step": 1750
     },
     {
       "epoch": 0.7,
-      "eval_accuracy": 0.7457817772778402,
-      "eval_loss": 0.565944254398346,
-      "eval_runtime": 435.7582,
-      "eval_samples_per_second": 2.04,
-      "eval_steps_per_second": 2.04,
       "step": 1750
     },
     {
       "epoch": 0.72,
-      "learning_rate": 5.648e-06,
-      "loss": 0.5006,
       "step": 1800
     },
     {
       "epoch": 0.74,
-      "learning_rate": 5.248000000000001e-06,
-      "loss": 0.579,
       "step": 1850
     }
   ],
   "max_steps": 2500,

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 1.0,
+  "global_step": 2500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 0.02,
+      "learning_rate": 1.9632e-05,
+      "loss": 0.9899,
       "step": 50
     },
     {
       "epoch": 0.04,
       "learning_rate": 1.9232e-05,
+      "loss": 0.9949,
       "step": 100
     },
     {
       "epoch": 0.06,
       "learning_rate": 1.8832000000000002e-05,
+      "loss": 0.828,
       "step": 150
     },
     {
       "epoch": 0.08,
       "learning_rate": 1.8432000000000002e-05,
+      "loss": 0.8372,
       "step": 200
     },
     {
       "epoch": 0.1,
       "learning_rate": 1.8032e-05,
+      "loss": 0.8409,
       "step": 250
     },
     {
       "epoch": 0.1,
+      "eval_accuracy": 0.6220472440944882,
+      "eval_loss": 0.8243474364280701,
+      "eval_runtime": 435.8774,
+      "eval_samples_per_second": 2.04,
+      "eval_steps_per_second": 2.04,
       "step": 250
     },
     {
       "epoch": 0.12,
+      "learning_rate": 1.7632000000000003e-05,
+      "loss": 0.694,
       "step": 300
     },
     {
       "epoch": 0.14,
+      "learning_rate": 1.7232000000000004e-05,
+      "loss": 0.6918,
       "step": 350
     },
     {
       "epoch": 0.16,
+      "learning_rate": 1.6832e-05,
+      "loss": 0.6794,
       "step": 400
     },
     {
       "epoch": 0.18,
+      "learning_rate": 1.6432e-05,
+      "loss": 0.6338,
       "step": 450
     },
     {
       "epoch": 0.2,
+      "learning_rate": 1.6032e-05,
+      "loss": 0.6288,
       "step": 500
     },
     {
       "epoch": 0.2,
+      "eval_accuracy": 0.671541057367829,
+      "eval_loss": 0.7539446949958801,
+      "eval_runtime": 434.4073,
+      "eval_samples_per_second": 2.046,
+      "eval_steps_per_second": 2.046,
       "step": 500
     },
     {
       "epoch": 0.22,
+      "learning_rate": 1.5632000000000002e-05,
+      "loss": 0.6622,
       "step": 550
     },
     {
       "epoch": 0.24,
+      "learning_rate": 1.5232000000000003e-05,
+      "loss": 0.773,
       "step": 600
     },
     {
       "epoch": 0.26,
+      "learning_rate": 1.4832000000000001e-05,
+      "loss": 0.6051,
       "step": 650
     },
     {
       "epoch": 0.28,
+      "learning_rate": 1.4432000000000002e-05,
+      "loss": 0.7805,
       "step": 700
     },
     {
       "epoch": 0.3,
+      "learning_rate": 1.4032e-05,
+      "loss": 0.5882,
       "step": 750
     },
     {
       "epoch": 0.3,
+      "eval_accuracy": 0.7075365579302587,
+      "eval_loss": 0.6791747808456421,
+      "eval_runtime": 433.8268,
+      "eval_samples_per_second": 2.049,
+      "eval_steps_per_second": 2.049,
       "step": 750
     },
     {
       "epoch": 0.32,
+      "learning_rate": 1.3632000000000001e-05,
+      "loss": 0.5672,
       "step": 800
     },
     {
       "epoch": 0.34,
+      "learning_rate": 1.3232e-05,
+      "loss": 0.6807,
       "step": 850
     },
     {
       "epoch": 0.36,
+      "learning_rate": 1.2832e-05,
+      "loss": 0.6796,
       "step": 900
     },
     {
       "epoch": 0.38,
+      "learning_rate": 1.2432000000000002e-05,
+      "loss": 0.6922,
       "step": 950
     },
     {
       "epoch": 0.4,
+      "learning_rate": 1.2032000000000001e-05,
+      "loss": 0.7671,
       "step": 1000
     },
     {
       "epoch": 0.4,
+      "eval_accuracy": 0.7334083239595051,
+      "eval_loss": 0.6129724383354187,
+      "eval_runtime": 433.287,
+      "eval_samples_per_second": 2.052,
+      "eval_steps_per_second": 2.052,
       "step": 1000
     },
     {
       "epoch": 0.42,
+      "learning_rate": 1.1632000000000001e-05,
+      "loss": 0.645,
       "step": 1050
     },
     {
       "epoch": 0.44,
+      "learning_rate": 1.1232e-05,
+      "loss": 0.5891,
       "step": 1100
     },
     {
       "epoch": 0.46,
+      "learning_rate": 1.0832e-05,
+      "loss": 0.6426,
       "step": 1150
     },
     {
       "epoch": 0.48,
+      "learning_rate": 1.0432e-05,
+      "loss": 0.567,
       "step": 1200
     },
     {
       "epoch": 0.5,
+      "learning_rate": 1.0032000000000002e-05,
+      "loss": 0.5782,
       "step": 1250
     },
     {
       "epoch": 0.5,
+      "eval_accuracy": 0.7255343082114736,
+      "eval_loss": 0.6114887595176697,
+      "eval_runtime": 433.3273,
+      "eval_samples_per_second": 2.052,
+      "eval_steps_per_second": 2.052,
       "step": 1250
     },
     {
       "epoch": 0.52,
+      "learning_rate": 9.632e-06,
+      "loss": 0.5736,
       "step": 1300
     },
     {
       "epoch": 0.54,
+      "learning_rate": 9.232e-06,
+      "loss": 0.6849,
       "step": 1350
     },
     {
       "epoch": 0.56,
+      "learning_rate": 8.832000000000001e-06,
+      "loss": 0.5305,
       "step": 1400
     },
     {
       "epoch": 0.58,
+      "learning_rate": 8.432e-06,
+      "loss": 0.7265,
       "step": 1450
     },
     {
       "epoch": 0.6,
+      "learning_rate": 8.032e-06,
+      "loss": 0.5691,
       "step": 1500
     },
     {
       "epoch": 0.6,
+      "eval_accuracy": 0.7412823397075365,
+      "eval_loss": 0.5794617533683777,
+      "eval_runtime": 433.4136,
+      "eval_samples_per_second": 2.051,
+      "eval_steps_per_second": 2.051,
       "step": 1500
     },
     {
       "epoch": 0.62,
+      "learning_rate": 7.632e-06,
+      "loss": 0.519,
       "step": 1550
     },
     {
       "epoch": 0.64,
+      "learning_rate": 7.232e-06,
+      "loss": 0.5378,
       "step": 1600
     },
     {
       "epoch": 0.66,
+      "learning_rate": 6.832000000000001e-06,
+      "loss": 0.5982,
       "step": 1650
     },
     {
       "epoch": 0.68,
+      "learning_rate": 6.432e-06,
+      "loss": 0.7027,
       "step": 1700
     },
     {
       "epoch": 0.7,
+      "learning_rate": 6.032e-06,
+      "loss": 0.6579,
       "step": 1750
     },
     {
       "epoch": 0.7,
+      "eval_accuracy": 0.7469066366704162,
+      "eval_loss": 0.5774183869361877,
+      "eval_runtime": 433.4068,
+      "eval_samples_per_second": 2.051,
+      "eval_steps_per_second": 2.051,
       "step": 1750
     },
     {
       "epoch": 0.72,
+      "learning_rate": 5.6320000000000005e-06,
+      "loss": 0.5044,
       "step": 1800
     },
     {
       "epoch": 0.74,
+      "learning_rate": 5.232e-06,
+      "loss": 0.6482,
       "step": 1850
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 4.8320000000000005e-06,
+      "loss": 0.5406,
+      "step": 1900
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 4.432e-06,
+      "loss": 0.5372,
+      "step": 1950
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 4.0320000000000005e-06,
+      "loss": 0.6107,
+      "step": 2000
+    },
+    {
+      "epoch": 0.8,
+      "eval_accuracy": 0.7401574803149606,
+      "eval_loss": 0.5690832734107971,
+      "eval_runtime": 433.3967,
+      "eval_samples_per_second": 2.051,
+      "eval_steps_per_second": 2.051,
+      "step": 2000
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 3.6320000000000005e-06,
+      "loss": 0.4043,
+      "step": 2050
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 3.2400000000000003e-06,
+      "loss": 0.5344,
+      "step": 2100
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 2.84e-06,
+      "loss": 0.7056,
+      "step": 2150
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 2.4400000000000004e-06,
+      "loss": 0.5719,
+      "step": 2200
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 2.04e-06,
+      "loss": 0.6255,
+      "step": 2250
+    },
+    {
+      "epoch": 0.9,
+      "eval_accuracy": 0.7435320584926884,
+      "eval_loss": 0.570974588394165,
+      "eval_runtime": 433.4106,
+      "eval_samples_per_second": 2.051,
+      "eval_steps_per_second": 2.051,
+      "step": 2250
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 1.6400000000000002e-06,
+      "loss": 0.5958,
+      "step": 2300
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 1.2400000000000002e-06,
+      "loss": 0.5984,
+      "step": 2350
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 8.480000000000001e-07,
+      "loss": 0.6103,
+      "step": 2400
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 4.4800000000000004e-07,
+      "loss": 0.612,
+      "step": 2450
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 4.8e-08,
+      "loss": 0.7034,
+      "step": 2500
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": 0.7435320584926884,
+      "eval_loss": 0.5713425874710083,
+      "eval_runtime": 434.3078,
+      "eval_samples_per_second": 2.047,
+      "eval_steps_per_second": 2.047,
+      "step": 2500
+    },
+    {
+      "epoch": 1.0,
+      "step": 2500,
+      "total_flos": 0.0,
+      "train_loss": 0.6507886672973633,
+      "train_runtime": 17457.236,
+      "train_samples_per_second": 0.573,
+      "train_steps_per_second": 0.143
     }
   ],
   "max_steps": 2500,