End of training

Files changed (10) hide show

README.md CHANGED Viewed

@@ -4,6 +4,7 @@ base_model: allenai/tulu-2-7b
 tags:
 - trl
 - dpo
 - generated_from_trainer
 model-index:
 - name: uf-rlced-conifer_tulu-2-7b-dpo-full

 tags:
 - trl
 - dpo
+- alignment-handbook
 - generated_from_trainer
 model-index:
 - name: uf-rlced-conifer_tulu-2-7b-dpo-full

all_results.json CHANGED Viewed

@@ -1,9 +1,22 @@
 {
     "epoch": 1.0,
     "total_flos": 0.0,
     "train_loss": 0.1732867956161499,
-    "train_runtime": 84.0616,
     "train_samples": 50,
-    "train_samples_per_second": 0.595,
-    "train_steps_per_second": 0.012
 }

 {
     "epoch": 1.0,
+    "eval_logits/chosen": -1.3140687942504883,
+    "eval_logits/rejected": -1.1924079656600952,
+    "eval_logps/chosen": -316.60687255859375,
+    "eval_logps/rejected": -434.5618896484375,
+    "eval_loss": 0.6931471228599548,
+    "eval_rewards/accuracies": 0.0,
+    "eval_rewards/chosen": 0.0,
+    "eval_rewards/margins": 0.0,
+    "eval_rewards/rejected": 0.0,
+    "eval_runtime": 2.7893,
+    "eval_samples": 50,
+    "eval_samples_per_second": 17.926,
+    "eval_steps_per_second": 0.359,
     "total_flos": 0.0,
     "train_loss": 0.1732867956161499,
+    "train_runtime": 87.5332,
     "train_samples": 50,
+    "train_samples_per_second": 0.571,
+    "train_steps_per_second": 0.011
 }

config.json CHANGED Viewed

@@ -24,6 +24,6 @@
   "tie_word_embeddings": false,
   "torch_dtype": "bfloat16",
   "transformers_version": "4.44.1",
-  "use_cache": true,
   "vocab_size": 32000
 }

   "tie_word_embeddings": false,
   "torch_dtype": "bfloat16",
   "transformers_version": "4.44.1",
+  "use_cache": false,
   "vocab_size": 32000
 }

eval_results.json ADDED Viewed

+{
+    "epoch": 1.0,
+    "eval_logits/chosen": -1.3140687942504883,
+    "eval_logits/rejected": -1.1924079656600952,
+    "eval_logps/chosen": -316.60687255859375,
+    "eval_logps/rejected": -434.5618896484375,
+    "eval_loss": 0.6931471228599548,
+    "eval_rewards/accuracies": 0.0,
+    "eval_rewards/chosen": 0.0,
+    "eval_rewards/margins": 0.0,
+    "eval_rewards/rejected": 0.0,
+    "eval_runtime": 2.7893,
+    "eval_samples": 50,
+    "eval_samples_per_second": 17.926,
+    "eval_steps_per_second": 0.359
+}

model-00001-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f3d24d8e5f2d74688b57b67cb7f3a3cb48857d7da53a2b22e41699d7baf46219
 size 4938985352

 version https://git-lfs.github.com/spec/v1
+oid sha256:7c95f04736951a02d7c6cb951b558cf29fb57e053481302fbebed33a80389a91
 size 4938985352

model-00002-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0fc45a397c714c50f1b4be003342d781274dc379b7260da620ff8309ab585b2c
 size 4947390880

 version https://git-lfs.github.com/spec/v1
+oid sha256:96e1711d017d5929a34aefa4794dfd931dbf79a78fbba2b770749c4494b84f7e
 size 4947390880

model-00003-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4d7ce26565acdaef2d9ccea41ce48adada2955f61faea505be4a938b95ca614b
 size 3590488816

 version https://git-lfs.github.com/spec/v1
+oid sha256:028796c311524c39e27ac124f54c12c67cbd03045d99e621f4bbea4052e6c8fe
 size 3590488816

train_results.json CHANGED Viewed

@@ -2,8 +2,8 @@
     "epoch": 1.0,
     "total_flos": 0.0,
     "train_loss": 0.1732867956161499,
-    "train_runtime": 84.0616,
     "train_samples": 50,
-    "train_samples_per_second": 0.595,
-    "train_steps_per_second": 0.012
 }

     "epoch": 1.0,
     "total_flos": 0.0,
     "train_loss": 0.1732867956161499,
+    "train_runtime": 87.5332,
     "train_samples": 50,
+    "train_samples_per_second": 0.571,
+    "train_steps_per_second": 0.011
 }

trainer_state.json CHANGED Viewed

@@ -27,9 +27,9 @@
       "step": 1,
       "total_flos": 0.0,
       "train_loss": 0.1732867956161499,
-      "train_runtime": 84.0616,
-      "train_samples_per_second": 0.595,
-      "train_steps_per_second": 0.012
     }
   ],
   "logging_steps": 10,

       "step": 1,
       "total_flos": 0.0,
       "train_loss": 0.1732867956161499,
+      "train_runtime": 87.5332,
+      "train_samples_per_second": 0.571,
+      "train_steps_per_second": 0.011
     }
   ],
   "logging_steps": 10,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ccfb1454676649d4bdc6a930b2796dfe423c459cc6b738ae8d9140ac84ee6645
 size 7480

 version https://git-lfs.github.com/spec/v1
+oid sha256:2437447f7418506fbd2418372dedfe2ef17ea51aef679348ff1a33fd2e1503ed
 size 7480