Training completed

Files changed (3) hide show

all_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.5873015873015874,
     "total_flos": 1.394108846267433e+17,
-    "train_loss": 4.180461883544922,
-    "train_runtime": 165.3706,
-    "train_samples_per_second": 9.675,
-    "train_steps_per_second": 0.06
 }

 {
     "epoch": 1.5873015873015874,
     "total_flos": 1.394108846267433e+17,
+    "train_loss": 4.131035614013672,
+    "train_runtime": 154.8297,
+    "train_samples_per_second": 10.334,
+    "train_steps_per_second": 0.065
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.5873015873015874,
     "total_flos": 1.394108846267433e+17,
-    "train_loss": 4.180461883544922,
-    "train_runtime": 165.3706,
-    "train_samples_per_second": 9.675,
-    "train_steps_per_second": 0.06
 }

 {
     "epoch": 1.5873015873015874,
     "total_flos": 1.394108846267433e+17,
+    "train_loss": 4.131035614013672,
+    "train_runtime": 154.8297,
+    "train_samples_per_second": 10.334,
+    "train_steps_per_second": 0.065
 }

trainer_state.json CHANGED Viewed

@@ -10,19 +10,19 @@
   "log_history": [
     {
       "epoch": 1.5873015873015874,
-      "grad_norm": 0.37594524025917053,
       "learning_rate": 0.0001,
-      "loss": 4.1805,
       "step": 10
     },
     {
       "epoch": 1.5873015873015874,
       "step": 10,
       "total_flos": 1.394108846267433e+17,
-      "train_loss": 4.180461883544922,
-      "train_runtime": 165.3706,
-      "train_samples_per_second": 9.675,
-      "train_steps_per_second": 0.06
     }
   ],
   "logging_steps": 10,

   "log_history": [
     {
       "epoch": 1.5873015873015874,
+      "grad_norm": 0.2575690448284149,
       "learning_rate": 0.0001,
+      "loss": 4.131,
       "step": 10
     },
     {
       "epoch": 1.5873015873015874,
       "step": 10,
       "total_flos": 1.394108846267433e+17,
+      "train_loss": 4.131035614013672,
+      "train_runtime": 154.8297,
+      "train_samples_per_second": 10.334,
+      "train_steps_per_second": 0.065
     }
   ],
   "logging_steps": 10,