Training in progress, epoch 5, checkpoint

Files changed (6) hide show

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:06df666b6e9b9daf5f491d47584000ef0f15c0ff91d9d43b452f6608165d2c17
 size 2460354912

 version https://git-lfs.github.com/spec/v1
+oid sha256:fab85460a1b4afe5235adf29b80d60cc190779373e90f98a65f4d03b9ab2763e
 size 2460354912

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4e6f9f13f431d32355177f53dd768a76f75650f7a6e4ff3e746b73da59d4b3b1
 size 4921023445

 version https://git-lfs.github.com/spec/v1
+oid sha256:efb3e71bd2169d1bee8c01a9ac4b53b09649a9e69287d3ec66340315dc828cd0
 size 4921023445

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2f213695afd639b31c091f8223418438a325ee03e1cc0db68e855dfc04f16a3c
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:7f19a3c3d19ca62769269406caae709c1ade6af65b39ab8ea8cb5c868d8c6022
 size 14244

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0262aa68bebe82c90fa7f7f9955996a9e0ad8e1b35acbc7f8a4355aa7d949b83
 size 988

 version https://git-lfs.github.com/spec/v1
+oid sha256:86b6dcc7abbb19b3c426b916efb5f17e7204c57a28b1c5bdc0e214cf16444280
 size 988

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3d31e1b87deb184c3fb7779fff023bc406d60a7176c80663ef83e1b93f1aa152
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:b6bdc06fd50950c7d5950384b8985848c0c078212370cd8410d5b1ea7f24947e
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
-  "best_global_step": 1000,
-  "best_metric": 63.06198866502594,
-  "best_model_checkpoint": "nllb-600m-dz-en-checkpoints/checkpoint-1000",
-  "epoch": 4.0,
   "eval_steps": 500,
-  "global_step": 1000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -58,6 +58,15 @@
       "eval_samples_per_second": 4.962,
       "eval_steps_per_second": 1.241,
       "step": 1000
     }
   ],
   "logging_steps": 500,
@@ -72,12 +81,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": false
       },
       "attributes": {}
     }
   },
-  "total_flos": 2167104602112000.0,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null

 {
+  "best_global_step": 1250,
+  "best_metric": 63.12399055783562,
+  "best_model_checkpoint": "nllb-600m-dz-en-checkpoints/checkpoint-1250",
+  "epoch": 5.0,
   "eval_steps": 500,
+  "global_step": 1250,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 4.962,
       "eval_steps_per_second": 1.241,
       "step": 1000
+    },
+    {
+      "epoch": 5.0,
+      "eval_bleu": 63.12399055783562,
+      "eval_loss": 0.10181548446416855,
+      "eval_runtime": 111.015,
+      "eval_samples_per_second": 4.504,
+      "eval_steps_per_second": 1.126,
+      "step": 1250
     }
   ],
   "logging_steps": 500,
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": true
       },
       "attributes": {}
     }
   },
+  "total_flos": 2708880752640000.0,
   "train_batch_size": 4,
   "trial_name": null,
   "trial_params": null