Training in progress, epoch 6

Browse files

Files changed (8) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +288 -3
pytorch_model.bin +1 -1
runs/Feb20_18-29-06_ubuntu-2004/events.out.tfevents.1676885357.ubuntu-2004.887393.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0c89b45e2ac69f6293669df6313ee21058cc2af394a4390bba808d002466ccd2
 size 236491269

 version https://git-lfs.github.com/spec/v1
+oid sha256:3c204c5739cb89e423854dc482b604d68f1fe7777bddd32bee3e42c27396f835
 size 236491269

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6862122e6b9f883fcb720027b7e6e1ee4be3dcf9522d8dc9475125e601d5bc53
 size 118253458

 version https://git-lfs.github.com/spec/v1
+oid sha256:8f1368949b8a3ca0194b62ba5c01ad414ec8388ceb72de5c960a6415ef0bc7eb
 size 118253458

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3214d2294320f690f0de7c994db816bb6b393e81c203b4bd95ac5070d6787ff6
 size 15597

 version https://git-lfs.github.com/spec/v1
+oid sha256:b2804a769785bd005d311fa5211b59d4c5e43c5e9f11eb9bdc8f5d8e3bbbcfcc
 size 15597

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:274b42d0611ce03f64f3695a4574be0aa6d9ba137add81127f546ea0347ddbe2
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:249568bbffd1228f6946ea7e8e37b3e1003da8fddc10b6cbe9e7db83b6052d3f
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9e06a18a940ba98c5f1a42737f61af8460d78a917521a83b1e094435306c8218
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:b1f64a9b985406894ef65cdb08cec8746d6a7f750e0466984f5ddbc1f0df99b9
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 5.0,
-  "global_step": 114700,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1425,11 +1425,296 @@
       "eval_samples_per_second": 603.782,
       "eval_steps_per_second": 37.736,
       "step": 114700
     }
   ],
   "max_steps": 321160,
   "num_train_epochs": 14,
-  "total_flos": 8.721147965075726e+17,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 6.0,
+  "global_step": 137640,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 603.782,
       "eval_steps_per_second": 37.736,
       "step": 114700
+    },
+    {
+      "epoch": 5.01,
+      "learning_rate": 6.48568319347818e-05,
+      "loss": 1.714,
+      "step": 115000
+    },
+    {
+      "epoch": 5.03,
+      "learning_rate": 6.469957351516601e-05,
+      "loss": 1.7098,
+      "step": 115500
+    },
+    {
+      "epoch": 5.06,
+      "learning_rate": 6.454231509555022e-05,
+      "loss": 1.7095,
+      "step": 116000
+    },
+    {
+      "epoch": 5.08,
+      "learning_rate": 6.438537119277366e-05,
+      "loss": 1.7098,
+      "step": 116500
+    },
+    {
+      "epoch": 5.1,
+      "learning_rate": 6.422811277315787e-05,
+      "loss": 1.711,
+      "step": 117000
+    },
+    {
+      "epoch": 5.12,
+      "learning_rate": 6.407085435354208e-05,
+      "loss": 1.7108,
+      "step": 117500
+    },
+    {
+      "epoch": 5.14,
+      "learning_rate": 6.391359593392631e-05,
+      "loss": 1.7088,
+      "step": 118000
+    },
+    {
+      "epoch": 5.17,
+      "learning_rate": 6.375665203114975e-05,
+      "loss": 1.7073,
+      "step": 118500
+    },
+    {
+      "epoch": 5.19,
+      "learning_rate": 6.359939361153396e-05,
+      "loss": 1.7099,
+      "step": 119000
+    },
+    {
+      "epoch": 5.21,
+      "learning_rate": 6.344213519191819e-05,
+      "loss": 1.7051,
+      "step": 119500
+    },
+    {
+      "epoch": 5.23,
+      "learning_rate": 6.32848767723024e-05,
+      "loss": 1.7083,
+      "step": 120000
+    },
+    {
+      "epoch": 5.25,
+      "learning_rate": 6.312793286952584e-05,
+      "loss": 1.7101,
+      "step": 120500
+    },
+    {
+      "epoch": 5.27,
+      "learning_rate": 6.297067444991005e-05,
+      "loss": 1.7033,
+      "step": 121000
+    },
+    {
+      "epoch": 5.3,
+      "learning_rate": 6.281341603029426e-05,
+      "loss": 1.7058,
+      "step": 121500
+    },
+    {
+      "epoch": 5.32,
+      "learning_rate": 6.265615761067847e-05,
+      "loss": 1.7041,
+      "step": 122000
+    },
+    {
+      "epoch": 5.34,
+      "learning_rate": 6.249921370790193e-05,
+      "loss": 1.7036,
+      "step": 122500
+    },
+    {
+      "epoch": 5.36,
+      "learning_rate": 6.234195528828613e-05,
+      "loss": 1.7024,
+      "step": 123000
+    },
+    {
+      "epoch": 5.38,
+      "learning_rate": 6.218469686867035e-05,
+      "loss": 1.703,
+      "step": 123500
+    },
+    {
+      "epoch": 5.41,
+      "learning_rate": 6.202743844905456e-05,
+      "loss": 1.7014,
+      "step": 124000
+    },
+    {
+      "epoch": 5.43,
+      "learning_rate": 6.187049454627801e-05,
+      "loss": 1.7043,
+      "step": 124500
+    },
+    {
+      "epoch": 5.45,
+      "learning_rate": 6.171323612666222e-05,
+      "loss": 1.703,
+      "step": 125000
+    },
+    {
+      "epoch": 5.47,
+      "learning_rate": 6.155597770704644e-05,
+      "loss": 1.6996,
+      "step": 125500
+    },
+    {
+      "epoch": 5.49,
+      "learning_rate": 6.139871928743065e-05,
+      "loss": 1.7036,
+      "step": 126000
+    },
+    {
+      "epoch": 5.51,
+      "learning_rate": 6.12417753846541e-05,
+      "loss": 1.6985,
+      "step": 126500
+    },
+    {
+      "epoch": 5.54,
+      "learning_rate": 6.108451696503831e-05,
+      "loss": 1.6983,
+      "step": 127000
+    },
+    {
+      "epoch": 5.56,
+      "learning_rate": 6.0927258545422526e-05,
+      "loss": 1.7001,
+      "step": 127500
+    },
+    {
+      "epoch": 5.58,
+      "learning_rate": 6.077000012580674e-05,
+      "loss": 1.6959,
+      "step": 128000
+    },
+    {
+      "epoch": 5.6,
+      "learning_rate": 6.061305622303018e-05,
+      "loss": 1.697,
+      "step": 128500
+    },
+    {
+      "epoch": 5.62,
+      "learning_rate": 6.045579780341439e-05,
+      "loss": 1.6969,
+      "step": 129000
+    },
+    {
+      "epoch": 5.65,
+      "learning_rate": 6.0298539383798616e-05,
+      "loss": 1.6922,
+      "step": 129500
+    },
+    {
+      "epoch": 5.67,
+      "learning_rate": 6.014128096418282e-05,
+      "loss": 1.6976,
+      "step": 130000
+    },
+    {
+      "epoch": 5.69,
+      "learning_rate": 5.998433706140627e-05,
+      "loss": 1.6929,
+      "step": 130500
+    },
+    {
+      "epoch": 5.71,
+      "learning_rate": 5.982707864179048e-05,
+      "loss": 1.6945,
+      "step": 131000
+    },
+    {
+      "epoch": 5.73,
+      "learning_rate": 5.96698202221747e-05,
+      "loss": 1.6906,
+      "step": 131500
+    },
+    {
+      "epoch": 5.75,
+      "learning_rate": 5.951256180255891e-05,
+      "loss": 1.6941,
+      "step": 132000
+    },
+    {
+      "epoch": 5.78,
+      "learning_rate": 5.9355617899782356e-05,
+      "loss": 1.695,
+      "step": 132500
+    },
+    {
+      "epoch": 5.8,
+      "learning_rate": 5.919835948016658e-05,
+      "loss": 1.6897,
+      "step": 133000
+    },
+    {
+      "epoch": 5.82,
+      "learning_rate": 5.904110106055078e-05,
+      "loss": 1.6877,
+      "step": 133500
+    },
+    {
+      "epoch": 5.84,
+      "learning_rate": 5.888384264093499e-05,
+      "loss": 1.6901,
+      "step": 134000
+    },
+    {
+      "epoch": 5.86,
+      "learning_rate": 5.8726898738158446e-05,
+      "loss": 1.6896,
+      "step": 134500
+    },
+    {
+      "epoch": 5.88,
+      "learning_rate": 5.856964031854266e-05,
+      "loss": 1.6925,
+      "step": 135000
+    },
+    {
+      "epoch": 5.91,
+      "learning_rate": 5.841238189892687e-05,
+      "loss": 1.685,
+      "step": 135500
+    },
+    {
+      "epoch": 5.93,
+      "learning_rate": 5.825512347931108e-05,
+      "loss": 1.6871,
+      "step": 136000
+    },
+    {
+      "epoch": 5.95,
+      "learning_rate": 5.809817957653453e-05,
+      "loss": 1.69,
+      "step": 136500
+    },
+    {
+      "epoch": 5.97,
+      "learning_rate": 5.7940921156918746e-05,
+      "loss": 1.6874,
+      "step": 137000
+    },
+    {
+      "epoch": 5.99,
+      "learning_rate": 5.7783662737302956e-05,
+      "loss": 1.6883,
+      "step": 137500
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.6772348720266682,
+      "eval_loss": 1.5559165477752686,
+      "eval_runtime": 294.9687,
+      "eval_samples_per_second": 603.291,
+      "eval_steps_per_second": 37.706,
+      "step": 137640
     }
   ],
   "max_steps": 321160,
   "num_train_epochs": 14,
+  "total_flos": 1.0465574145188712e+18,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6862122e6b9f883fcb720027b7e6e1ee4be3dcf9522d8dc9475125e601d5bc53
 size 118253458

 version https://git-lfs.github.com/spec/v1
+oid sha256:8f1368949b8a3ca0194b62ba5c01ad414ec8388ceb72de5c960a6415ef0bc7eb
 size 118253458

runs/Feb20_18-29-06_ubuntu-2004/events.out.tfevents.1676885357.ubuntu-2004.887393.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:87287f5853697bd232c1d288f5654c67eba5514d42ef65d845face5a9d732001
-size 41957

 version https://git-lfs.github.com/spec/v1
+oid sha256:90f59812f8ad810e2c50c9e69c1d3b4459e7d488705ec40983855bea3b4f8d6b
+size 49646