Training in progress, step 25000

Browse files

Files changed (8) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +2 -2
last-checkpoint/scaler.pt +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +252 -3
pytorch_model.bin +1 -1
runs/Dec26_19-57-19_gpu07.cyverse.org/events.out.tfevents.1672109970.gpu07.cyverse.org.126369.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bd7eb848685ef3f06accf08b0991ae5fb7aca4770e2f824f2a4e024e639e7fb2
 size 12347192855

 version https://git-lfs.github.com/spec/v1
+oid sha256:b7e95d32dcf1313d4d274cdf1f5d1af89486240164e0b3639609c384f3a6aa38
 size 12347192855

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8e71d25993f756e62aa28d38555706c7d09a30a1163fed42767f77816851100d
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:c7d72bd6229dd4892c0ec31be77fa696d2217e4e04889cd376f1c5656a21f2f9
 size 6173655480

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9eaf0badf99eb2f5a4bcf7352b7e7e60bdb9fb3eb0aafd7a775251c7a5269cfd
-size 14511

 version https://git-lfs.github.com/spec/v1
+oid sha256:4b77749c5af5968880b87d75a81d87a96c674b888d3e33d9bb37ea44ce8d55c4
+size 14575

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cf5ce6709b8cf97417772fb30cceb44ce3363ceb800bc698892d9018ba93c60f
 size 557

 version https://git-lfs.github.com/spec/v1
+oid sha256:d3f23d7a993773edab63493abcae990440dc2feb5ff92913bd748a46c87b40a2
 size 557

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d0b3ee000403ded4a43ceaf77d66b9d28960f5cc5d0851756133984c89e3a2c4
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:cc891dbaea2add2de2987a866c707e13cbde49cb55e08b12d463d2745e1171b5
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.11536111854119403,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-spanish/checkpoint-1000",
-  "epoch": 0.8330729980214516,
-  "global_step": 24000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -5982,11 +5982,260 @@
       "eval_steps_per_second": 0.062,
       "eval_wer": 0.08535018806365434,
       "step": 24000
     }
   ],
   "max_steps": 25000,
   "num_train_epochs": 1,
-  "total_flos": 8.152976719872e+20,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.11536111854119403,
   "best_model_checkpoint": "/storage/elsayedissa/whisper-large-v2-spanish/checkpoint-1000",
+  "epoch": 0.8677843729390121,
+  "global_step": 25000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.062,
       "eval_wer": 0.08535018806365434,
       "step": 24000
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 4.0285714285714287e-07,
+      "loss": 0.1454,
+      "step": 24025
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 3.9265306122448983e-07,
+      "loss": 0.1063,
+      "step": 24050
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 3.824489795918368e-07,
+      "loss": 0.1344,
+      "step": 24075
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 3.722448979591837e-07,
+      "loss": 0.1193,
+      "step": 24100
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 3.6204081632653065e-07,
+      "loss": 0.1502,
+      "step": 24125
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 3.518367346938776e-07,
+      "loss": 0.137,
+      "step": 24150
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 3.4163265306122456e-07,
+      "loss": 0.1305,
+      "step": 24175
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 3.314285714285714e-07,
+      "loss": 0.1253,
+      "step": 24200
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 3.2122448979591837e-07,
+      "loss": 0.1539,
+      "step": 24225
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 3.110204081632653e-07,
+      "loss": 0.1062,
+      "step": 24250
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 3.008163265306123e-07,
+      "loss": 0.1738,
+      "step": 24275
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 2.9061224489795924e-07,
+      "loss": 0.1179,
+      "step": 24300
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 2.8040816326530614e-07,
+      "loss": 0.1602,
+      "step": 24325
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 2.702040816326531e-07,
+      "loss": 0.1311,
+      "step": 24350
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 2.6e-07,
+      "loss": 0.1538,
+      "step": 24375
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 2.502040816326531e-07,
+      "loss": 0.1313,
+      "step": 24400
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 2.4000000000000003e-07,
+      "loss": 0.1648,
+      "step": 24425
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 2.2979591836734694e-07,
+      "loss": 0.1074,
+      "step": 24450
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 2.195918367346939e-07,
+      "loss": 0.1513,
+      "step": 24475
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 2.0938775510204082e-07,
+      "loss": 0.1201,
+      "step": 24500
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 1.9918367346938778e-07,
+      "loss": 0.1598,
+      "step": 24525
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 1.8897959183673468e-07,
+      "loss": 0.1192,
+      "step": 24550
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 1.7877551020408164e-07,
+      "loss": 0.1354,
+      "step": 24575
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 1.685714285714286e-07,
+      "loss": 0.1305,
+      "step": 24600
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 1.5836734693877552e-07,
+      "loss": 0.1446,
+      "step": 24625
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 1.4816326530612245e-07,
+      "loss": 0.1064,
+      "step": 24650
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 1.3795918367346938e-07,
+      "loss": 0.1283,
+      "step": 24675
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 1.2775510204081634e-07,
+      "loss": 0.1159,
+      "step": 24700
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 1.1755102040816327e-07,
+      "loss": 0.1518,
+      "step": 24725
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 1.073469387755102e-07,
+      "loss": 0.1121,
+      "step": 24750
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 9.714285714285714e-08,
+      "loss": 0.1322,
+      "step": 24775
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 8.69387755102041e-08,
+      "loss": 0.1158,
+      "step": 24800
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 7.673469387755103e-08,
+      "loss": 0.1525,
+      "step": 24825
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 6.653061224489796e-08,
+      "loss": 0.127,
+      "step": 24850
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 5.63265306122449e-08,
+      "loss": 0.1458,
+      "step": 24875
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 4.6122448979591835e-08,
+      "loss": 0.1193,
+      "step": 24900
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 3.591836734693878e-08,
+      "loss": 0.1354,
+      "step": 24925
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 2.5714285714285715e-08,
+      "loss": 0.1071,
+      "step": 24950
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 1.5510204081632655e-08,
+      "loss": 0.1518,
+      "step": 24975
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 5.306122448979592e-09,
+      "loss": 0.1289,
+      "step": 25000
+    },
+    {
+      "epoch": 0.87,
+      "eval_loss": 0.14659932255744934,
+      "eval_runtime": 31237.4282,
+      "eval_samples_per_second": 0.994,
+      "eval_steps_per_second": 0.062,
+      "eval_wer": 0.08550209198112428,
+      "step": 25000
     }
   ],
   "max_steps": 25000,
   "num_train_epochs": 1,
+  "total_flos": 8.4926840832e+20,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8e71d25993f756e62aa28d38555706c7d09a30a1163fed42767f77816851100d
 size 6173655480

 version https://git-lfs.github.com/spec/v1
+oid sha256:c7d72bd6229dd4892c0ec31be77fa696d2217e4e04889cd376f1c5656a21f2f9
 size 6173655480

runs/Dec26_19-57-19_gpu07.cyverse.org/events.out.tfevents.1672109970.gpu07.cyverse.org.126369.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3be1bf9d6afc1185ac6ba7539df5045fb2a516aaf0676ce7cb1d8b30a8903c18
-size 163704

 version https://git-lfs.github.com/spec/v1
+oid sha256:31cb789f8c864328076774003b86f846c87640b677ecab3bde4a275b556c94c7
+size 170428