End of training

Browse files

Files changed (4) hide show

all_results.json +17 -0
eval_results.json +11 -0
train_results.json +9 -0
trainer_state.json +731 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,17 @@

+{
+    "epoch": 44.0,
+    "eval_cer": 0.13281812509000143,
+    "eval_loss": 0.3162442147731781,
+    "eval_per": 0.22600304723209752,
+    "eval_runtime": 30.1741,
+    "eval_samples": 383,
+    "eval_samples_per_second": 12.693,
+    "eval_steps_per_second": 1.591,
+    "eval_wer": 0.22981208735398678,
+    "total_flos": 3.1481023081144828e+19,
+    "train_loss": 1.0956278002107298,
+    "train_runtime": 26844.9073,
+    "train_samples": 2688,
+    "train_samples_per_second": 20.026,
+    "train_steps_per_second": 0.626
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,11 @@

+{
+    "epoch": 44.0,
+    "eval_cer": 0.13281812509000143,
+    "eval_loss": 0.3162442147731781,
+    "eval_per": 0.22600304723209752,
+    "eval_runtime": 30.1741,
+    "eval_samples": 383,
+    "eval_samples_per_second": 12.693,
+    "eval_steps_per_second": 1.591,
+    "eval_wer": 0.22981208735398678
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 44.0,
+    "total_flos": 3.1481023081144828e+19,
+    "train_loss": 1.0956278002107298,
+    "train_runtime": 26844.9073,
+    "train_samples": 2688,
+    "train_samples_per_second": 20.026,
+    "train_steps_per_second": 0.626
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,731 @@

+{
+  "best_metric": 0.3162442147731781,
+  "best_model_checkpoint": "wav2vec2-large-xlsr-coraa-texts-aug-exp-1/checkpoint-2016",
+  "epoch": 44.0,
+  "global_step": 3696,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.01,
+      "learning_rate": 3e-05,
+      "loss": 43.995,
+      "step": 1
+    },
+    {
+      "epoch": 1.0,
+      "eval_cer": 0.9670714731435703,
+      "eval_loss": 3.3726680278778076,
+      "eval_per": 1.0,
+      "eval_runtime": 29.95,
+      "eval_samples_per_second": 12.788,
+      "eval_steps_per_second": 1.603,
+      "eval_wer": 1.0,
+      "step": 84
+    },
+    {
+      "epoch": 1.19,
+      "learning_rate": 2.9826785714285713e-05,
+      "loss": 9.1824,
+      "step": 100
+    },
+    {
+      "epoch": 2.0,
+      "eval_cer": 0.9670714731435703,
+      "eval_loss": 2.992058753967285,
+      "eval_per": 1.0,
+      "eval_runtime": 30.0041,
+      "eval_samples_per_second": 12.765,
+      "eval_steps_per_second": 1.6,
+      "eval_wer": 1.0,
+      "step": 168
+    },
+    {
+      "epoch": 2.38,
+      "learning_rate": 2.9648214285714286e-05,
+      "loss": 3.1225,
+      "step": 200
+    },
+    {
+      "epoch": 3.0,
+      "eval_cer": 0.9670714731435703,
+      "eval_loss": 2.932141065597534,
+      "eval_per": 1.0,
+      "eval_runtime": 29.8416,
+      "eval_samples_per_second": 12.834,
+      "eval_steps_per_second": 1.608,
+      "eval_wer": 1.0,
+      "step": 252
+    },
+    {
+      "epoch": 3.57,
+      "learning_rate": 2.9469642857142856e-05,
+      "loss": 2.979,
+      "step": 300
+    },
+    {
+      "epoch": 4.0,
+      "eval_cer": 0.9670714731435703,
+      "eval_loss": 2.9393842220306396,
+      "eval_per": 1.0,
+      "eval_runtime": 29.8698,
+      "eval_samples_per_second": 12.822,
+      "eval_steps_per_second": 1.607,
+      "eval_wer": 1.0,
+      "step": 336
+    },
+    {
+      "epoch": 4.76,
+      "learning_rate": 2.929107142857143e-05,
+      "loss": 2.9357,
+      "step": 400
+    },
+    {
+      "epoch": 5.0,
+      "eval_cer": 0.9670714731435703,
+      "eval_loss": 2.911760091781616,
+      "eval_per": 1.0,
+      "eval_runtime": 29.9589,
+      "eval_samples_per_second": 12.784,
+      "eval_steps_per_second": 1.602,
+      "eval_wer": 1.0,
+      "step": 420
+    },
+    {
+      "epoch": 5.95,
+      "learning_rate": 2.9112500000000003e-05,
+      "loss": 2.9116,
+      "step": 500
+    },
+    {
+      "epoch": 6.0,
+      "eval_cer": 0.9670714731435703,
+      "eval_loss": 2.8400661945343018,
+      "eval_per": 1.0,
+      "eval_runtime": 29.8579,
+      "eval_samples_per_second": 12.827,
+      "eval_steps_per_second": 1.608,
+      "eval_wer": 1.0,
+      "step": 504
+    },
+    {
+      "epoch": 7.0,
+      "eval_cer": 0.7347957567321077,
+      "eval_loss": 2.0976722240448,
+      "eval_per": 1.0,
+      "eval_runtime": 29.9484,
+      "eval_samples_per_second": 12.789,
+      "eval_steps_per_second": 1.603,
+      "eval_wer": 1.0,
+      "step": 588
+    },
+    {
+      "epoch": 7.14,
+      "learning_rate": 2.893392857142857e-05,
+      "loss": 2.6841,
+      "step": 600
+    },
+    {
+      "epoch": 8.0,
+      "eval_cer": 0.20928334853357652,
+      "eval_loss": 0.8209644556045532,
+      "eval_per": 0.5335195530726257,
+      "eval_runtime": 30.0806,
+      "eval_samples_per_second": 12.732,
+      "eval_steps_per_second": 1.596,
+      "eval_wer": 0.5520568816658202,
+      "step": 672
+    },
+    {
+      "epoch": 8.33,
+      "learning_rate": 2.8755357142857143e-05,
+      "loss": 1.6358,
+      "step": 700
+    },
+    {
+      "epoch": 9.0,
+      "eval_cer": 0.16325061200979216,
+      "eval_loss": 0.5585940480232239,
+      "eval_per": 0.3080243778567801,
+      "eval_runtime": 30.0617,
+      "eval_samples_per_second": 12.74,
+      "eval_steps_per_second": 1.597,
+      "eval_wer": 0.3329101066531234,
+      "step": 756
+    },
+    {
+      "epoch": 9.52,
+      "learning_rate": 2.8576785714285716e-05,
+      "loss": 1.1226,
+      "step": 800
+    },
+    {
+      "epoch": 10.0,
+      "eval_cer": 0.1537464599433591,
+      "eval_loss": 0.48173972964286804,
+      "eval_per": 0.28339258506856274,
+      "eval_runtime": 30.0584,
+      "eval_samples_per_second": 12.742,
+      "eval_steps_per_second": 1.597,
+      "eval_wer": 0.29507364144235654,
+      "step": 840
+    },
+    {
+      "epoch": 10.71,
+      "learning_rate": 2.8398214285714286e-05,
+      "loss": 0.9403,
+      "step": 900
+    },
+    {
+      "epoch": 11.0,
+      "eval_cer": 0.14817837085393365,
+      "eval_loss": 0.4337259531021118,
+      "eval_per": 0.2643473844591163,
+      "eval_runtime": 30.0682,
+      "eval_samples_per_second": 12.738,
+      "eval_steps_per_second": 1.596,
+      "eval_wer": 0.2755205688166582,
+      "step": 924
+    },
+    {
+      "epoch": 11.9,
+      "learning_rate": 2.821964285714286e-05,
+      "loss": 0.8262,
+      "step": 1000
+    },
+    {
+      "epoch": 12.0,
+      "eval_cer": 0.1460183362933807,
+      "eval_loss": 0.40190622210502625,
+      "eval_per": 0.26130015236160486,
+      "eval_runtime": 30.0826,
+      "eval_samples_per_second": 12.732,
+      "eval_steps_per_second": 1.596,
+      "eval_wer": 0.27171152869476894,
+      "step": 1008
+    },
+    {
+      "epoch": 13.0,
+      "eval_cer": 0.14582633322133154,
+      "eval_loss": 0.3872309625148773,
+      "eval_per": 0.25901472828847133,
+      "eval_runtime": 30.1847,
+      "eval_samples_per_second": 12.689,
+      "eval_steps_per_second": 1.59,
+      "eval_wer": 0.2681564245810056,
+      "step": 1092
+    },
+    {
+      "epoch": 13.1,
+      "learning_rate": 2.804107142857143e-05,
+      "loss": 0.7654,
+      "step": 1100
+    },
+    {
+      "epoch": 14.0,
+      "eval_cer": 0.14136226179618874,
+      "eval_loss": 0.36644813418388367,
+      "eval_per": 0.24454037582529203,
+      "eval_runtime": 30.0619,
+      "eval_samples_per_second": 12.74,
+      "eval_steps_per_second": 1.597,
+      "eval_wer": 0.2531742001015744,
+      "step": 1176
+    },
+    {
+      "epoch": 14.29,
+      "learning_rate": 2.78625e-05,
+      "loss": 0.6788,
+      "step": 1200
+    },
+    {
+      "epoch": 15.0,
+      "eval_cer": 0.1390102241635866,
+      "eval_loss": 0.3475891649723053,
+      "eval_per": 0.2404773996952768,
+      "eval_runtime": 30.0631,
+      "eval_samples_per_second": 12.74,
+      "eval_steps_per_second": 1.597,
+      "eval_wer": 0.250126968004063,
+      "step": 1260
+    },
+    {
+      "epoch": 15.48,
+      "learning_rate": 2.7683928571428573e-05,
+      "loss": 0.647,
+      "step": 1300
+    },
+    {
+      "epoch": 16.0,
+      "eval_cer": 0.13881822109153746,
+      "eval_loss": 0.350846529006958,
+      "eval_per": 0.23641442356526154,
+      "eval_runtime": 30.6699,
+      "eval_samples_per_second": 12.488,
+      "eval_steps_per_second": 1.565,
+      "eval_wer": 0.2453021838496699,
+      "step": 1344
+    },
+    {
+      "epoch": 16.67,
+      "learning_rate": 2.7505357142857143e-05,
+      "loss": 0.6058,
+      "step": 1400
+    },
+    {
+      "epoch": 17.0,
+      "eval_cer": 0.13920222723563577,
+      "eval_loss": 0.3425397276878357,
+      "eval_per": 0.23489080751650585,
+      "eval_runtime": 30.0637,
+      "eval_samples_per_second": 12.74,
+      "eval_steps_per_second": 1.597,
+      "eval_wer": 0.244794311833418,
+      "step": 1428
+    },
+    {
+      "epoch": 17.86,
+      "learning_rate": 2.7326785714285716e-05,
+      "loss": 0.5853,
+      "step": 1500
+    },
+    {
+      "epoch": 18.0,
+      "eval_cer": 0.13512216195459129,
+      "eval_loss": 0.3393208980560303,
+      "eval_per": 0.2293042153377349,
+      "eval_runtime": 30.0796,
+      "eval_samples_per_second": 12.733,
+      "eval_steps_per_second": 1.596,
+      "eval_wer": 0.23768410360589132,
+      "step": 1512
+    },
+    {
+      "epoch": 19.0,
+      "eval_cer": 0.13473815581049298,
+      "eval_loss": 0.32763150334358215,
+      "eval_per": 0.22219400711020823,
+      "eval_runtime": 30.0565,
+      "eval_samples_per_second": 12.743,
+      "eval_steps_per_second": 1.597,
+      "eval_wer": 0.2293042153377349,
+      "step": 1596
+    },
+    {
+      "epoch": 19.05,
+      "learning_rate": 2.7148214285714286e-05,
+      "loss": 0.5356,
+      "step": 1600
+    },
+    {
+      "epoch": 20.0,
+      "eval_cer": 0.13401814429030864,
+      "eval_loss": 0.3274891674518585,
+      "eval_per": 0.22752666328085322,
+      "eval_runtime": 30.0773,
+      "eval_samples_per_second": 12.734,
+      "eval_steps_per_second": 1.596,
+      "eval_wer": 0.23158963941086846,
+      "step": 1680
+    },
+    {
+      "epoch": 20.24,
+      "learning_rate": 2.6969642857142856e-05,
+      "loss": 0.5323,
+      "step": 1700
+    },
+    {
+      "epoch": 21.0,
+      "eval_cer": 0.1341621465943455,
+      "eval_loss": 0.32451650500297546,
+      "eval_per": 0.22651091924834943,
+      "eval_runtime": 30.0925,
+      "eval_samples_per_second": 12.727,
+      "eval_steps_per_second": 1.595,
+      "eval_wer": 0.23006602336211274,
+      "step": 1764
+    },
+    {
+      "epoch": 21.43,
+      "learning_rate": 2.679107142857143e-05,
+      "loss": 0.501,
+      "step": 1800
+    },
+    {
+      "epoch": 22.0,
+      "eval_cer": 0.1333941343061489,
+      "eval_loss": 0.325840562582016,
+      "eval_per": 0.2196546470289487,
+      "eval_runtime": 30.6532,
+      "eval_samples_per_second": 12.495,
+      "eval_steps_per_second": 1.566,
+      "eval_wer": 0.22320975114271205,
+      "step": 1848
+    },
+    {
+      "epoch": 22.62,
+      "learning_rate": 2.66125e-05,
+      "loss": 0.4956,
+      "step": 1900
+    },
+    {
+      "epoch": 23.0,
+      "eval_cer": 0.13320213123409974,
+      "eval_loss": 0.3261657655239105,
+      "eval_per": 0.22016251904520062,
+      "eval_runtime": 29.9903,
+      "eval_samples_per_second": 12.771,
+      "eval_steps_per_second": 1.601,
+      "eval_wer": 0.22422549517521584,
+      "step": 1932
+    },
+    {
+      "epoch": 23.81,
+      "learning_rate": 2.6433928571428573e-05,
+      "loss": 0.4427,
+      "step": 2000
+    },
+    {
+      "epoch": 24.0,
+      "eval_cer": 0.13281812509000143,
+      "eval_loss": 0.3162442147731781,
+      "eval_per": 0.22600304723209752,
+      "eval_runtime": 30.0934,
+      "eval_samples_per_second": 12.727,
+      "eval_steps_per_second": 1.595,
+      "eval_wer": 0.22981208735398678,
+      "step": 2016
+    },
+    {
+      "epoch": 25.0,
+      "learning_rate": 2.6255357142857146e-05,
+      "loss": 0.4443,
+      "step": 2100
+    },
+    {
+      "epoch": 25.0,
+      "eval_cer": 0.13310612969807517,
+      "eval_loss": 0.32252442836761475,
+      "eval_per": 0.22524123920771966,
+      "eval_runtime": 30.0405,
+      "eval_samples_per_second": 12.749,
+      "eval_steps_per_second": 1.598,
+      "eval_wer": 0.22854240731335704,
+      "step": 2100
+    },
+    {
+      "epoch": 26.0,
+      "eval_cer": 0.1333461335381366,
+      "eval_loss": 0.3246039152145386,
+      "eval_per": 0.22270187912646014,
+      "eval_runtime": 30.1326,
+      "eval_samples_per_second": 12.71,
+      "eval_steps_per_second": 1.593,
+      "eval_wer": 0.2270187912646013,
+      "step": 2184
+    },
+    {
+      "epoch": 26.19,
+      "learning_rate": 2.6076785714285713e-05,
+      "loss": 0.4234,
+      "step": 2200
+    },
+    {
+      "epoch": 27.0,
+      "eval_cer": 0.13272212355397686,
+      "eval_loss": 0.31707704067230225,
+      "eval_per": 0.22143219908583037,
+      "eval_runtime": 30.1196,
+      "eval_samples_per_second": 12.716,
+      "eval_steps_per_second": 1.594,
+      "eval_wer": 0.2249873031995937,
+      "step": 2268
+    },
+    {
+      "epoch": 27.38,
+      "learning_rate": 2.5898214285714286e-05,
+      "loss": 0.4245,
+      "step": 2300
+    },
+    {
+      "epoch": 28.0,
+      "eval_cer": 0.13440215043440695,
+      "eval_loss": 0.3180580735206604,
+      "eval_per": 0.2229558151345861,
+      "eval_runtime": 30.0474,
+      "eval_samples_per_second": 12.747,
+      "eval_steps_per_second": 1.597,
+      "eval_wer": 0.22651091924834943,
+      "step": 2352
+    },
+    {
+      "epoch": 28.57,
+      "learning_rate": 2.5719642857142856e-05,
+      "loss": 0.3993,
+      "step": 2400
+    },
+    {
+      "epoch": 29.0,
+      "eval_cer": 0.13310612969807517,
+      "eval_loss": 0.3283059597015381,
+      "eval_per": 0.22168613509395632,
+      "eval_runtime": 30.0868,
+      "eval_samples_per_second": 12.73,
+      "eval_steps_per_second": 1.595,
+      "eval_wer": 0.2249873031995937,
+      "step": 2436
+    },
+    {
+      "epoch": 29.76,
+      "learning_rate": 2.554107142857143e-05,
+      "loss": 0.3769,
+      "step": 2500
+    },
+    {
+      "epoch": 30.0,
+      "eval_cer": 0.13589017424278788,
+      "eval_loss": 0.32919740676879883,
+      "eval_per": 0.23235144743524633,
+      "eval_runtime": 30.1605,
+      "eval_samples_per_second": 12.699,
+      "eval_steps_per_second": 1.591,
+      "eval_wer": 0.23539867953275775,
+      "step": 2520
+    },
+    {
+      "epoch": 30.95,
+      "learning_rate": 2.5362500000000003e-05,
+      "loss": 0.3925,
+      "step": 2600
+    },
+    {
+      "epoch": 31.0,
+      "eval_cer": 0.13598617577881247,
+      "eval_loss": 0.3275951147079468,
+      "eval_per": 0.2313357034027425,
+      "eval_runtime": 30.0874,
+      "eval_samples_per_second": 12.73,
+      "eval_steps_per_second": 1.595,
+      "eval_wer": 0.23438293550025394,
+      "step": 2604
+    },
+    {
+      "epoch": 32.0,
+      "eval_cer": 0.13449815197043152,
+      "eval_loss": 0.335648775100708,
+      "eval_per": 0.22752666328085322,
+      "eval_runtime": 30.0908,
+      "eval_samples_per_second": 12.728,
+      "eval_steps_per_second": 1.595,
+      "eval_wer": 0.23006602336211274,
+      "step": 2688
+    },
+    {
+      "epoch": 32.14,
+      "learning_rate": 2.518392857142857e-05,
+      "loss": 0.3724,
+      "step": 2700
+    },
+    {
+      "epoch": 33.0,
+      "eval_cer": 0.13565017040272645,
+      "eval_loss": 0.3362816274166107,
+      "eval_per": 0.2244794311833418,
+      "eval_runtime": 30.0472,
+      "eval_samples_per_second": 12.747,
+      "eval_steps_per_second": 1.597,
+      "eval_wer": 0.22727272727272727,
+      "step": 2772
+    },
+    {
+      "epoch": 33.33,
+      "learning_rate": 2.5005357142857143e-05,
+      "loss": 0.3614,
+      "step": 2800
+    },
+    {
+      "epoch": 34.0,
+      "eval_cer": 0.1358421734747756,
+      "eval_loss": 0.330671101808548,
+      "eval_per": 0.22803453529710513,
+      "eval_runtime": 29.9742,
+      "eval_samples_per_second": 12.778,
+      "eval_steps_per_second": 1.601,
+      "eval_wer": 0.23108176739461656,
+      "step": 2856
+    },
+    {
+      "epoch": 34.52,
+      "learning_rate": 2.4826785714285713e-05,
+      "loss": 0.3705,
+      "step": 2900
+    },
+    {
+      "epoch": 35.0,
+      "eval_cer": 0.13560216963471416,
+      "eval_loss": 0.32763954997062683,
+      "eval_per": 0.22854240731335704,
+      "eval_runtime": 29.995,
+      "eval_samples_per_second": 12.769,
+      "eval_steps_per_second": 1.6,
+      "eval_wer": 0.23158963941086846,
+      "step": 2940
+    },
+    {
+      "epoch": 35.71,
+      "learning_rate": 2.4648214285714287e-05,
+      "loss": 0.3376,
+      "step": 3000
+    },
+    {
+      "epoch": 36.0,
+      "eval_cer": 0.13728219651514426,
+      "eval_loss": 0.3309231102466583,
+      "eval_per": 0.23362112747587607,
+      "eval_runtime": 30.0273,
+      "eval_samples_per_second": 12.755,
+      "eval_steps_per_second": 1.599,
+      "eval_wer": 0.23793803961401727,
+      "step": 3024
+    },
+    {
+      "epoch": 36.9,
+      "learning_rate": 2.446964285714286e-05,
+      "loss": 0.3434,
+      "step": 3100
+    },
+    {
+      "epoch": 37.0,
+      "eval_cer": 0.13670618729899678,
+      "eval_loss": 0.33398517966270447,
+      "eval_per": 0.2254951752158456,
+      "eval_runtime": 30.1096,
+      "eval_samples_per_second": 12.72,
+      "eval_steps_per_second": 1.594,
+      "eval_wer": 0.22905027932960895,
+      "step": 3108
+    },
+    {
+      "epoch": 38.0,
+      "eval_cer": 0.13694619113905823,
+      "eval_loss": 0.34280771017074585,
+      "eval_per": 0.2293042153377349,
+      "eval_runtime": 30.1204,
+      "eval_samples_per_second": 12.716,
+      "eval_steps_per_second": 1.594,
+      "eval_wer": 0.23260538344337228,
+      "step": 3192
+    },
+    {
+      "epoch": 38.1,
+      "learning_rate": 2.429107142857143e-05,
+      "loss": 0.3245,
+      "step": 3200
+    },
+    {
+      "epoch": 39.0,
+      "eval_cer": 0.13397014352229636,
+      "eval_loss": 0.3409918546676636,
+      "eval_per": 0.22270187912646014,
+      "eval_runtime": 30.0402,
+      "eval_samples_per_second": 12.75,
+      "eval_steps_per_second": 1.598,
+      "eval_wer": 0.22600304723209752,
+      "step": 3276
+    },
+    {
+      "epoch": 39.29,
+      "learning_rate": 2.41125e-05,
+      "loss": 0.3087,
+      "step": 3300
+    },
+    {
+      "epoch": 40.0,
+      "eval_cer": 0.13478615657850526,
+      "eval_loss": 0.35161110758781433,
+      "eval_per": 0.22574911122397157,
+      "eval_runtime": 30.0824,
+      "eval_samples_per_second": 12.732,
+      "eval_steps_per_second": 1.596,
+      "eval_wer": 0.22854240731335704,
+      "step": 3360
+    },
+    {
+      "epoch": 40.48,
+      "learning_rate": 2.393392857142857e-05,
+      "loss": 0.3025,
+      "step": 3400
+    },
+    {
+      "epoch": 41.0,
+      "eval_cer": 0.13473815581049298,
+      "eval_loss": 0.33956247568130493,
+      "eval_per": 0.22371762315896393,
+      "eval_runtime": 30.036,
+      "eval_samples_per_second": 12.751,
+      "eval_steps_per_second": 1.598,
+      "eval_wer": 0.22676485525647536,
+      "step": 3444
+    },
+    {
+      "epoch": 41.67,
+      "learning_rate": 2.3755357142857143e-05,
+      "loss": 0.2953,
+      "step": 3500
+    },
+    {
+      "epoch": 42.0,
+      "eval_cer": 0.1345941535064561,
+      "eval_loss": 0.3443167209625244,
+      "eval_per": 0.22219400711020823,
+      "eval_runtime": 30.1578,
+      "eval_samples_per_second": 12.7,
+      "eval_steps_per_second": 1.592,
+      "eval_wer": 0.2254951752158456,
+      "step": 3528
+    },
+    {
+      "epoch": 42.86,
+      "learning_rate": 2.3576785714285717e-05,
+      "loss": 0.2778,
+      "step": 3600
+    },
+    {
+      "epoch": 43.0,
+      "eval_cer": 0.13507416118657897,
+      "eval_loss": 0.34061482548713684,
+      "eval_per": 0.2229558151345861,
+      "eval_runtime": 30.0853,
+      "eval_samples_per_second": 12.73,
+      "eval_steps_per_second": 1.595,
+      "eval_wer": 0.2254951752158456,
+      "step": 3612
+    },
+    {
+      "epoch": 44.0,
+      "eval_cer": 0.13670618729899678,
+      "eval_loss": 0.3456892967224121,
+      "eval_per": 0.2308278313864906,
+      "eval_runtime": 30.1071,
+      "eval_samples_per_second": 12.721,
+      "eval_steps_per_second": 1.594,
+      "eval_wer": 0.2346368715083799,
+      "step": 3696
+    },
+    {
+      "epoch": 44.0,
+      "step": 3696,
+      "total_flos": 3.1481023081144828e+19,
+      "train_loss": 1.0956278002107298,
+      "train_runtime": 26844.9073,
+      "train_samples_per_second": 20.026,
+      "train_steps_per_second": 0.626
+    }
+  ],
+  "max_steps": 16800,
+  "num_train_epochs": 200,
+  "total_flos": 3.1481023081144828e+19,
+  "trial_name": null,
+  "trial_params": null
+}