{
  "best_global_step": 286140,
  "best_metric": 0.1884266993162269,
  "best_model_checkpoint": "wav2vec2-asr-africa-base-fintuned-luganda-400hrs-v0.1/checkpoint-286140",
  "epoch": 99.0,
  "eval_steps": 500,
  "global_step": 298188,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 1.0,
      "grad_norm": 7.066422462463379,
      "learning_rate": 6.98140770252324e-05,
      "loss": 3.2575,
      "step": 3012
    },
    {
      "epoch": 1.0,
      "eval_cer": 0.10930492502565166,
      "eval_loss": 0.37255266308784485,
      "eval_runtime": 151.5408,
      "eval_samples_per_second": 239.869,
      "eval_steps_per_second": 7.496,
      "eval_wer": 0.534090083733671,
      "step": 3012
    },
    {
      "epoch": 2.0,
      "grad_norm": 15.221166610717773,
      "learning_rate": 6.929480730277542e-05,
      "loss": 0.8396,
      "step": 6024
    },
    {
      "epoch": 2.0,
      "eval_cer": 0.07810481279107405,
      "eval_loss": 0.2538328468799591,
      "eval_runtime": 152.0166,
      "eval_samples_per_second": 239.119,
      "eval_steps_per_second": 7.473,
      "eval_wer": 0.3983557626127949,
      "step": 6024
    },
    {
      "epoch": 3.0,
      "grad_norm": 7.060754299163818,
      "learning_rate": 6.858773659570472e-05,
      "loss": 0.7487,
      "step": 9036
    },
    {
      "epoch": 3.0,
      "eval_cer": 0.0682448584368034,
      "eval_loss": 0.22769133746623993,
      "eval_runtime": 153.0969,
      "eval_samples_per_second": 237.431,
      "eval_steps_per_second": 7.42,
      "eval_wer": 0.35308562554689743,
      "step": 9036
    },
    {
      "epoch": 4.0,
      "grad_norm": 9.472733497619629,
      "learning_rate": 6.788090063986478e-05,
      "loss": 0.7226,
      "step": 12048
    },
    {
      "epoch": 4.0,
      "eval_cer": 0.06425062788093966,
      "eval_loss": 0.21326717734336853,
      "eval_runtime": 171.3308,
      "eval_samples_per_second": 212.163,
      "eval_steps_per_second": 6.63,
      "eval_wer": 0.33642189872410777,
      "step": 12048
    },
    {
      "epoch": 5.0,
      "grad_norm": 23.48148536682129,
      "learning_rate": 6.717429943525561e-05,
      "loss": 0.7096,
      "step": 15060
    },
    {
      "epoch": 5.0,
      "eval_cer": 0.06122744648913919,
      "eval_loss": 0.20842401683330536,
      "eval_runtime": 174.4012,
      "eval_samples_per_second": 208.427,
      "eval_steps_per_second": 6.514,
      "eval_wer": 0.3211001241651708,
      "step": 15060
    },
    {
      "epoch": 6.0,
      "grad_norm": 7.9525041580200195,
      "learning_rate": 6.646746347941567e-05,
      "loss": 0.6979,
      "step": 18072
    },
    {
      "epoch": 6.0,
      "eval_cer": 0.06395399482657282,
      "eval_loss": 0.20914477109909058,
      "eval_runtime": 153.4786,
      "eval_samples_per_second": 236.841,
      "eval_steps_per_second": 7.402,
      "eval_wer": 0.3287402596055075,
      "step": 18072
    },
    {
      "epoch": 7.0,
      "grad_norm": 43.115169525146484,
      "learning_rate": 6.57608622748065e-05,
      "loss": 0.6899,
      "step": 21084
    },
    {
      "epoch": 7.0,
      "eval_cer": 0.06076026089037598,
      "eval_loss": 0.20185638964176178,
      "eval_runtime": 173.3256,
      "eval_samples_per_second": 209.721,
      "eval_steps_per_second": 6.554,
      "eval_wer": 0.31623727652863237,
      "step": 21084
    },
    {
      "epoch": 8.0,
      "grad_norm": 4.6848602294921875,
      "learning_rate": 6.505426107019733e-05,
      "loss": 0.6765,
      "step": 24096
    },
    {
      "epoch": 8.0,
      "eval_cer": 0.060137193933831115,
      "eval_loss": 0.19728189706802368,
      "eval_runtime": 154.1162,
      "eval_samples_per_second": 235.861,
      "eval_steps_per_second": 7.371,
      "eval_wer": 0.31059969356450884,
      "step": 24096
    },
    {
      "epoch": 9.0,
      "grad_norm": 5.830124378204346,
      "learning_rate": 6.434719036312661e-05,
      "loss": 0.6701,
      "step": 27108
    },
    {
      "epoch": 9.0,
      "eval_cer": 0.05820976679231927,
      "eval_loss": 0.19281432032585144,
      "eval_runtime": 156.5256,
      "eval_samples_per_second": 232.23,
      "eval_steps_per_second": 7.258,
      "eval_wer": 0.30471654717065966,
      "step": 27108
    },
    {
      "epoch": 10.0,
      "grad_norm": Infinity,
      "learning_rate": 6.364058915851744e-05,
      "loss": 0.6621,
      "step": 30120
    },
    {
      "epoch": 10.0,
      "eval_cer": 0.058245986284274416,
      "eval_loss": 0.19237777590751648,
      "eval_runtime": 155.0055,
      "eval_samples_per_second": 234.508,
      "eval_steps_per_second": 7.329,
      "eval_wer": 0.3038691804061135,
      "step": 30120
    },
    {
      "epoch": 11.0,
      "grad_norm": 5.588762283325195,
      "learning_rate": 6.29337532026775e-05,
      "loss": 0.6554,
      "step": 33132
    },
    {
      "epoch": 11.0,
      "eval_cer": 0.05662298626501848,
      "eval_loss": 0.18665704131126404,
      "eval_runtime": 153.969,
      "eval_samples_per_second": 236.087,
      "eval_steps_per_second": 7.378,
      "eval_wer": 0.2982627252006876,
      "step": 33132
    },
    {
      "epoch": 12.0,
      "grad_norm": 5.955714702606201,
      "learning_rate": 6.222691724683756e-05,
      "loss": 0.6475,
      "step": 36144
    },
    {
      "epoch": 12.0,
      "eval_cer": 0.05515495065438077,
      "eval_loss": 0.1829417496919632,
      "eval_runtime": 155.1287,
      "eval_samples_per_second": 234.322,
      "eval_steps_per_second": 7.323,
      "eval_wer": 0.2873610923768119,
      "step": 36144
    },
    {
      "epoch": 13.0,
      "grad_norm": 31.985713958740234,
      "learning_rate": 6.152008129099762e-05,
      "loss": 0.6429,
      "step": 39156
    },
    {
      "epoch": 13.0,
      "eval_cer": 0.05419032013446143,
      "eval_loss": 0.1801947057247162,
      "eval_runtime": 168.8898,
      "eval_samples_per_second": 215.229,
      "eval_steps_per_second": 6.726,
      "eval_wer": 0.28527553254407173,
      "step": 39156
    },
    {
      "epoch": 14.0,
      "grad_norm": 6.557770252227783,
      "learning_rate": 6.081324533515768e-05,
      "loss": 0.6351,
      "step": 42168
    },
    {
      "epoch": 14.0,
      "eval_cer": 0.055327337097104,
      "eval_loss": 0.18261073529720306,
      "eval_runtime": 159.2183,
      "eval_samples_per_second": 228.303,
      "eval_steps_per_second": 7.135,
      "eval_wer": 0.2872746263804296,
      "step": 42168
    },
    {
      "epoch": 15.0,
      "grad_norm": 8.820505142211914,
      "learning_rate": 6.010640937931774e-05,
      "loss": 0.6319,
      "step": 45180
    },
    {
      "epoch": 15.0,
      "eval_cer": 0.05439250742499585,
      "eval_loss": 0.17926117777824402,
      "eval_runtime": 152.0308,
      "eval_samples_per_second": 239.096,
      "eval_steps_per_second": 7.472,
      "eval_wer": 0.28315884495263394,
      "step": 45180
    },
    {
      "epoch": 16.0,
      "grad_norm": 8.058792114257812,
      "learning_rate": 5.93995734234778e-05,
      "loss": 0.6251,
      "step": 48192
    },
    {
      "epoch": 16.0,
      "eval_cer": 0.054798715904391546,
      "eval_loss": 0.1785019189119339,
      "eval_runtime": 154.575,
      "eval_samples_per_second": 235.161,
      "eval_steps_per_second": 7.349,
      "eval_wer": 0.283826362444705,
      "step": 48192
    },
    {
      "epoch": 17.0,
      "grad_norm": 7.038857936859131,
      "learning_rate": 5.86925027164071e-05,
      "loss": 0.6172,
      "step": 51204
    },
    {
      "epoch": 17.0,
      "eval_cer": 0.051710431121988164,
      "eval_loss": 0.17091116309165955,
      "eval_runtime": 154.6152,
      "eval_samples_per_second": 235.1,
      "eval_steps_per_second": 7.347,
      "eval_wer": 0.27192518270265037,
      "step": 51204
    },
    {
      "epoch": 18.0,
      "grad_norm": NaN,
      "learning_rate": 5.7985901511797926e-05,
      "loss": 0.6122,
      "step": 54216
    },
    {
      "epoch": 18.0,
      "eval_cer": 0.05208454638066411,
      "eval_loss": 0.1720370054244995,
      "eval_runtime": 154.3969,
      "eval_samples_per_second": 235.432,
      "eval_steps_per_second": 7.358,
      "eval_wer": 0.27160698783596365,
      "step": 54216
    },
    {
      "epoch": 19.0,
      "grad_norm": 4.123114109039307,
      "learning_rate": 5.727930030718875e-05,
      "loss": 0.6068,
      "step": 57228
    },
    {
      "epoch": 19.0,
      "eval_cer": 0.0505266497520111,
      "eval_loss": 0.16939722001552582,
      "eval_runtime": 154.2835,
      "eval_samples_per_second": 235.605,
      "eval_steps_per_second": 7.363,
      "eval_wer": 0.26646744901100194,
      "step": 57228
    },
    {
      "epoch": 20.0,
      "grad_norm": 11.014168739318848,
      "learning_rate": 5.657222960011804e-05,
      "loss": 0.6035,
      "step": 60240
    },
    {
      "epoch": 20.0,
      "eval_cer": 0.049698644657441546,
      "eval_loss": 0.1669510304927826,
      "eval_runtime": 155.9471,
      "eval_samples_per_second": 233.092,
      "eval_steps_per_second": 7.285,
      "eval_wer": 0.26278053892526226,
      "step": 60240
    },
    {
      "epoch": 21.0,
      "grad_norm": 7.567544937133789,
      "learning_rate": 5.5865158893047335e-05,
      "loss": 0.5957,
      "step": 63252
    },
    {
      "epoch": 21.0,
      "eval_cer": 0.050415698903237105,
      "eval_loss": 0.1704263538122177,
      "eval_runtime": 155.0829,
      "eval_samples_per_second": 234.391,
      "eval_steps_per_second": 7.325,
      "eval_wer": 0.2643818891782618,
      "step": 63252
    },
    {
      "epoch": 22.0,
      "grad_norm": 3.353114366531372,
      "learning_rate": 5.5158557688438164e-05,
      "loss": 0.5909,
      "step": 66264
    },
    {
      "epoch": 22.0,
      "eval_cer": 0.049318569229203364,
      "eval_loss": 0.16528591513633728,
      "eval_runtime": 155.149,
      "eval_samples_per_second": 234.291,
      "eval_steps_per_second": 7.322,
      "eval_wer": 0.25990640920551583,
      "step": 66264
    },
    {
      "epoch": 23.0,
      "grad_norm": 5.273142337799072,
      "learning_rate": 5.445172173259822e-05,
      "loss": 0.5879,
      "step": 69276
    },
    {
      "epoch": 23.0,
      "eval_cer": 0.048735389561267335,
      "eval_loss": 0.16745983064174652,
      "eval_runtime": 155.8132,
      "eval_samples_per_second": 233.292,
      "eval_steps_per_second": 7.291,
      "eval_wer": 0.2573400984328903,
      "step": 69276
    },
    {
      "epoch": 24.0,
      "grad_norm": 12.098519325256348,
      "learning_rate": 5.374512052798905e-05,
      "loss": 0.5966,
      "step": 72288
    },
    {
      "epoch": 24.0,
      "eval_cer": 0.05103463958854657,
      "eval_loss": 0.19431033730506897,
      "eval_runtime": 154.0761,
      "eval_samples_per_second": 235.922,
      "eval_steps_per_second": 7.373,
      "eval_wer": 0.2738551037419025,
      "step": 72288
    },
    {
      "epoch": 25.0,
      "grad_norm": 12.023294448852539,
      "learning_rate": 5.3038519323379875e-05,
      "loss": 0.6444,
      "step": 75300
    },
    {
      "epoch": 25.0,
      "eval_cer": 0.05154996501838942,
      "eval_loss": 0.1868334412574768,
      "eval_runtime": 152.5369,
      "eval_samples_per_second": 238.303,
      "eval_steps_per_second": 7.447,
      "eval_wer": 0.27229871580702175,
      "step": 75300
    },
    {
      "epoch": 26.0,
      "grad_norm": 9.066435813903809,
      "learning_rate": 5.2331448616309165e-05,
      "loss": 0.5999,
      "step": 78312
    },
    {
      "epoch": 26.0,
      "eval_cer": 0.04910904634536157,
      "eval_loss": 0.16771361231803894,
      "eval_runtime": 154.4851,
      "eval_samples_per_second": 235.298,
      "eval_steps_per_second": 7.353,
      "eval_wer": 0.25782430801263095,
      "step": 78312
    },
    {
      "epoch": 27.0,
      "grad_norm": 9.274683952331543,
      "learning_rate": 5.1624847411699994e-05,
      "loss": 0.5911,
      "step": 81324
    },
    {
      "epoch": 27.0,
      "eval_cer": 0.04738747429103783,
      "eval_loss": 0.16794191300868988,
      "eval_runtime": 154.6471,
      "eval_samples_per_second": 235.051,
      "eval_steps_per_second": 7.346,
      "eval_wer": 0.25102462205712983,
      "step": 81324
    },
    {
      "epoch": 28.0,
      "grad_norm": 5.650504112243652,
      "learning_rate": 5.091777670462929e-05,
      "loss": 0.586,
      "step": 84336
    },
    {
      "epoch": 28.0,
      "eval_cer": 0.04840666328618075,
      "eval_loss": 0.1722731739282608,
      "eval_runtime": 153.0438,
      "eval_samples_per_second": 237.514,
      "eval_steps_per_second": 7.423,
      "eval_wer": 0.25386416537832335,
      "step": 84336
    },
    {
      "epoch": 29.0,
      "grad_norm": 18.539613723754883,
      "learning_rate": 5.021070599755859e-05,
      "loss": 0.5816,
      "step": 87348
    },
    {
      "epoch": 29.0,
      "eval_cer": 0.04769969548118283,
      "eval_loss": 0.16775010526180267,
      "eval_runtime": 156.0962,
      "eval_samples_per_second": 232.869,
      "eval_steps_per_second": 7.278,
      "eval_wer": 0.25264326550940575,
      "step": 87348
    },
    {
      "epoch": 30.0,
      "grad_norm": 4.343358039855957,
      "learning_rate": 4.950457429541094e-05,
      "loss": 0.5886,
      "step": 90360
    },
    {
      "epoch": 30.0,
      "eval_cer": 0.04993246669411401,
      "eval_loss": 0.18236766755580902,
      "eval_runtime": 151.7294,
      "eval_samples_per_second": 239.571,
      "eval_steps_per_second": 7.487,
      "eval_wer": 0.2629396363586056,
      "step": 90360
    },
    {
      "epoch": 31.0,
      "grad_norm": 13.675621032714844,
      "learning_rate": 4.879773833957101e-05,
      "loss": 0.5978,
      "step": 93372
    },
    {
      "epoch": 31.0,
      "eval_cer": 0.04701886072734242,
      "eval_loss": 0.16201142966747284,
      "eval_runtime": 152.4808,
      "eval_samples_per_second": 238.391,
      "eval_steps_per_second": 7.45,
      "eval_wer": 0.24908778373816712,
      "step": 93372
    },
    {
      "epoch": 32.0,
      "grad_norm": 5.842775821685791,
      "learning_rate": 4.809066763250029e-05,
      "loss": 0.5722,
      "step": 96384
    },
    {
      "epoch": 32.0,
      "eval_cer": 0.04652920987407537,
      "eval_loss": 0.15837915241718292,
      "eval_runtime": 153.9577,
      "eval_samples_per_second": 236.104,
      "eval_steps_per_second": 7.379,
      "eval_wer": 0.24719590773732322,
      "step": 96384
    },
    {
      "epoch": 33.0,
      "grad_norm": 12.179231643676758,
      "learning_rate": 4.738359692542959e-05,
      "loss": 0.5615,
      "step": 99396
    },
    {
      "epoch": 33.0,
      "eval_cer": 0.046122542920097966,
      "eval_loss": 0.15639054775238037,
      "eval_runtime": 165.4748,
      "eval_samples_per_second": 219.671,
      "eval_steps_per_second": 6.865,
      "eval_wer": 0.2421047898703356,
      "step": 99396
    },
    {
      "epoch": 34.0,
      "grad_norm": 11.811565399169922,
      "learning_rate": 4.6676760969589654e-05,
      "loss": 0.5566,
      "step": 102408
    },
    {
      "epoch": 34.0,
      "eval_cer": 0.04475858103950859,
      "eval_loss": 0.15303878486156464,
      "eval_runtime": 151.973,
      "eval_samples_per_second": 239.187,
      "eval_steps_per_second": 7.475,
      "eval_wer": 0.23680615361203053,
      "step": 102408
    },
    {
      "epoch": 35.0,
      "grad_norm": 27.314680099487305,
      "learning_rate": 4.5970394516211246e-05,
      "loss": 0.5514,
      "step": 105420
    },
    {
      "epoch": 35.0,
      "eval_cer": 0.04322590051284967,
      "eval_loss": 0.14988180994987488,
      "eval_runtime": 152.0916,
      "eval_samples_per_second": 239.001,
      "eval_steps_per_second": 7.469,
      "eval_wer": 0.2308780449000626,
      "step": 105420
    },
    {
      "epoch": 36.0,
      "grad_norm": 6.874896049499512,
      "learning_rate": 4.526332380914054e-05,
      "loss": 0.5485,
      "step": 108432
    },
    {
      "epoch": 36.0,
      "eval_cer": 0.043550500516700855,
      "eval_loss": 0.15108104050159454,
      "eval_runtime": 156.7097,
      "eval_samples_per_second": 231.958,
      "eval_steps_per_second": 7.249,
      "eval_wer": 0.23083308258194382,
      "step": 108432
    },
    {
      "epoch": 37.0,
      "grad_norm": 18.988279342651367,
      "learning_rate": 4.4556722604531365e-05,
      "loss": 0.5451,
      "step": 111444
    },
    {
      "epoch": 37.0,
      "eval_cer": 0.04385080136772137,
      "eval_loss": 0.15071320533752441,
      "eval_runtime": 172.1252,
      "eval_samples_per_second": 211.183,
      "eval_steps_per_second": 6.6,
      "eval_wer": 0.23185338133925454,
      "step": 111444
    },
    {
      "epoch": 38.0,
      "grad_norm": 28.172042846679688,
      "learning_rate": 4.384988664869143e-05,
      "loss": 0.5433,
      "step": 114456
    },
    {
      "epoch": 38.0,
      "eval_cer": 0.0433771971248142,
      "eval_loss": 0.14824804663658142,
      "eval_runtime": 152.6042,
      "eval_samples_per_second": 238.198,
      "eval_steps_per_second": 7.444,
      "eval_wer": 0.23122390888559166,
      "step": 114456
    },
    {
      "epoch": 39.0,
      "grad_norm": 4.653916835784912,
      "learning_rate": 4.3143050692851484e-05,
      "loss": 0.5391,
      "step": 117468
    },
    {
      "epoch": 39.0,
      "eval_cer": 0.04353903865215809,
      "eval_loss": 0.14684619009494781,
      "eval_runtime": 156.6046,
      "eval_samples_per_second": 232.113,
      "eval_steps_per_second": 7.254,
      "eval_wer": 0.22910722129415387,
      "step": 117468
    },
    {
      "epoch": 40.0,
      "grad_norm": 5.8400702476501465,
      "learning_rate": 4.243621473701154e-05,
      "loss": 0.5347,
      "step": 120480
    },
    {
      "epoch": 40.0,
      "eval_cer": 0.042970530170836796,
      "eval_loss": 0.1462726891040802,
      "eval_runtime": 178.4468,
      "eval_samples_per_second": 203.702,
      "eval_steps_per_second": 6.366,
      "eval_wer": 0.22744707416361443,
      "step": 120480
    },
    {
      "epoch": 41.0,
      "grad_norm": 16.060422897338867,
      "learning_rate": 4.172914402994084e-05,
      "loss": 0.5313,
      "step": 123492
    },
    {
      "epoch": 41.0,
      "eval_cer": 0.04216269795786252,
      "eval_loss": 0.14503081142902374,
      "eval_runtime": 152.5692,
      "eval_samples_per_second": 238.253,
      "eval_steps_per_second": 7.446,
      "eval_wer": 0.22400226886774507,
      "step": 123492
    },
    {
      "epoch": 42.0,
      "grad_norm": 8.755998611450195,
      "learning_rate": 4.102254282533167e-05,
      "loss": 0.5291,
      "step": 126504
    },
    {
      "epoch": 42.0,
      "eval_cer": 0.04194263015864137,
      "eval_loss": 0.1446152627468109,
      "eval_runtime": 152.4116,
      "eval_samples_per_second": 238.499,
      "eval_steps_per_second": 7.454,
      "eval_wer": 0.224061065745285,
      "step": 126504
    },
    {
      "epoch": 43.0,
      "grad_norm": 9.50841999053955,
      "learning_rate": 4.031570686949173e-05,
      "loss": 0.5269,
      "step": 129516
    },
    {
      "epoch": 43.0,
      "eval_cer": 0.04270048864220919,
      "eval_loss": 0.14530107378959656,
      "eval_runtime": 153.731,
      "eval_samples_per_second": 236.452,
      "eval_steps_per_second": 7.39,
      "eval_wer": 0.22547219080624353,
      "step": 129516
    },
    {
      "epoch": 44.0,
      "grad_norm": 28.027828216552734,
      "learning_rate": 3.960887091365178e-05,
      "loss": 0.5253,
      "step": 132528
    },
    {
      "epoch": 44.0,
      "eval_cer": 0.042549192030244654,
      "eval_loss": 0.14459766447544098,
      "eval_runtime": 179.3972,
      "eval_samples_per_second": 202.623,
      "eval_steps_per_second": 6.332,
      "eval_wer": 0.22531309337290018,
      "step": 132528
    },
    {
      "epoch": 45.0,
      "grad_norm": 9.71485710144043,
      "learning_rate": 3.890226970904261e-05,
      "loss": 0.523,
      "step": 135540
    },
    {
      "epoch": 45.0,
      "eval_cer": 0.041189356420890666,
      "eval_loss": 0.1429988592863083,
      "eval_runtime": 151.6718,
      "eval_samples_per_second": 239.662,
      "eval_steps_per_second": 7.49,
      "eval_wer": 0.22018738910735963,
      "step": 135540
    },
    {
      "epoch": 46.0,
      "grad_norm": 13.113300323486328,
      "learning_rate": 3.819519900197191e-05,
      "loss": 0.5192,
      "step": 138552
    },
    {
      "epoch": 46.0,
      "eval_cer": 0.040866590315366325,
      "eval_loss": 0.14137160778045654,
      "eval_runtime": 152.9576,
      "eval_samples_per_second": 237.648,
      "eval_steps_per_second": 7.427,
      "eval_wer": 0.21718528971296747,
      "step": 138552
    },
    {
      "epoch": 47.0,
      "grad_norm": 15.17225456237793,
      "learning_rate": 3.7488597797362736e-05,
      "loss": 0.518,
      "step": 141564
    },
    {
      "epoch": 47.0,
      "eval_cer": 0.040502561497488015,
      "eval_loss": 0.14037571847438812,
      "eval_runtime": 151.9659,
      "eval_samples_per_second": 239.198,
      "eval_steps_per_second": 7.475,
      "eval_wer": 0.21598168304332638,
      "step": 141564
    },
    {
      "epoch": 48.0,
      "grad_norm": 5.159524917602539,
      "learning_rate": 3.678152709029203e-05,
      "loss": 0.5139,
      "step": 144576
    },
    {
      "epoch": 48.0,
      "eval_cer": 0.04006930301777139,
      "eval_loss": 0.13999390602111816,
      "eval_runtime": 161.9319,
      "eval_samples_per_second": 224.477,
      "eval_steps_per_second": 7.015,
      "eval_wer": 0.2143319118323528,
      "step": 144576
    },
    {
      "epoch": 49.0,
      "grad_norm": 5.24137020111084,
      "learning_rate": 3.6074925885682855e-05,
      "loss": 0.5133,
      "step": 147588
    },
    {
      "epoch": 49.0,
      "eval_cer": 0.04118523014965527,
      "eval_loss": 0.14138683676719666,
      "eval_runtime": 154.3411,
      "eval_samples_per_second": 235.517,
      "eval_steps_per_second": 7.36,
      "eval_wer": 0.21796694232026315,
      "step": 147588
    },
    {
      "epoch": 50.0,
      "grad_norm": 4.531148910522461,
      "learning_rate": 3.5367855178612144e-05,
      "loss": 0.5114,
      "step": 150600
    },
    {
      "epoch": 50.0,
      "eval_cer": 0.04037235471628217,
      "eval_loss": 0.14019279181957245,
      "eval_runtime": 152.1041,
      "eval_samples_per_second": 238.981,
      "eval_steps_per_second": 7.469,
      "eval_wer": 0.21485070781064639,
      "step": 150600
    },
    {
      "epoch": 51.0,
      "grad_norm": 6.761490821838379,
      "learning_rate": 3.4661019222772204e-05,
      "loss": 0.5087,
      "step": 153612
    },
    {
      "epoch": 51.0,
      "eval_cer": 0.04063826997367439,
      "eval_loss": 0.14041763544082642,
      "eval_runtime": 154.2132,
      "eval_samples_per_second": 235.713,
      "eval_steps_per_second": 7.366,
      "eval_wer": 0.21654889997959403,
      "step": 153612
    },
    {
      "epoch": 52.0,
      "grad_norm": 4.379857540130615,
      "learning_rate": 3.395441801816303e-05,
      "loss": 0.5066,
      "step": 156624
    },
    {
      "epoch": 52.0,
      "eval_cer": 0.04042691319150575,
      "eval_loss": 0.13891662657260895,
      "eval_runtime": 159.6511,
      "eval_samples_per_second": 227.684,
      "eval_steps_per_second": 7.116,
      "eval_wer": 0.215715367774469,
      "step": 156624
    },
    {
      "epoch": 53.0,
      "grad_norm": 19.332077026367188,
      "learning_rate": 3.324734731109233e-05,
      "loss": 0.5037,
      "step": 159636
    },
    {
      "epoch": 53.0,
      "eval_cer": 0.03977129453965943,
      "eval_loss": 0.1375364065170288,
      "eval_runtime": 164.6123,
      "eval_samples_per_second": 220.822,
      "eval_steps_per_second": 6.901,
      "eval_wer": 0.2132078538793834,
      "step": 159636
    },
    {
      "epoch": 54.0,
      "grad_norm": 11.953184127807617,
      "learning_rate": 3.254098085771392e-05,
      "loss": 0.5024,
      "step": 162648
    },
    {
      "epoch": 54.0,
      "eval_cer": 0.039842816574406296,
      "eval_loss": 0.13721118867397308,
      "eval_runtime": 156.3278,
      "eval_samples_per_second": 232.524,
      "eval_steps_per_second": 7.267,
      "eval_wer": 0.21213221688438805,
      "step": 162648
    },
    {
      "epoch": 55.0,
      "grad_norm": 7.574815273284912,
      "learning_rate": 3.183391015064322e-05,
      "loss": 0.5,
      "step": 165660
    },
    {
      "epoch": 55.0,
      "eval_cer": 0.04010139623849114,
      "eval_loss": 0.13785392045974731,
      "eval_runtime": 152.1653,
      "eval_samples_per_second": 238.885,
      "eval_steps_per_second": 7.466,
      "eval_wer": 0.2131732674808305,
      "step": 165660
    },
    {
      "epoch": 56.0,
      "grad_norm": 11.841280937194824,
      "learning_rate": 3.112707419480328e-05,
      "loss": 0.4976,
      "step": 168672
    },
    {
      "epoch": 56.0,
      "eval_cer": 0.038647114865304755,
      "eval_loss": 0.13485907018184662,
      "eval_runtime": 153.6401,
      "eval_samples_per_second": 236.592,
      "eval_steps_per_second": 7.394,
      "eval_wer": 0.20721403101016495,
      "step": 168672
    },
    {
      "epoch": 57.0,
      "grad_norm": 14.78765869140625,
      "learning_rate": 3.0420238238963334e-05,
      "loss": 0.4948,
      "step": 171684
    },
    {
      "epoch": 57.0,
      "eval_cer": 0.0392779758897387,
      "eval_loss": 0.13624149560928345,
      "eval_runtime": 152.0309,
      "eval_samples_per_second": 239.096,
      "eval_steps_per_second": 7.472,
      "eval_wer": 0.2102472581632547,
      "step": 171684
    },
    {
      "epoch": 58.0,
      "grad_norm": 7.023338794708252,
      "learning_rate": 2.9713402283123397e-05,
      "loss": 0.4933,
      "step": 174696
    },
    {
      "epoch": 58.0,
      "eval_cer": 0.038942372495926456,
      "eval_loss": 0.13551433384418488,
      "eval_runtime": 151.9877,
      "eval_samples_per_second": 239.164,
      "eval_steps_per_second": 7.474,
      "eval_wer": 0.20676094918912188,
      "step": 174696
    },
    {
      "epoch": 59.0,
      "grad_norm": 6.568221092224121,
      "learning_rate": 2.9006801078514222e-05,
      "loss": 0.4924,
      "step": 177708
    },
    {
      "epoch": 59.0,
      "eval_cer": 0.03848756571086942,
      "eval_loss": 0.13611619174480438,
      "eval_runtime": 177.5315,
      "eval_samples_per_second": 204.752,
      "eval_steps_per_second": 6.399,
      "eval_wer": 0.20549508700208555,
      "step": 177708
    },
    {
      "epoch": 60.0,
      "grad_norm": 23.931304931640625,
      "learning_rate": 2.8300199873905052e-05,
      "loss": 0.4901,
      "step": 180720
    },
    {
      "epoch": 60.0,
      "eval_cer": 0.03840274791325294,
      "eval_loss": 0.13464532792568207,
      "eval_runtime": 153.1916,
      "eval_samples_per_second": 237.285,
      "eval_steps_per_second": 7.416,
      "eval_wer": 0.2053671173274398,
      "step": 180720
    },
    {
      "epoch": 61.0,
      "grad_norm": 18.084495544433594,
      "learning_rate": 2.759312916683434e-05,
      "loss": 0.4898,
      "step": 183732
    },
    {
      "epoch": 61.0,
      "eval_cer": 0.038370654692533195,
      "eval_loss": 0.13341517746448517,
      "eval_runtime": 151.6501,
      "eval_samples_per_second": 239.696,
      "eval_steps_per_second": 7.491,
      "eval_wer": 0.2050074187824896,
      "step": 183732
    },
    {
      "epoch": 62.0,
      "grad_norm": 2.890596866607666,
      "learning_rate": 2.6886293210994404e-05,
      "loss": 0.4873,
      "step": 186744
    },
    {
      "epoch": 62.0,
      "eval_cer": 0.038351857234683054,
      "eval_loss": 0.1341981142759323,
      "eval_runtime": 150.7747,
      "eval_samples_per_second": 241.088,
      "eval_steps_per_second": 7.534,
      "eval_wer": 0.20600696570066857,
      "step": 186744
    },
    {
      "epoch": 63.0,
      "grad_norm": 11.759881973266602,
      "learning_rate": 2.617969200638523e-05,
      "loss": 0.4865,
      "step": 189756
    },
    {
      "epoch": 63.0,
      "eval_cer": 0.03869296232347583,
      "eval_loss": 0.13458400964736938,
      "eval_runtime": 152.6729,
      "eval_samples_per_second": 238.091,
      "eval_steps_per_second": 7.441,
      "eval_wer": 0.20699613669928163,
      "step": 189756
    },
    {
      "epoch": 64.0,
      "grad_norm": 13.245360374450684,
      "learning_rate": 2.547309080177606e-05,
      "loss": 0.4842,
      "step": 192768
    },
    {
      "epoch": 64.0,
      "eval_cer": 0.03874110215455545,
      "eval_loss": 0.13456492125988007,
      "eval_runtime": 153.3987,
      "eval_samples_per_second": 236.964,
      "eval_steps_per_second": 7.406,
      "eval_wer": 0.2072278655695861,
      "step": 192768
    },
    {
      "epoch": 65.0,
      "grad_norm": 11.684355735778809,
      "learning_rate": 2.4766020094705352e-05,
      "loss": 0.4822,
      "step": 195780
    },
    {
      "epoch": 65.0,
      "eval_cer": 0.03811941062175572,
      "eval_loss": 0.13252592086791992,
      "eval_runtime": 156.7414,
      "eval_samples_per_second": 231.911,
      "eval_steps_per_second": 7.248,
      "eval_wer": 0.20395599226648128,
      "step": 195780
    },
    {
      "epoch": 66.0,
      "grad_norm": 25.19974708557129,
      "learning_rate": 2.405918413886541e-05,
      "loss": 0.4814,
      "step": 198792
    },
    {
      "epoch": 66.0,
      "eval_cer": 0.037090135185815165,
      "eval_loss": 0.13119570910930634,
      "eval_runtime": 154.348,
      "eval_samples_per_second": 235.507,
      "eval_steps_per_second": 7.36,
      "eval_wer": 0.19890983671761242,
      "step": 198792
    },
    {
      "epoch": 67.0,
      "grad_norm": 12.580814361572266,
      "learning_rate": 2.335234818302547e-05,
      "loss": 0.4796,
      "step": 201804
    },
    {
      "epoch": 67.0,
      "eval_cer": 0.03740739959635898,
      "eval_loss": 0.13117973506450653,
      "eval_runtime": 162.9804,
      "eval_samples_per_second": 223.033,
      "eval_steps_per_second": 6.97,
      "eval_wer": 0.1999750977930419,
      "step": 201804
    },
    {
      "epoch": 68.0,
      "grad_norm": 11.110360145568848,
      "learning_rate": 2.2645746978416297e-05,
      "loss": 0.4771,
      "step": 204816
    },
    {
      "epoch": 68.0,
      "eval_cer": 0.037213006373713636,
      "eval_loss": 0.1303921490907669,
      "eval_runtime": 152.708,
      "eval_samples_per_second": 238.036,
      "eval_steps_per_second": 7.439,
      "eval_wer": 0.1997191584437504,
      "step": 204816
    },
    {
      "epoch": 69.0,
      "grad_norm": 4.782271385192871,
      "learning_rate": 2.193891102257636e-05,
      "loss": 0.4756,
      "step": 207828
    },
    {
      "epoch": 69.0,
      "eval_cer": 0.037708617396542916,
      "eval_loss": 0.13083402812480927,
      "eval_runtime": 152.8061,
      "eval_samples_per_second": 237.883,
      "eval_steps_per_second": 7.434,
      "eval_wer": 0.20086396823585156,
      "step": 207828
    },
    {
      "epoch": 70.0,
      "grad_norm": 7.983453750610352,
      "learning_rate": 2.1232544569197956e-05,
      "loss": 0.4745,
      "step": 210840
    },
    {
      "epoch": 70.0,
      "eval_cer": 0.0370488724734612,
      "eval_loss": 0.13116249442100525,
      "eval_runtime": 151.9447,
      "eval_samples_per_second": 239.232,
      "eval_steps_per_second": 7.476,
      "eval_wer": 0.19823886058568607,
      "step": 210840
    },
    {
      "epoch": 71.0,
      "grad_norm": 23.63794708251953,
      "learning_rate": 2.052547386212725e-05,
      "loss": 0.4738,
      "step": 213852
    },
    {
      "epoch": 71.0,
      "eval_cer": 0.037366136884005016,
      "eval_loss": 0.1306936889886856,
      "eval_runtime": 154.0224,
      "eval_samples_per_second": 236.005,
      "eval_steps_per_second": 7.376,
      "eval_wer": 0.20006848106913475,
      "step": 213852
    },
    {
      "epoch": 72.0,
      "grad_norm": 10.838956832885742,
      "learning_rate": 1.9818637906287305e-05,
      "loss": 0.473,
      "step": 216864
    },
    {
      "epoch": 72.0,
      "eval_cer": 0.0372285945094918,
      "eval_loss": 0.13071005046367645,
      "eval_runtime": 154.8642,
      "eval_samples_per_second": 234.722,
      "eval_steps_per_second": 7.335,
      "eval_wer": 0.19911043782921928,
      "step": 216864
    },
    {
      "epoch": 73.0,
      "grad_norm": 11.969744682312012,
      "learning_rate": 1.9111801950447367e-05,
      "loss": 0.472,
      "step": 219876
    },
    {
      "epoch": 73.0,
      "eval_cer": 0.03662890975661418,
      "eval_loss": 0.12924158573150635,
      "eval_runtime": 154.3055,
      "eval_samples_per_second": 235.572,
      "eval_steps_per_second": 7.362,
      "eval_wer": 0.19607375203627422,
      "step": 219876
    },
    {
      "epoch": 74.0,
      "grad_norm": 6.115599155426025,
      "learning_rate": 1.840496599460743e-05,
      "loss": 0.4693,
      "step": 222888
    },
    {
      "epoch": 74.0,
      "eval_cer": 0.036412051279465014,
      "eval_loss": 0.12866230309009552,
      "eval_runtime": 157.4725,
      "eval_samples_per_second": 230.834,
      "eval_steps_per_second": 7.214,
      "eval_wer": 0.19521600935216216,
      "step": 222888
    },
    {
      "epoch": 75.0,
      "grad_norm": 44.51272964477539,
      "learning_rate": 1.7698130038767486e-05,
      "loss": 0.4693,
      "step": 225900
    },
    {
      "epoch": 75.0,
      "eval_cer": 0.03628138602367746,
      "eval_loss": 0.12844808399677277,
      "eval_runtime": 164.6927,
      "eval_samples_per_second": 220.714,
      "eval_steps_per_second": 6.898,
      "eval_wer": 0.1944724017832747,
      "step": 225900
    },
    {
      "epoch": 76.0,
      "grad_norm": 9.162590026855469,
      "learning_rate": 1.6991528834158312e-05,
      "loss": 0.4664,
      "step": 228912
    },
    {
      "epoch": 76.0,
      "eval_cer": 0.03683797416587427,
      "eval_loss": 0.12876588106155396,
      "eval_runtime": 152.2551,
      "eval_samples_per_second": 238.744,
      "eval_steps_per_second": 7.461,
      "eval_wer": 0.19688999104212276,
      "step": 228912
    },
    {
      "epoch": 77.0,
      "grad_norm": 3.896597146987915,
      "learning_rate": 1.6284692878318375e-05,
      "loss": 0.4651,
      "step": 231924
    },
    {
      "epoch": 77.0,
      "eval_cer": 0.03683384789463887,
      "eval_loss": 0.12869854271411896,
      "eval_runtime": 168.0203,
      "eval_samples_per_second": 216.343,
      "eval_steps_per_second": 6.761,
      "eval_wer": 0.1971009680732955,
      "step": 231924
    },
    {
      "epoch": 78.0,
      "grad_norm": 15.388148307800293,
      "learning_rate": 1.5577856922478434e-05,
      "loss": 0.4641,
      "step": 234936
    },
    {
      "epoch": 78.0,
      "eval_cer": 0.03656747416266495,
      "eval_loss": 0.1286703646183014,
      "eval_runtime": 154.3849,
      "eval_samples_per_second": 235.45,
      "eval_steps_per_second": 7.358,
      "eval_wer": 0.1952090920724516,
      "step": 234936
    },
    {
      "epoch": 79.0,
      "grad_norm": 2.635507345199585,
      "learning_rate": 1.4871020966638496e-05,
      "loss": 0.462,
      "step": 237948
    },
    {
      "epoch": 79.0,
      "eval_cer": 0.03641342670321015,
      "eval_loss": 0.12868022918701172,
      "eval_runtime": 152.2309,
      "eval_samples_per_second": 238.782,
      "eval_steps_per_second": 7.462,
      "eval_wer": 0.19447586042313,
      "step": 237948
    },
    {
      "epoch": 80.0,
      "grad_norm": 5.287237167358398,
      "learning_rate": 1.4163950259567787e-05,
      "loss": 0.4608,
      "step": 240960
    },
    {
      "epoch": 80.0,
      "eval_cer": 0.036332276702247354,
      "eval_loss": 0.12745150923728943,
      "eval_runtime": 154.8487,
      "eval_samples_per_second": 234.745,
      "eval_steps_per_second": 7.336,
      "eval_wer": 0.19517796431375398,
      "step": 240960
    },
    {
      "epoch": 81.0,
      "grad_norm": 11.394750595092773,
      "learning_rate": 1.3457349054958616e-05,
      "loss": 0.4594,
      "step": 243972
    },
    {
      "epoch": 81.0,
      "eval_cer": 0.0360989131401566,
      "eval_loss": 0.12770119309425354,
      "eval_runtime": 152.6766,
      "eval_samples_per_second": 238.085,
      "eval_steps_per_second": 7.441,
      "eval_wer": 0.19389480892744118,
      "step": 243972
    },
    {
      "epoch": 82.0,
      "grad_norm": 9.252601623535156,
      "learning_rate": 1.2750278347887909e-05,
      "loss": 0.4595,
      "step": 246984
    },
    {
      "epoch": 82.0,
      "eval_cer": 0.03594715805361035,
      "eval_loss": 0.12681059539318085,
      "eval_runtime": 152.0339,
      "eval_samples_per_second": 239.091,
      "eval_steps_per_second": 7.472,
      "eval_wer": 0.19371841829482137,
      "step": 246984
    },
    {
      "epoch": 83.0,
      "grad_norm": 16.776588439941406,
      "learning_rate": 1.2043677143278735e-05,
      "loss": 0.4575,
      "step": 249996
    },
    {
      "epoch": 83.0,
      "eval_cer": 0.03615393008996188,
      "eval_loss": 0.12722131609916687,
      "eval_runtime": 152.0731,
      "eval_samples_per_second": 239.03,
      "eval_steps_per_second": 7.47,
      "eval_wer": 0.1942475901926808,
      "step": 249996
    },
    {
      "epoch": 84.0,
      "grad_norm": 8.937053680419922,
      "learning_rate": 1.1336606436208028e-05,
      "loss": 0.4569,
      "step": 253008
    },
    {
      "epoch": 84.0,
      "eval_cer": 0.03605260720740382,
      "eval_loss": 0.12680456042289734,
      "eval_runtime": 152.9563,
      "eval_samples_per_second": 237.65,
      "eval_steps_per_second": 7.427,
      "eval_wer": 0.19341059934770052,
      "step": 253008
    },
    {
      "epoch": 85.0,
      "grad_norm": 13.364398956298828,
      "learning_rate": 1.0630005231598857e-05,
      "loss": 0.4552,
      "step": 256020
    },
    {
      "epoch": 85.0,
      "eval_cer": 0.035670697880838785,
      "eval_loss": 0.12619073688983917,
      "eval_runtime": 156.3815,
      "eval_samples_per_second": 232.444,
      "eval_steps_per_second": 7.264,
      "eval_wer": 0.1916293998222259,
      "step": 256020
    },
    {
      "epoch": 86.0,
      "grad_norm": 9.33234691619873,
      "learning_rate": 9.923404026989685e-06,
      "loss": 0.4538,
      "step": 259032
    },
    {
      "epoch": 86.0,
      "eval_cer": 0.03549051737022648,
      "eval_loss": 0.12592804431915283,
      "eval_runtime": 156.5096,
      "eval_samples_per_second": 232.254,
      "eval_steps_per_second": 7.258,
      "eval_wer": 0.19070940162071864,
      "step": 259032
    },
    {
      "epoch": 87.0,
      "grad_norm": 4.286988735198975,
      "learning_rate": 9.216568071149744e-06,
      "loss": 0.4532,
      "step": 262044
    },
    {
      "epoch": 87.0,
      "eval_cer": 0.03551573347222057,
      "eval_loss": 0.12575581669807434,
      "eval_runtime": 155.6329,
      "eval_samples_per_second": 233.562,
      "eval_steps_per_second": 7.299,
      "eval_wer": 0.19122473895915693,
      "step": 262044
    },
    {
      "epoch": 88.0,
      "grad_norm": 7.920403957366943,
      "learning_rate": 8.509732115309804e-06,
      "loss": 0.4524,
      "step": 265056
    },
    {
      "epoch": 88.0,
      "eval_cer": 0.03555103601501229,
      "eval_loss": 0.1259673833847046,
      "eval_runtime": 166.3365,
      "eval_samples_per_second": 218.533,
      "eval_steps_per_second": 6.83,
      "eval_wer": 0.19095150641058897,
      "step": 265056
    },
    {
      "epoch": 89.0,
      "grad_norm": 9.81010913848877,
      "learning_rate": 7.802896159469865e-06,
      "loss": 0.4501,
      "step": 268068
    },
    {
      "epoch": 89.0,
      "eval_cer": 0.03596458008771536,
      "eval_loss": 0.12655647099018097,
      "eval_runtime": 155.3246,
      "eval_samples_per_second": 234.026,
      "eval_steps_per_second": 7.314,
      "eval_wer": 0.19276729233461648,
      "step": 268068
    },
    {
      "epoch": 90.0,
      "grad_norm": 10.394911766052246,
      "learning_rate": 7.096060203629924e-06,
      "loss": 0.4491,
      "step": 271080
    },
    {
      "epoch": 90.0,
      "eval_cer": 0.03546667669197752,
      "eval_loss": 0.12519720196723938,
      "eval_runtime": 177.0207,
      "eval_samples_per_second": 205.343,
      "eval_steps_per_second": 6.417,
      "eval_wer": 0.19042579315258482,
      "step": 271080
    },
    {
      "epoch": 91.0,
      "grad_norm": 9.381885528564453,
      "learning_rate": 6.3892242477899846e-06,
      "loss": 0.4486,
      "step": 274092
    },
    {
      "epoch": 91.0,
      "eval_cer": 0.03518288092589859,
      "eval_loss": 0.12525735795497894,
      "eval_runtime": 173.742,
      "eval_samples_per_second": 209.218,
      "eval_steps_per_second": 6.538,
      "eval_wer": 0.18893166073509932,
      "step": 274092
    },
    {
      "epoch": 92.0,
      "grad_norm": 26.816091537475586,
      "learning_rate": 5.682623043180811e-06,
      "loss": 0.4487,
      "step": 277104
    },
    {
      "epoch": 92.0,
      "eval_cer": 0.035369480080654846,
      "eval_loss": 0.12525933980941772,
      "eval_runtime": 153.4339,
      "eval_samples_per_second": 236.91,
      "eval_steps_per_second": 7.404,
      "eval_wer": 0.190249402519965,
      "step": 277104
    },
    {
      "epoch": 93.0,
      "grad_norm": 12.131733894348145,
      "learning_rate": 4.975552336110105e-06,
      "loss": 0.4471,
      "step": 280116
    },
    {
      "epoch": 93.0,
      "eval_cer": 0.03521634957036347,
      "eval_loss": 0.1251526027917862,
      "eval_runtime": 176.0621,
      "eval_samples_per_second": 206.461,
      "eval_steps_per_second": 6.452,
      "eval_wer": 0.1893743666365765,
      "step": 280116
    },
    {
      "epoch": 94.0,
      "grad_norm": 14.601805686950684,
      "learning_rate": 4.2687163802701646e-06,
      "loss": 0.4458,
      "step": 283128
    },
    {
      "epoch": 94.0,
      "eval_cer": 0.0351705021121924,
      "eval_loss": 0.1253127008676529,
      "eval_runtime": 177.0148,
      "eval_samples_per_second": 205.35,
      "eval_steps_per_second": 6.418,
      "eval_wer": 0.18914263776627205,
      "step": 283128
    },
    {
      "epoch": 95.0,
      "grad_norm": 3.8078722953796387,
      "learning_rate": 3.562115175660992e-06,
      "loss": 0.4449,
      "step": 286140
    },
    {
      "epoch": 95.0,
      "eval_cer": 0.035079265670431965,
      "eval_loss": 0.12475291639566422,
      "eval_runtime": 168.7285,
      "eval_samples_per_second": 215.435,
      "eval_steps_per_second": 6.733,
      "eval_wer": 0.1884266993162269,
      "step": 286140
    },
    {
      "epoch": 96.0,
      "grad_norm": 4.562527656555176,
      "learning_rate": 2.855044468590285e-06,
      "loss": 0.4434,
      "step": 289152
    },
    {
      "epoch": 96.0,
      "eval_cer": 0.035126030077766456,
      "eval_loss": 0.1246921494603157,
      "eval_runtime": 179.6539,
      "eval_samples_per_second": 202.333,
      "eval_steps_per_second": 6.323,
      "eval_wer": 0.18909421680829797,
      "step": 289152
    },
    {
      "epoch": 97.0,
      "grad_norm": 8.47780990600586,
      "learning_rate": 2.1482085127503454e-06,
      "loss": 0.4435,
      "step": 292164
    },
    {
      "epoch": 97.0,
      "eval_cer": 0.035188841095460825,
      "eval_loss": 0.12471602112054825,
      "eval_runtime": 152.6845,
      "eval_samples_per_second": 238.073,
      "eval_steps_per_second": 7.44,
      "eval_wer": 0.18912880320685088,
      "step": 292164
    },
    {
      "epoch": 98.0,
      "grad_norm": 16.65981101989746,
      "learning_rate": 1.4413725569104053e-06,
      "loss": 0.4444,
      "step": 295176
    },
    {
      "epoch": 98.0,
      "eval_cer": 0.03511594363696882,
      "eval_loss": 0.12448572367429733,
      "eval_runtime": 159.0007,
      "eval_samples_per_second": 228.615,
      "eval_steps_per_second": 7.145,
      "eval_wer": 0.1887518114626242,
      "step": 295176
    },
    {
      "epoch": 99.0,
      "grad_norm": 10.248809814453125,
      "learning_rate": 7.345366010704655e-07,
      "loss": 0.4429,
      "step": 298188
    },
    {
      "epoch": 99.0,
      "eval_cer": 0.03512648855234817,
      "eval_loss": 0.12444119900465012,
      "eval_runtime": 155.6325,
      "eval_samples_per_second": 233.563,
      "eval_steps_per_second": 7.299,
      "eval_wer": 0.18870684914450545,
      "step": 298188
    }
  ],
  "logging_steps": 500,
  "max_steps": 301200,
  "num_input_tokens_seen": 0,
  "num_train_epochs": 100,
  "save_steps": 500,
  "stateful_callbacks": {
    "EarlyStoppingCallback": {
      "args": {
        "early_stopping_patience": 10,
        "early_stopping_threshold": 0.001
      },
      "attributes": {
        "early_stopping_patience_counter": 8
      }
    },
    "TrainerControl": {
      "args": {
        "should_epoch_stop": false,
        "should_evaluate": false,
        "should_log": false,
        "should_save": true,
        "should_training_stop": false
      },
      "attributes": {}
    }
  },
  "total_flos": 1.0954167922548843e+21,
  "train_batch_size": 64,
  "trial_name": null,
  "trial_params": null
}