wav2vec2-xls-r-300m-fula / trainer_state.json

End of training

d3a5319 verified 20 days ago

71.6 kB

	{
	"best_metric": 0.46308374404907227,
	"best_model_checkpoint": "wav2vec2-xls-r-300m-fula/checkpoint-4000",
	"epoch": 5.154639175257732,
	"eval_steps": 2000,
	"global_step": 10000,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.01288659793814433,
	"grad_norm": 10.90772533416748,
	"learning_rate": 3.4499999999999996e-06,
	"loss": 19.1295,
	"step": 25
	},
	{
	"epoch": 0.02577319587628866,
	"grad_norm": 12.727262496948242,
	"learning_rate": 7.2e-06,
	"loss": 16.6655,
	"step": 50
	},
	{
	"epoch": 0.03865979381443299,
	"grad_norm": 17.578950881958008,
	"learning_rate": 1.0949999999999998e-05,
	"loss": 13.462,
	"step": 75
	},
	{
	"epoch": 0.05154639175257732,
	"grad_norm": 14.574068069458008,
	"learning_rate": 1.47e-05,
	"loss": 7.4496,
	"step": 100
	},
	{
	"epoch": 0.06443298969072164,
	"grad_norm": 11.906006813049316,
	"learning_rate": 1.8449999999999998e-05,
	"loss": 6.1341,
	"step": 125
	},
	{
	"epoch": 0.07731958762886598,
	"grad_norm": 10.743711471557617,
	"learning_rate": 2.2199999999999998e-05,
	"loss": 5.0479,
	"step": 150
	},
	{
	"epoch": 0.09020618556701031,
	"grad_norm": 9.327588081359863,
	"learning_rate": 2.5949999999999997e-05,
	"loss": 4.86,
	"step": 175
	},
	{
	"epoch": 0.10309278350515463,
	"grad_norm": 8.118748664855957,
	"learning_rate": 2.97e-05,
	"loss": 4.3188,
	"step": 200
	},
	{
	"epoch": 0.11597938144329897,
	"grad_norm": 4.968245983123779,
	"learning_rate": 3.345e-05,
	"loss": 4.142,
	"step": 225
	},
	{
	"epoch": 0.12886597938144329,
	"grad_norm": 3.5491788387298584,
	"learning_rate": 3.7199999999999996e-05,
	"loss": 3.7329,
	"step": 250
	},
	{
	"epoch": 0.14175257731958762,
	"grad_norm": 2.228337049484253,
	"learning_rate": 4.095e-05,
	"loss": 3.5432,
	"step": 275
	},
	{
	"epoch": 0.15463917525773196,
	"grad_norm": 1.3472025394439697,
	"learning_rate": 4.4699999999999996e-05,
	"loss": 3.3229,
	"step": 300
	},
	{
	"epoch": 0.16752577319587628,
	"grad_norm": 0.8919354677200317,
	"learning_rate": 4.845e-05,
	"loss": 3.1852,
	"step": 325
	},
	{
	"epoch": 0.18041237113402062,
	"grad_norm": 0.9615734815597534,
	"learning_rate": 5.2199999999999995e-05,
	"loss": 3.0339,
	"step": 350
	},
	{
	"epoch": 0.19329896907216496,
	"grad_norm": 1.0601171255111694,
	"learning_rate": 5.595e-05,
	"loss": 2.9307,
	"step": 375
	},
	{
	"epoch": 0.20618556701030927,
	"grad_norm": 1.2133561372756958,
	"learning_rate": 5.97e-05,
	"loss": 2.7395,
	"step": 400
	},
	{
	"epoch": 0.2190721649484536,
	"grad_norm": 0.922024130821228,
	"learning_rate": 6.345e-05,
	"loss": 2.5765,
	"step": 425
	},
	{
	"epoch": 0.23195876288659795,
	"grad_norm": 1.0528242588043213,
	"learning_rate": 6.72e-05,
	"loss": 2.2256,
	"step": 450
	},
	{
	"epoch": 0.24484536082474226,
	"grad_norm": 1.39167058467865,
	"learning_rate": 7.094999999999999e-05,
	"loss": 1.7335,
	"step": 475
	},
	{
	"epoch": 0.25773195876288657,
	"grad_norm": 1.182673692703247,
	"learning_rate": 7.47e-05,
	"loss": 1.2321,
	"step": 500
	},
	{
	"epoch": 0.2706185567010309,
	"grad_norm": 0.9412080645561218,
	"learning_rate": 7.845e-05,
	"loss": 0.9694,
	"step": 525
	},
	{
	"epoch": 0.28350515463917525,
	"grad_norm": 1.3718018531799316,
	"learning_rate": 8.22e-05,
	"loss": 0.9061,
	"step": 550
	},
	{
	"epoch": 0.2963917525773196,
	"grad_norm": 0.7417821884155273,
	"learning_rate": 8.594999999999999e-05,
	"loss": 0.8102,
	"step": 575
	},
	{
	"epoch": 0.30927835051546393,
	"grad_norm": 0.9690466523170471,
	"learning_rate": 8.969999999999998e-05,
	"loss": 0.7434,
	"step": 600
	},
	{
	"epoch": 0.32216494845360827,
	"grad_norm": 0.8293886780738831,
	"learning_rate": 9.345e-05,
	"loss": 0.7381,
	"step": 625
	},
	{
	"epoch": 0.33505154639175255,
	"grad_norm": 0.8486959934234619,
	"learning_rate": 9.719999999999999e-05,
	"loss": 0.6224,
	"step": 650
	},
	{
	"epoch": 0.3479381443298969,
	"grad_norm": 0.7055938243865967,
	"learning_rate": 0.00010095,
	"loss": 0.6925,
	"step": 675
	},
	{
	"epoch": 0.36082474226804123,
	"grad_norm": 0.7605512142181396,
	"learning_rate": 0.00010469999999999998,
	"loss": 0.6136,
	"step": 700
	},
	{
	"epoch": 0.37371134020618557,
	"grad_norm": 0.6695568561553955,
	"learning_rate": 0.00010845,
	"loss": 0.6419,
	"step": 725
	},
	{
	"epoch": 0.3865979381443299,
	"grad_norm": 0.8840702772140503,
	"learning_rate": 0.00011219999999999999,
	"loss": 0.6667,
	"step": 750
	},
	{
	"epoch": 0.39948453608247425,
	"grad_norm": 0.7186158299446106,
	"learning_rate": 0.00011595,
	"loss": 0.6397,
	"step": 775
	},
	{
	"epoch": 0.41237113402061853,
	"grad_norm": 0.6683000922203064,
	"learning_rate": 0.0001197,
	"loss": 0.5647,
	"step": 800
	},
	{
	"epoch": 0.4252577319587629,
	"grad_norm": 0.8537669777870178,
	"learning_rate": 0.00012345,
	"loss": 0.5624,
	"step": 825
	},
	{
	"epoch": 0.4381443298969072,
	"grad_norm": 1.0267616510391235,
	"learning_rate": 0.00012719999999999997,
	"loss": 0.624,
	"step": 850
	},
	{
	"epoch": 0.45103092783505155,
	"grad_norm": 0.6453070640563965,
	"learning_rate": 0.00013094999999999998,
	"loss": 0.5539,
	"step": 875
	},
	{
	"epoch": 0.4639175257731959,
	"grad_norm": 1.0308513641357422,
	"learning_rate": 0.0001347,
	"loss": 0.5728,
	"step": 900
	},
	{
	"epoch": 0.47680412371134023,
	"grad_norm": 0.560512125492096,
	"learning_rate": 0.00013845,
	"loss": 0.5305,
	"step": 925
	},
	{
	"epoch": 0.4896907216494845,
	"grad_norm": 0.7196568250656128,
	"learning_rate": 0.0001422,
	"loss": 0.5669,
	"step": 950
	},
	{
	"epoch": 0.5025773195876289,
	"grad_norm": 0.5675578713417053,
	"learning_rate": 0.00014595,
	"loss": 0.5093,
	"step": 975
	},
	{
	"epoch": 0.5154639175257731,
	"grad_norm": 0.8834163546562195,
	"learning_rate": 0.00014969999999999998,
	"loss": 0.5757,
	"step": 1000
	},
	{
	"epoch": 0.5283505154639175,
	"grad_norm": 0.5083448886871338,
	"learning_rate": 0.00015344999999999996,
	"loss": 0.5412,
	"step": 1025
	},
	{
	"epoch": 0.5412371134020618,
	"grad_norm": 0.747595489025116,
	"learning_rate": 0.0001572,
	"loss": 0.5849,
	"step": 1050
	},
	{
	"epoch": 0.5541237113402062,
	"grad_norm": 0.5015640258789062,
	"learning_rate": 0.00016094999999999998,
	"loss": 0.5049,
	"step": 1075
	},
	{
	"epoch": 0.5670103092783505,
	"grad_norm": 0.7311388850212097,
	"learning_rate": 0.0001647,
	"loss": 0.4726,
	"step": 1100
	},
	{
	"epoch": 0.5798969072164949,
	"grad_norm": 0.6942028999328613,
	"learning_rate": 0.00016844999999999997,
	"loss": 0.4934,
	"step": 1125
	},
	{
	"epoch": 0.5927835051546392,
	"grad_norm": 0.7268182635307312,
	"learning_rate": 0.00017219999999999998,
	"loss": 0.5074,
	"step": 1150
	},
	{
	"epoch": 0.6056701030927835,
	"grad_norm": 0.5172975063323975,
	"learning_rate": 0.00017595,
	"loss": 0.5293,
	"step": 1175
	},
	{
	"epoch": 0.6185567010309279,
	"grad_norm": 0.5973320603370667,
	"learning_rate": 0.00017969999999999998,
	"loss": 0.5018,
	"step": 1200
	},
	{
	"epoch": 0.6314432989690721,
	"grad_norm": 0.6601810455322266,
	"learning_rate": 0.00018345,
	"loss": 0.4953,
	"step": 1225
	},
	{
	"epoch": 0.6443298969072165,
	"grad_norm": 0.7992896437644958,
	"learning_rate": 0.0001872,
	"loss": 0.4748,
	"step": 1250
	},
	{
	"epoch": 0.6572164948453608,
	"grad_norm": 0.5774939060211182,
	"learning_rate": 0.00019094999999999998,
	"loss": 0.4659,
	"step": 1275
	},
	{
	"epoch": 0.6701030927835051,
	"grad_norm": 0.7045702338218689,
	"learning_rate": 0.0001947,
	"loss": 0.4433,
	"step": 1300
	},
	{
	"epoch": 0.6829896907216495,
	"grad_norm": 0.6067873239517212,
	"learning_rate": 0.00019844999999999997,
	"loss": 0.4872,
	"step": 1325
	},
	{
	"epoch": 0.6958762886597938,
	"grad_norm": 1.0101662874221802,
	"learning_rate": 0.0002022,
	"loss": 0.4933,
	"step": 1350
	},
	{
	"epoch": 0.7087628865979382,
	"grad_norm": 0.4532999098300934,
	"learning_rate": 0.00020595,
	"loss": 0.474,
	"step": 1375
	},
	{
	"epoch": 0.7216494845360825,
	"grad_norm": 0.8769963383674622,
	"learning_rate": 0.00020969999999999997,
	"loss": 0.4923,
	"step": 1400
	},
	{
	"epoch": 0.7345360824742269,
	"grad_norm": 0.38735705614089966,
	"learning_rate": 0.00021344999999999998,
	"loss": 0.5358,
	"step": 1425
	},
	{
	"epoch": 0.7474226804123711,
	"grad_norm": 0.5298680663108826,
	"learning_rate": 0.00021719999999999997,
	"loss": 0.4961,
	"step": 1450
	},
	{
	"epoch": 0.7603092783505154,
	"grad_norm": 0.6393166780471802,
	"learning_rate": 0.00022095,
	"loss": 0.5057,
	"step": 1475
	},
	{
	"epoch": 0.7731958762886598,
	"grad_norm": 1.908589243888855,
	"learning_rate": 0.0002247,
	"loss": 0.5043,
	"step": 1500
	},
	{
	"epoch": 0.7860824742268041,
	"grad_norm": 0.5039921402931213,
	"learning_rate": 0.00022844999999999997,
	"loss": 0.4767,
	"step": 1525
	},
	{
	"epoch": 0.7989690721649485,
	"grad_norm": 0.5750266909599304,
	"learning_rate": 0.00023219999999999998,
	"loss": 0.5002,
	"step": 1550
	},
	{
	"epoch": 0.8118556701030928,
	"grad_norm": 0.5906339883804321,
	"learning_rate": 0.00023594999999999996,
	"loss": 0.4776,
	"step": 1575
	},
	{
	"epoch": 0.8247422680412371,
	"grad_norm": 0.5718595385551453,
	"learning_rate": 0.0002397,
	"loss": 0.4934,
	"step": 1600
	},
	{
	"epoch": 0.8376288659793815,
	"grad_norm": 0.5280390381813049,
	"learning_rate": 0.00024344999999999998,
	"loss": 0.4533,
	"step": 1625
	},
	{
	"epoch": 0.8505154639175257,
	"grad_norm": 1.016766905784607,
	"learning_rate": 0.0002472,
	"loss": 0.4795,
	"step": 1650
	},
	{
	"epoch": 0.8634020618556701,
	"grad_norm": 0.4700835943222046,
	"learning_rate": 0.00025095,
	"loss": 0.4399,
	"step": 1675
	},
	{
	"epoch": 0.8762886597938144,
	"grad_norm": 0.7027618885040283,
	"learning_rate": 0.00025469999999999996,
	"loss": 0.4801,
	"step": 1700
	},
	{
	"epoch": 0.8891752577319587,
	"grad_norm": 0.41857969760894775,
	"learning_rate": 0.00025844999999999997,
	"loss": 0.4449,
	"step": 1725
	},
	{
	"epoch": 0.9020618556701031,
	"grad_norm": 0.7206704020500183,
	"learning_rate": 0.0002622,
	"loss": 0.4648,
	"step": 1750
	},
	{
	"epoch": 0.9149484536082474,
	"grad_norm": 0.485895037651062,
	"learning_rate": 0.00026595,
	"loss": 0.4598,
	"step": 1775
	},
	{
	"epoch": 0.9278350515463918,
	"grad_norm": 0.7267158031463623,
	"learning_rate": 0.0002697,
	"loss": 0.462,
	"step": 1800
	},
	{
	"epoch": 0.9407216494845361,
	"grad_norm": 0.4129009246826172,
	"learning_rate": 0.00027344999999999995,
	"loss": 0.4585,
	"step": 1825
	},
	{
	"epoch": 0.9536082474226805,
	"grad_norm": 0.6467506885528564,
	"learning_rate": 0.0002772,
	"loss": 0.4539,
	"step": 1850
	},
	{
	"epoch": 0.9664948453608248,
	"grad_norm": 0.6241980791091919,
	"learning_rate": 0.00028094999999999997,
	"loss": 0.4917,
	"step": 1875
	},
	{
	"epoch": 0.979381443298969,
	"grad_norm": 0.817642867565155,
	"learning_rate": 0.0002847,
	"loss": 0.4337,
	"step": 1900
	},
	{
	"epoch": 0.9922680412371134,
	"grad_norm": 1.18275785446167,
	"learning_rate": 0.00028845,
	"loss": 0.4591,
	"step": 1925
	},
	{
	"epoch": 1.0051546391752577,
	"grad_norm": 0.5338313579559326,
	"learning_rate": 0.00029219999999999995,
	"loss": 0.5187,
	"step": 1950
	},
	{
	"epoch": 1.018041237113402,
	"grad_norm": 0.40176838636398315,
	"learning_rate": 0.00029595,
	"loss": 0.4012,
	"step": 1975
	},
	{
	"epoch": 1.0309278350515463,
	"grad_norm": 0.6469115018844604,
	"learning_rate": 0.00029969999999999997,
	"loss": 0.4752,
	"step": 2000
	},
	{
	"epoch": 1.0309278350515463,
	"eval_loss": 0.59544438123703,
	"eval_runtime": 196.5387,
	"eval_samples_per_second": 6.233,
	"eval_steps_per_second": 0.784,
	"eval_wer": 1.0,
	"step": 2000
	},
	{
	"epoch": 1.0438144329896908,
	"grad_norm": 0.6261550188064575,
	"learning_rate": 0.00029987722419928825,
	"loss": 0.4102,
	"step": 2025
	},
	{
	"epoch": 1.056701030927835,
	"grad_norm": 0.8379774689674377,
	"learning_rate": 0.00029974377224199284,
	"loss": 0.4658,
	"step": 2050
	},
	{
	"epoch": 1.0695876288659794,
	"grad_norm": 0.503239631652832,
	"learning_rate": 0.0002996103202846975,
	"loss": 0.4167,
	"step": 2075
	},
	{
	"epoch": 1.0824742268041236,
	"grad_norm": 0.3943336606025696,
	"learning_rate": 0.00029947686832740213,
	"loss": 0.4686,
	"step": 2100
	},
	{
	"epoch": 1.0953608247422681,
	"grad_norm": 0.4782889783382416,
	"learning_rate": 0.0002993434163701067,
	"loss": 0.4003,
	"step": 2125
	},
	{
	"epoch": 1.1082474226804124,
	"grad_norm": 0.37270641326904297,
	"learning_rate": 0.00029920996441281137,
	"loss": 0.4578,
	"step": 2150
	},
	{
	"epoch": 1.1211340206185567,
	"grad_norm": 0.5629658699035645,
	"learning_rate": 0.000299076512455516,
	"loss": 0.3687,
	"step": 2175
	},
	{
	"epoch": 1.134020618556701,
	"grad_norm": 0.3787396252155304,
	"learning_rate": 0.0002989430604982206,
	"loss": 0.4322,
	"step": 2200
	},
	{
	"epoch": 1.1469072164948453,
	"grad_norm": 0.6377401947975159,
	"learning_rate": 0.00029880960854092526,
	"loss": 0.4403,
	"step": 2225
	},
	{
	"epoch": 1.1597938144329896,
	"grad_norm": 0.37100082635879517,
	"learning_rate": 0.00029867615658362985,
	"loss": 0.453,
	"step": 2250
	},
	{
	"epoch": 1.172680412371134,
	"grad_norm": 0.7276923060417175,
	"learning_rate": 0.0002985427046263345,
	"loss": 0.4145,
	"step": 2275
	},
	{
	"epoch": 1.1855670103092784,
	"grad_norm": 0.8605408668518066,
	"learning_rate": 0.00029840925266903914,
	"loss": 0.4539,
	"step": 2300
	},
	{
	"epoch": 1.1984536082474226,
	"grad_norm": 0.45449143648147583,
	"learning_rate": 0.00029827580071174373,
	"loss": 0.4031,
	"step": 2325
	},
	{
	"epoch": 1.211340206185567,
	"grad_norm": 0.36433449387550354,
	"learning_rate": 0.0002981423487544484,
	"loss": 0.4548,
	"step": 2350
	},
	{
	"epoch": 1.2242268041237114,
	"grad_norm": 0.48323678970336914,
	"learning_rate": 0.000298008896797153,
	"loss": 0.4236,
	"step": 2375
	},
	{
	"epoch": 1.2371134020618557,
	"grad_norm": 0.6236255764961243,
	"learning_rate": 0.0002978754448398576,
	"loss": 0.438,
	"step": 2400
	},
	{
	"epoch": 1.25,
	"grad_norm": 0.721978485584259,
	"learning_rate": 0.00029774199288256227,
	"loss": 0.3803,
	"step": 2425
	},
	{
	"epoch": 1.2628865979381443,
	"grad_norm": 0.33121246099472046,
	"learning_rate": 0.00029760854092526686,
	"loss": 0.4759,
	"step": 2450
	},
	{
	"epoch": 1.2757731958762886,
	"grad_norm": 0.6318331360816956,
	"learning_rate": 0.0002974750889679715,
	"loss": 0.3616,
	"step": 2475
	},
	{
	"epoch": 1.2886597938144329,
	"grad_norm": 0.30613037943840027,
	"learning_rate": 0.0002973416370106761,
	"loss": 0.4355,
	"step": 2500
	},
	{
	"epoch": 1.3015463917525774,
	"grad_norm": 0.6804624199867249,
	"learning_rate": 0.00029720818505338075,
	"loss": 0.4296,
	"step": 2525
	},
	{
	"epoch": 1.3144329896907216,
	"grad_norm": 0.5847098231315613,
	"learning_rate": 0.0002970747330960854,
	"loss": 0.4774,
	"step": 2550
	},
	{
	"epoch": 1.327319587628866,
	"grad_norm": 0.43900150060653687,
	"learning_rate": 0.00029694128113879,
	"loss": 0.4249,
	"step": 2575
	},
	{
	"epoch": 1.3402061855670104,
	"grad_norm": 0.26748043298721313,
	"learning_rate": 0.00029680782918149463,
	"loss": 0.4713,
	"step": 2600
	},
	{
	"epoch": 1.3530927835051547,
	"grad_norm": 0.5893319845199585,
	"learning_rate": 0.0002966743772241993,
	"loss": 0.3566,
	"step": 2625
	},
	{
	"epoch": 1.365979381443299,
	"grad_norm": 0.2939490079879761,
	"learning_rate": 0.00029654092526690387,
	"loss": 0.427,
	"step": 2650
	},
	{
	"epoch": 1.3788659793814433,
	"grad_norm": 0.6302582025527954,
	"learning_rate": 0.0002964074733096085,
	"loss": 0.413,
	"step": 2675
	},
	{
	"epoch": 1.3917525773195876,
	"grad_norm": 0.5481074452400208,
	"learning_rate": 0.0002962740213523131,
	"loss": 0.5027,
	"step": 2700
	},
	{
	"epoch": 1.4046391752577319,
	"grad_norm": 0.41078057885169983,
	"learning_rate": 0.00029614056939501776,
	"loss": 0.3935,
	"step": 2725
	},
	{
	"epoch": 1.4175257731958764,
	"grad_norm": 0.5955342054367065,
	"learning_rate": 0.0002960071174377224,
	"loss": 0.4454,
	"step": 2750
	},
	{
	"epoch": 1.4304123711340206,
	"grad_norm": 0.47366246581077576,
	"learning_rate": 0.000295873665480427,
	"loss": 0.3861,
	"step": 2775
	},
	{
	"epoch": 1.443298969072165,
	"grad_norm": 0.5429800748825073,
	"learning_rate": 0.00029574021352313164,
	"loss": 0.4525,
	"step": 2800
	},
	{
	"epoch": 1.4561855670103092,
	"grad_norm": 0.5089389681816101,
	"learning_rate": 0.00029560676156583623,
	"loss": 0.3727,
	"step": 2825
	},
	{
	"epoch": 1.4690721649484537,
	"grad_norm": 0.3353477716445923,
	"learning_rate": 0.0002954733096085409,
	"loss": 0.4855,
	"step": 2850
	},
	{
	"epoch": 1.481958762886598,
	"grad_norm": 0.6160407662391663,
	"learning_rate": 0.0002953398576512455,
	"loss": 0.3635,
	"step": 2875
	},
	{
	"epoch": 1.4948453608247423,
	"grad_norm": 0.3237319886684418,
	"learning_rate": 0.0002952064056939501,
	"loss": 0.4285,
	"step": 2900
	},
	{
	"epoch": 1.5077319587628866,
	"grad_norm": 0.450309693813324,
	"learning_rate": 0.00029507295373665477,
	"loss": 0.3759,
	"step": 2925
	},
	{
	"epoch": 1.5206185567010309,
	"grad_norm": 0.3550674319267273,
	"learning_rate": 0.0002949395017793594,
	"loss": 0.4442,
	"step": 2950
	},
	{
	"epoch": 1.5335051546391751,
	"grad_norm": 0.3989160656929016,
	"learning_rate": 0.000294806049822064,
	"loss": 0.4255,
	"step": 2975
	},
	{
	"epoch": 1.5463917525773194,
	"grad_norm": 0.5774266719818115,
	"learning_rate": 0.00029467259786476865,
	"loss": 0.4526,
	"step": 3000
	},
	{
	"epoch": 1.559278350515464,
	"grad_norm": 0.6264383792877197,
	"learning_rate": 0.0002945391459074733,
	"loss": 0.4097,
	"step": 3025
	},
	{
	"epoch": 1.5721649484536082,
	"grad_norm": 0.33969295024871826,
	"learning_rate": 0.0002944056939501779,
	"loss": 0.4241,
	"step": 3050
	},
	{
	"epoch": 1.5850515463917527,
	"grad_norm": 0.39299994707107544,
	"learning_rate": 0.00029427224199288254,
	"loss": 0.3778,
	"step": 3075
	},
	{
	"epoch": 1.597938144329897,
	"grad_norm": 0.42388004064559937,
	"learning_rate": 0.0002941387900355872,
	"loss": 0.4004,
	"step": 3100
	},
	{
	"epoch": 1.6108247422680413,
	"grad_norm": 0.9131516814231873,
	"learning_rate": 0.0002940053380782918,
	"loss": 0.3531,
	"step": 3125
	},
	{
	"epoch": 1.6237113402061856,
	"grad_norm": 0.296908974647522,
	"learning_rate": 0.0002938718861209964,
	"loss": 0.4613,
	"step": 3150
	},
	{
	"epoch": 1.6365979381443299,
	"grad_norm": 0.4583122134208679,
	"learning_rate": 0.000293738434163701,
	"loss": 0.3833,
	"step": 3175
	},
	{
	"epoch": 1.6494845360824741,
	"grad_norm": 0.35052600502967834,
	"learning_rate": 0.00029360498220640566,
	"loss": 0.4432,
	"step": 3200
	},
	{
	"epoch": 1.6623711340206184,
	"grad_norm": 0.532720685005188,
	"learning_rate": 0.0002934715302491103,
	"loss": 0.3635,
	"step": 3225
	},
	{
	"epoch": 1.675257731958763,
	"grad_norm": 0.3807854652404785,
	"learning_rate": 0.0002933380782918149,
	"loss": 0.43,
	"step": 3250
	},
	{
	"epoch": 1.6881443298969072,
	"grad_norm": 0.5288501381874084,
	"learning_rate": 0.00029320462633451955,
	"loss": 0.3449,
	"step": 3275
	},
	{
	"epoch": 1.7010309278350515,
	"grad_norm": 0.3881712853908539,
	"learning_rate": 0.0002930711743772242,
	"loss": 0.4406,
	"step": 3300
	},
	{
	"epoch": 1.713917525773196,
	"grad_norm": 0.42132484912872314,
	"learning_rate": 0.0002929377224199288,
	"loss": 0.3888,
	"step": 3325
	},
	{
	"epoch": 1.7268041237113403,
	"grad_norm": 0.3974430561065674,
	"learning_rate": 0.00029280427046263343,
	"loss": 0.4265,
	"step": 3350
	},
	{
	"epoch": 1.7396907216494846,
	"grad_norm": 0.4618494212627411,
	"learning_rate": 0.0002926708185053381,
	"loss": 0.3537,
	"step": 3375
	},
	{
	"epoch": 1.7525773195876289,
	"grad_norm": 0.347777783870697,
	"learning_rate": 0.00029253736654804267,
	"loss": 0.4282,
	"step": 3400
	},
	{
	"epoch": 1.7654639175257731,
	"grad_norm": 0.5885565280914307,
	"learning_rate": 0.0002924039145907473,
	"loss": 0.3694,
	"step": 3425
	},
	{
	"epoch": 1.7783505154639174,
	"grad_norm": 0.5113171935081482,
	"learning_rate": 0.00029227046263345197,
	"loss": 0.5256,
	"step": 3450
	},
	{
	"epoch": 1.7912371134020617,
	"grad_norm": 0.7724625468254089,
	"learning_rate": 0.00029213701067615656,
	"loss": 0.3649,
	"step": 3475
	},
	{
	"epoch": 1.8041237113402062,
	"grad_norm": 0.44778281450271606,
	"learning_rate": 0.0002920035587188612,
	"loss": 0.4313,
	"step": 3500
	},
	{
	"epoch": 1.8170103092783505,
	"grad_norm": 0.8251272439956665,
	"learning_rate": 0.00029187010676156585,
	"loss": 0.3839,
	"step": 3525
	},
	{
	"epoch": 1.829896907216495,
	"grad_norm": 0.4858299493789673,
	"learning_rate": 0.00029173665480427044,
	"loss": 0.4489,
	"step": 3550
	},
	{
	"epoch": 1.8427835051546393,
	"grad_norm": 0.5172144770622253,
	"learning_rate": 0.0002916032028469751,
	"loss": 0.409,
	"step": 3575
	},
	{
	"epoch": 1.8556701030927836,
	"grad_norm": 0.34371522068977356,
	"learning_rate": 0.0002914697508896797,
	"loss": 0.4365,
	"step": 3600
	},
	{
	"epoch": 1.8685567010309279,
	"grad_norm": 0.5957440137863159,
	"learning_rate": 0.00029133629893238433,
	"loss": 0.3611,
	"step": 3625
	},
	{
	"epoch": 1.8814432989690721,
	"grad_norm": 0.3856901526451111,
	"learning_rate": 0.000291202846975089,
	"loss": 0.451,
	"step": 3650
	},
	{
	"epoch": 1.8943298969072164,
	"grad_norm": 0.5961311459541321,
	"learning_rate": 0.00029106939501779357,
	"loss": 0.3934,
	"step": 3675
	},
	{
	"epoch": 1.9072164948453607,
	"grad_norm": 0.4491939842700958,
	"learning_rate": 0.0002909359430604982,
	"loss": 0.4466,
	"step": 3700
	},
	{
	"epoch": 1.920103092783505,
	"grad_norm": 0.41777607798576355,
	"learning_rate": 0.0002908024911032028,
	"loss": 0.3754,
	"step": 3725
	},
	{
	"epoch": 1.9329896907216495,
	"grad_norm": 0.42550450563430786,
	"learning_rate": 0.00029066903914590745,
	"loss": 0.4027,
	"step": 3750
	},
	{
	"epoch": 1.9458762886597938,
	"grad_norm": 0.427433043718338,
	"learning_rate": 0.0002905355871886121,
	"loss": 0.3603,
	"step": 3775
	},
	{
	"epoch": 1.9587628865979383,
	"grad_norm": 0.8279537558555603,
	"learning_rate": 0.0002904021352313167,
	"loss": 0.4098,
	"step": 3800
	},
	{
	"epoch": 1.9716494845360826,
	"grad_norm": 0.6759387850761414,
	"learning_rate": 0.00029026868327402134,
	"loss": 0.3756,
	"step": 3825
	},
	{
	"epoch": 1.9845360824742269,
	"grad_norm": 0.29660704731941223,
	"learning_rate": 0.000290135231316726,
	"loss": 0.4591,
	"step": 3850
	},
	{
	"epoch": 1.9974226804123711,
	"grad_norm": 0.4846726655960083,
	"learning_rate": 0.0002900017793594306,
	"loss": 0.3944,
	"step": 3875
	},
	{
	"epoch": 2.0103092783505154,
	"grad_norm": 0.4863591492176056,
	"learning_rate": 0.0002898683274021352,
	"loss": 0.3813,
	"step": 3900
	},
	{
	"epoch": 2.0231958762886597,
	"grad_norm": 0.37275585532188416,
	"learning_rate": 0.0002897348754448398,
	"loss": 0.3753,
	"step": 3925
	},
	{
	"epoch": 2.036082474226804,
	"grad_norm": 0.36628881096839905,
	"learning_rate": 0.00028960142348754446,
	"loss": 0.403,
	"step": 3950
	},
	{
	"epoch": 2.0489690721649483,
	"grad_norm": 0.4523802697658539,
	"learning_rate": 0.0002894679715302491,
	"loss": 0.3601,
	"step": 3975
	},
	{
	"epoch": 2.0618556701030926,
	"grad_norm": 0.4722582697868347,
	"learning_rate": 0.0002893345195729537,
	"loss": 0.3858,
	"step": 4000
	},
	{
	"epoch": 2.0618556701030926,
	"eval_loss": 0.46308374404907227,
	"eval_runtime": 201.4429,
	"eval_samples_per_second": 6.081,
	"eval_steps_per_second": 0.764,
	"eval_wer": 1.0057142857142858,
	"step": 4000
	},
	{
	"epoch": 2.0747422680412373,
	"grad_norm": 0.5041220784187317,
	"learning_rate": 0.00028920106761565835,
	"loss": 0.3518,
	"step": 4025
	},
	{
	"epoch": 2.0876288659793816,
	"grad_norm": 0.48610439896583557,
	"learning_rate": 0.00028906761565836294,
	"loss": 0.3818,
	"step": 4050
	},
	{
	"epoch": 2.100515463917526,
	"grad_norm": 0.6834833025932312,
	"learning_rate": 0.0002889341637010676,
	"loss": 0.3778,
	"step": 4075
	},
	{
	"epoch": 2.11340206185567,
	"grad_norm": 0.687245786190033,
	"learning_rate": 0.00028880071174377224,
	"loss": 0.3771,
	"step": 4100
	},
	{
	"epoch": 2.1262886597938144,
	"grad_norm": 0.706832230091095,
	"learning_rate": 0.00028866725978647683,
	"loss": 0.3868,
	"step": 4125
	},
	{
	"epoch": 2.1391752577319587,
	"grad_norm": 0.7049499154090881,
	"learning_rate": 0.0002885338078291815,
	"loss": 0.3646,
	"step": 4150
	},
	{
	"epoch": 2.152061855670103,
	"grad_norm": 0.40853607654571533,
	"learning_rate": 0.00028840035587188607,
	"loss": 0.3235,
	"step": 4175
	},
	{
	"epoch": 2.1649484536082473,
	"grad_norm": 0.3675331771373749,
	"learning_rate": 0.0002882669039145907,
	"loss": 0.4079,
	"step": 4200
	},
	{
	"epoch": 2.1778350515463916,
	"grad_norm": 1.3320142030715942,
	"learning_rate": 0.00028813345195729536,
	"loss": 0.3031,
	"step": 4225
	},
	{
	"epoch": 2.1907216494845363,
	"grad_norm": 0.6416336297988892,
	"learning_rate": 0.00028799999999999995,
	"loss": 0.4087,
	"step": 4250
	},
	{
	"epoch": 2.2036082474226806,
	"grad_norm": 0.43675994873046875,
	"learning_rate": 0.0002878665480427046,
	"loss": 0.3577,
	"step": 4275
	},
	{
	"epoch": 2.216494845360825,
	"grad_norm": 0.3541963994503021,
	"learning_rate": 0.00028773309608540925,
	"loss": 0.3706,
	"step": 4300
	},
	{
	"epoch": 2.229381443298969,
	"grad_norm": 0.4469320476055145,
	"learning_rate": 0.00028759964412811384,
	"loss": 0.3692,
	"step": 4325
	},
	{
	"epoch": 2.2422680412371134,
	"grad_norm": 0.4056352376937866,
	"learning_rate": 0.0002874661921708185,
	"loss": 0.3659,
	"step": 4350
	},
	{
	"epoch": 2.2551546391752577,
	"grad_norm": 0.3547820746898651,
	"learning_rate": 0.0002873327402135231,
	"loss": 0.3564,
	"step": 4375
	},
	{
	"epoch": 2.268041237113402,
	"grad_norm": 0.32645678520202637,
	"learning_rate": 0.0002871992882562277,
	"loss": 0.3346,
	"step": 4400
	},
	{
	"epoch": 2.2809278350515463,
	"grad_norm": 0.7449667453765869,
	"learning_rate": 0.00028706583629893237,
	"loss": 0.3696,
	"step": 4425
	},
	{
	"epoch": 2.2938144329896906,
	"grad_norm": 0.4612623155117035,
	"learning_rate": 0.00028693238434163696,
	"loss": 0.3925,
	"step": 4450
	},
	{
	"epoch": 2.306701030927835,
	"grad_norm": 0.6325463056564331,
	"learning_rate": 0.0002867989323843416,
	"loss": 0.3512,
	"step": 4475
	},
	{
	"epoch": 2.319587628865979,
	"grad_norm": 0.29471156001091003,
	"learning_rate": 0.0002866654804270462,
	"loss": 0.3569,
	"step": 4500
	},
	{
	"epoch": 2.332474226804124,
	"grad_norm": 1.076217770576477,
	"learning_rate": 0.00028653202846975085,
	"loss": 0.3375,
	"step": 4525
	},
	{
	"epoch": 2.345360824742268,
	"grad_norm": 0.614162027835846,
	"learning_rate": 0.0002863985765124555,
	"loss": 0.4078,
	"step": 4550
	},
	{
	"epoch": 2.3582474226804124,
	"grad_norm": 0.4514384865760803,
	"learning_rate": 0.0002862651245551601,
	"loss": 0.3758,
	"step": 4575
	},
	{
	"epoch": 2.3711340206185567,
	"grad_norm": 0.314336359500885,
	"learning_rate": 0.00028613167259786473,
	"loss": 0.3765,
	"step": 4600
	},
	{
	"epoch": 2.384020618556701,
	"grad_norm": 0.5032577514648438,
	"learning_rate": 0.0002859982206405694,
	"loss": 0.3226,
	"step": 4625
	},
	{
	"epoch": 2.3969072164948453,
	"grad_norm": 0.6402880549430847,
	"learning_rate": 0.000285864768683274,
	"loss": 0.3986,
	"step": 4650
	},
	{
	"epoch": 2.4097938144329896,
	"grad_norm": 0.5510269403457642,
	"learning_rate": 0.0002857313167259786,
	"loss": 0.3757,
	"step": 4675
	},
	{
	"epoch": 2.422680412371134,
	"grad_norm": 0.5594025254249573,
	"learning_rate": 0.0002855978647686832,
	"loss": 0.4297,
	"step": 4700
	},
	{
	"epoch": 2.4355670103092786,
	"grad_norm": 0.3621445894241333,
	"learning_rate": 0.00028546441281138786,
	"loss": 0.3336,
	"step": 4725
	},
	{
	"epoch": 2.448453608247423,
	"grad_norm": 0.5683943033218384,
	"learning_rate": 0.0002853309608540925,
	"loss": 0.3395,
	"step": 4750
	},
	{
	"epoch": 2.461340206185567,
	"grad_norm": 0.7661644816398621,
	"learning_rate": 0.0002851975088967971,
	"loss": 0.377,
	"step": 4775
	},
	{
	"epoch": 2.4742268041237114,
	"grad_norm": 0.456636905670166,
	"learning_rate": 0.00028506405693950175,
	"loss": 0.3645,
	"step": 4800
	},
	{
	"epoch": 2.4871134020618557,
	"grad_norm": 0.49251827597618103,
	"learning_rate": 0.0002849306049822064,
	"loss": 0.34,
	"step": 4825
	},
	{
	"epoch": 2.5,
	"grad_norm": 0.32308971881866455,
	"learning_rate": 0.000284797153024911,
	"loss": 0.4092,
	"step": 4850
	},
	{
	"epoch": 2.5128865979381443,
	"grad_norm": 0.9722476005554199,
	"learning_rate": 0.00028466370106761563,
	"loss": 0.3651,
	"step": 4875
	},
	{
	"epoch": 2.5257731958762886,
	"grad_norm": 0.4552549123764038,
	"learning_rate": 0.0002845302491103203,
	"loss": 0.3837,
	"step": 4900
	},
	{
	"epoch": 2.538659793814433,
	"grad_norm": 0.4148350656032562,
	"learning_rate": 0.00028439679715302487,
	"loss": 0.3931,
	"step": 4925
	},
	{
	"epoch": 2.551546391752577,
	"grad_norm": 0.41644537448883057,
	"learning_rate": 0.0002842633451957295,
	"loss": 0.3677,
	"step": 4950
	},
	{
	"epoch": 2.5644329896907214,
	"grad_norm": 0.3989255428314209,
	"learning_rate": 0.00028412989323843416,
	"loss": 0.3759,
	"step": 4975
	},
	{
	"epoch": 2.5773195876288657,
	"grad_norm": 0.472091943025589,
	"learning_rate": 0.00028399644128113876,
	"loss": 0.4008,
	"step": 5000
	},
	{
	"epoch": 2.5902061855670104,
	"grad_norm": 0.9913691282272339,
	"learning_rate": 0.0002838629893238434,
	"loss": 0.3555,
	"step": 5025
	},
	{
	"epoch": 2.6030927835051547,
	"grad_norm": 0.425589382648468,
	"learning_rate": 0.000283729537366548,
	"loss": 0.3774,
	"step": 5050
	},
	{
	"epoch": 2.615979381443299,
	"grad_norm": 0.7836791276931763,
	"learning_rate": 0.00028359608540925264,
	"loss": 0.317,
	"step": 5075
	},
	{
	"epoch": 2.6288659793814433,
	"grad_norm": 0.7071629166603088,
	"learning_rate": 0.0002834626334519573,
	"loss": 0.4039,
	"step": 5100
	},
	{
	"epoch": 2.6417525773195876,
	"grad_norm": 0.5756880640983582,
	"learning_rate": 0.0002833291814946619,
	"loss": 0.342,
	"step": 5125
	},
	{
	"epoch": 2.654639175257732,
	"grad_norm": 0.425029993057251,
	"learning_rate": 0.0002831957295373665,
	"loss": 0.3765,
	"step": 5150
	},
	{
	"epoch": 2.667525773195876,
	"grad_norm": 0.5212023854255676,
	"learning_rate": 0.0002830622775800712,
	"loss": 0.3681,
	"step": 5175
	},
	{
	"epoch": 2.680412371134021,
	"grad_norm": 0.39988288283348083,
	"learning_rate": 0.00028292882562277577,
	"loss": 0.3525,
	"step": 5200
	},
	{
	"epoch": 2.693298969072165,
	"grad_norm": 0.31254854798316956,
	"learning_rate": 0.0002827953736654804,
	"loss": 0.3521,
	"step": 5225
	},
	{
	"epoch": 2.7061855670103094,
	"grad_norm": 0.5564956665039062,
	"learning_rate": 0.00028266192170818506,
	"loss": 0.3602,
	"step": 5250
	},
	{
	"epoch": 2.7190721649484537,
	"grad_norm": 0.45266616344451904,
	"learning_rate": 0.00028252846975088965,
	"loss": 0.3462,
	"step": 5275
	},
	{
	"epoch": 2.731958762886598,
	"grad_norm": 0.26552554965019226,
	"learning_rate": 0.0002823950177935943,
	"loss": 0.3787,
	"step": 5300
	},
	{
	"epoch": 2.7448453608247423,
	"grad_norm": 0.5850217938423157,
	"learning_rate": 0.00028226156583629894,
	"loss": 0.3289,
	"step": 5325
	},
	{
	"epoch": 2.7577319587628866,
	"grad_norm": 0.47871604561805725,
	"learning_rate": 0.00028212811387900354,
	"loss": 0.4246,
	"step": 5350
	},
	{
	"epoch": 2.770618556701031,
	"grad_norm": 0.5951977372169495,
	"learning_rate": 0.0002819946619217082,
	"loss": 0.3326,
	"step": 5375
	},
	{
	"epoch": 2.783505154639175,
	"grad_norm": 0.5806294083595276,
	"learning_rate": 0.0002818612099644128,
	"loss": 0.3952,
	"step": 5400
	},
	{
	"epoch": 2.7963917525773194,
	"grad_norm": 0.6218500733375549,
	"learning_rate": 0.0002817277580071174,
	"loss": 0.3222,
	"step": 5425
	},
	{
	"epoch": 2.8092783505154637,
	"grad_norm": 0.38604310154914856,
	"learning_rate": 0.00028159430604982207,
	"loss": 0.4408,
	"step": 5450
	},
	{
	"epoch": 2.822164948453608,
	"grad_norm": 2.576910972595215,
	"learning_rate": 0.00028146085409252666,
	"loss": 0.355,
	"step": 5475
	},
	{
	"epoch": 2.8350515463917527,
	"grad_norm": 0.28045961260795593,
	"learning_rate": 0.0002813274021352313,
	"loss": 0.3479,
	"step": 5500
	},
	{
	"epoch": 2.847938144329897,
	"grad_norm": 0.6178203225135803,
	"learning_rate": 0.00028119395017793596,
	"loss": 0.3097,
	"step": 5525
	},
	{
	"epoch": 2.8608247422680413,
	"grad_norm": 0.36241769790649414,
	"learning_rate": 0.00028106049822064055,
	"loss": 0.3762,
	"step": 5550
	},
	{
	"epoch": 2.8737113402061856,
	"grad_norm": 0.6459288597106934,
	"learning_rate": 0.0002809270462633452,
	"loss": 0.3261,
	"step": 5575
	},
	{
	"epoch": 2.88659793814433,
	"grad_norm": 0.458281546831131,
	"learning_rate": 0.0002807935943060498,
	"loss": 0.378,
	"step": 5600
	},
	{
	"epoch": 2.899484536082474,
	"grad_norm": 0.4269348382949829,
	"learning_rate": 0.00028066014234875443,
	"loss": 0.3483,
	"step": 5625
	},
	{
	"epoch": 2.9123711340206184,
	"grad_norm": 0.36018800735473633,
	"learning_rate": 0.0002805266903914591,
	"loss": 0.3592,
	"step": 5650
	},
	{
	"epoch": 2.925257731958763,
	"grad_norm": 0.6075245141983032,
	"learning_rate": 0.00028039323843416367,
	"loss": 0.3,
	"step": 5675
	},
	{
	"epoch": 2.9381443298969074,
	"grad_norm": 0.3082279860973358,
	"learning_rate": 0.0002802597864768683,
	"loss": 0.4306,
	"step": 5700
	},
	{
	"epoch": 2.9510309278350517,
	"grad_norm": 0.6344396471977234,
	"learning_rate": 0.0002801263345195729,
	"loss": 0.3795,
	"step": 5725
	},
	{
	"epoch": 2.963917525773196,
	"grad_norm": 0.3072182536125183,
	"learning_rate": 0.00027999288256227756,
	"loss": 0.3425,
	"step": 5750
	},
	{
	"epoch": 2.9768041237113403,
	"grad_norm": 0.5076513886451721,
	"learning_rate": 0.0002798594306049822,
	"loss": 0.3214,
	"step": 5775
	},
	{
	"epoch": 2.9896907216494846,
	"grad_norm": 0.34852054715156555,
	"learning_rate": 0.0002797259786476868,
	"loss": 0.3678,
	"step": 5800
	},
	{
	"epoch": 3.002577319587629,
	"grad_norm": 0.36334386467933655,
	"learning_rate": 0.00027959252669039144,
	"loss": 0.3984,
	"step": 5825
	},
	{
	"epoch": 3.015463917525773,
	"grad_norm": 0.46211138367652893,
	"learning_rate": 0.00027945907473309604,
	"loss": 0.2912,
	"step": 5850
	},
	{
	"epoch": 3.0283505154639174,
	"grad_norm": 0.3730103373527527,
	"learning_rate": 0.0002793256227758007,
	"loss": 0.337,
	"step": 5875
	},
	{
	"epoch": 3.0412371134020617,
	"grad_norm": 0.37066757678985596,
	"learning_rate": 0.00027919217081850533,
	"loss": 0.2959,
	"step": 5900
	},
	{
	"epoch": 3.054123711340206,
	"grad_norm": 0.5712897181510925,
	"learning_rate": 0.0002790587188612099,
	"loss": 0.3279,
	"step": 5925
	},
	{
	"epoch": 3.0670103092783507,
	"grad_norm": 0.39846915006637573,
	"learning_rate": 0.00027892526690391457,
	"loss": 0.3532,
	"step": 5950
	},
	{
	"epoch": 3.079896907216495,
	"grad_norm": 0.3366047143936157,
	"learning_rate": 0.0002787918149466192,
	"loss": 0.3486,
	"step": 5975
	},
	{
	"epoch": 3.0927835051546393,
	"grad_norm": 0.5053852796554565,
	"learning_rate": 0.0002786583629893238,
	"loss": 0.3571,
	"step": 6000
	},
	{
	"epoch": 3.0927835051546393,
	"eval_loss": 0.48639050126075745,
	"eval_runtime": 195.6249,
	"eval_samples_per_second": 6.262,
	"eval_steps_per_second": 0.787,
	"eval_wer": 1.0073469387755103,
	"step": 6000
	},
	{
	"epoch": 3.1056701030927836,
	"grad_norm": 0.35252827405929565,
	"learning_rate": 0.00027852491103202845,
	"loss": 0.3401,
	"step": 6025
	},
	{
	"epoch": 3.118556701030928,
	"grad_norm": 0.3530094027519226,
	"learning_rate": 0.00027839145907473305,
	"loss": 0.3094,
	"step": 6050
	},
	{
	"epoch": 3.131443298969072,
	"grad_norm": 0.9595320224761963,
	"learning_rate": 0.0002782580071174377,
	"loss": 0.3692,
	"step": 6075
	},
	{
	"epoch": 3.1443298969072164,
	"grad_norm": 0.3585176467895508,
	"learning_rate": 0.00027812455516014234,
	"loss": 0.3351,
	"step": 6100
	},
	{
	"epoch": 3.1572164948453607,
	"grad_norm": 0.4432651996612549,
	"learning_rate": 0.00027799110320284693,
	"loss": 0.3494,
	"step": 6125
	},
	{
	"epoch": 3.170103092783505,
	"grad_norm": 0.5367820858955383,
	"learning_rate": 0.0002778576512455516,
	"loss": 0.3311,
	"step": 6150
	},
	{
	"epoch": 3.1829896907216493,
	"grad_norm": 0.3430980443954468,
	"learning_rate": 0.00027772419928825617,
	"loss": 0.3357,
	"step": 6175
	},
	{
	"epoch": 3.195876288659794,
	"grad_norm": 1.0889408588409424,
	"learning_rate": 0.0002775907473309608,
	"loss": 0.3056,
	"step": 6200
	},
	{
	"epoch": 3.2087628865979383,
	"grad_norm": 0.3883308172225952,
	"learning_rate": 0.00027745729537366546,
	"loss": 0.3251,
	"step": 6225
	},
	{
	"epoch": 3.2216494845360826,
	"grad_norm": 0.41912856698036194,
	"learning_rate": 0.00027732384341637006,
	"loss": 0.3292,
	"step": 6250
	},
	{
	"epoch": 3.234536082474227,
	"grad_norm": 0.45084699988365173,
	"learning_rate": 0.0002771903914590747,
	"loss": 0.3516,
	"step": 6275
	},
	{
	"epoch": 3.247422680412371,
	"grad_norm": 0.4294661581516266,
	"learning_rate": 0.00027705693950177935,
	"loss": 0.3297,
	"step": 6300
	},
	{
	"epoch": 3.2603092783505154,
	"grad_norm": 0.25462472438812256,
	"learning_rate": 0.00027692348754448394,
	"loss": 0.3513,
	"step": 6325
	},
	{
	"epoch": 3.2731958762886597,
	"grad_norm": 0.2990482747554779,
	"learning_rate": 0.0002767900355871886,
	"loss": 0.3472,
	"step": 6350
	},
	{
	"epoch": 3.286082474226804,
	"grad_norm": 0.5474823713302612,
	"learning_rate": 0.0002766565836298932,
	"loss": 0.3404,
	"step": 6375
	},
	{
	"epoch": 3.2989690721649483,
	"grad_norm": 0.31416311860084534,
	"learning_rate": 0.00027652313167259783,
	"loss": 0.3052,
	"step": 6400
	},
	{
	"epoch": 3.3118556701030926,
	"grad_norm": 0.6990143656730652,
	"learning_rate": 0.0002763896797153025,
	"loss": 0.3661,
	"step": 6425
	},
	{
	"epoch": 3.3247422680412373,
	"grad_norm": 0.4336131811141968,
	"learning_rate": 0.00027625622775800707,
	"loss": 0.2757,
	"step": 6450
	},
	{
	"epoch": 3.3376288659793816,
	"grad_norm": 0.35333672165870667,
	"learning_rate": 0.0002761227758007117,
	"loss": 0.3275,
	"step": 6475
	},
	{
	"epoch": 3.350515463917526,
	"grad_norm": 0.7743633985519409,
	"learning_rate": 0.0002759893238434163,
	"loss": 0.2855,
	"step": 6500
	},
	{
	"epoch": 3.36340206185567,
	"grad_norm": 0.5316669344902039,
	"learning_rate": 0.00027585587188612095,
	"loss": 0.3742,
	"step": 6525
	},
	{
	"epoch": 3.3762886597938144,
	"grad_norm": 0.3642534017562866,
	"learning_rate": 0.0002757277580071174,
	"loss": 0.3676,
	"step": 6550
	},
	{
	"epoch": 3.3891752577319587,
	"grad_norm": 0.6164928078651428,
	"learning_rate": 0.00027559430604982203,
	"loss": 0.3658,
	"step": 6575
	},
	{
	"epoch": 3.402061855670103,
	"grad_norm": 0.3114078938961029,
	"learning_rate": 0.0002754608540925266,
	"loss": 0.2681,
	"step": 6600
	},
	{
	"epoch": 3.4149484536082473,
	"grad_norm": 0.8610777258872986,
	"learning_rate": 0.00027532740213523127,
	"loss": 0.3607,
	"step": 6625
	},
	{
	"epoch": 3.4278350515463916,
	"grad_norm": 0.49727797508239746,
	"learning_rate": 0.0002751939501779359,
	"loss": 0.3306,
	"step": 6650
	},
	{
	"epoch": 3.4407216494845363,
	"grad_norm": 0.3058234751224518,
	"learning_rate": 0.0002750604982206405,
	"loss": 0.3313,
	"step": 6675
	},
	{
	"epoch": 3.4536082474226806,
	"grad_norm": 0.5317339301109314,
	"learning_rate": 0.00027492704626334516,
	"loss": 0.3316,
	"step": 6700
	},
	{
	"epoch": 3.466494845360825,
	"grad_norm": 0.4639209806919098,
	"learning_rate": 0.0002747935943060498,
	"loss": 0.3773,
	"step": 6725
	},
	{
	"epoch": 3.479381443298969,
	"grad_norm": 0.28237494826316833,
	"learning_rate": 0.0002746601423487544,
	"loss": 0.3275,
	"step": 6750
	},
	{
	"epoch": 3.4922680412371134,
	"grad_norm": 0.44046372175216675,
	"learning_rate": 0.00027452669039145904,
	"loss": 0.3777,
	"step": 6775
	},
	{
	"epoch": 3.5051546391752577,
	"grad_norm": 0.40542760491371155,
	"learning_rate": 0.0002743932384341637,
	"loss": 0.3197,
	"step": 6800
	},
	{
	"epoch": 3.518041237113402,
	"grad_norm": 0.587062418460846,
	"learning_rate": 0.0002742597864768683,
	"loss": 0.3441,
	"step": 6825
	},
	{
	"epoch": 3.5309278350515463,
	"grad_norm": 0.34003278613090515,
	"learning_rate": 0.00027412633451957293,
	"loss": 0.3189,
	"step": 6850
	},
	{
	"epoch": 3.5438144329896906,
	"grad_norm": 0.40320533514022827,
	"learning_rate": 0.0002739928825622776,
	"loss": 0.3115,
	"step": 6875
	},
	{
	"epoch": 3.556701030927835,
	"grad_norm": 0.34437236189842224,
	"learning_rate": 0.00027385943060498217,
	"loss": 0.3344,
	"step": 6900
	},
	{
	"epoch": 3.569587628865979,
	"grad_norm": 0.42826181650161743,
	"learning_rate": 0.0002737259786476868,
	"loss": 0.3716,
	"step": 6925
	},
	{
	"epoch": 3.582474226804124,
	"grad_norm": 0.4200308620929718,
	"learning_rate": 0.00027359252669039146,
	"loss": 0.3511,
	"step": 6950
	},
	{
	"epoch": 3.595360824742268,
	"grad_norm": 0.3897481858730316,
	"learning_rate": 0.00027345907473309605,
	"loss": 0.3651,
	"step": 6975
	},
	{
	"epoch": 3.6082474226804124,
	"grad_norm": 0.3066980838775635,
	"learning_rate": 0.0002733256227758007,
	"loss": 0.314,
	"step": 7000
	},
	{
	"epoch": 3.6211340206185567,
	"grad_norm": 0.39002224802970886,
	"learning_rate": 0.0002731921708185053,
	"loss": 0.411,
	"step": 7025
	},
	{
	"epoch": 3.634020618556701,
	"grad_norm": 0.8328560590744019,
	"learning_rate": 0.00027305871886120994,
	"loss": 0.3154,
	"step": 7050
	},
	{
	"epoch": 3.6469072164948453,
	"grad_norm": 0.43831050395965576,
	"learning_rate": 0.0002729252669039146,
	"loss": 0.396,
	"step": 7075
	},
	{
	"epoch": 3.6597938144329896,
	"grad_norm": 0.3992260694503784,
	"learning_rate": 0.0002727918149466192,
	"loss": 0.3142,
	"step": 7100
	},
	{
	"epoch": 3.6726804123711343,
	"grad_norm": 0.2941119074821472,
	"learning_rate": 0.0002726583629893238,
	"loss": 0.3527,
	"step": 7125
	},
	{
	"epoch": 3.6855670103092786,
	"grad_norm": 0.4881301522254944,
	"learning_rate": 0.00027252491103202847,
	"loss": 0.3171,
	"step": 7150
	},
	{
	"epoch": 3.698453608247423,
	"grad_norm": 0.3898142874240875,
	"learning_rate": 0.00027239145907473306,
	"loss": 0.3817,
	"step": 7175
	},
	{
	"epoch": 3.711340206185567,
	"grad_norm": 0.31580379605293274,
	"learning_rate": 0.0002722580071174377,
	"loss": 0.2595,
	"step": 7200
	},
	{
	"epoch": 3.7242268041237114,
	"grad_norm": 0.3299170136451721,
	"learning_rate": 0.00027212455516014236,
	"loss": 0.3416,
	"step": 7225
	},
	{
	"epoch": 3.7371134020618557,
	"grad_norm": 0.6964473724365234,
	"learning_rate": 0.00027199110320284695,
	"loss": 0.2942,
	"step": 7250
	},
	{
	"epoch": 3.75,
	"grad_norm": 0.3565264046192169,
	"learning_rate": 0.0002718576512455516,
	"loss": 0.3283,
	"step": 7275
	},
	{
	"epoch": 3.7628865979381443,
	"grad_norm": 0.28134214878082275,
	"learning_rate": 0.00027172419928825624,
	"loss": 0.3203,
	"step": 7300
	},
	{
	"epoch": 3.7757731958762886,
	"grad_norm": 0.4196174442768097,
	"learning_rate": 0.00027159074733096083,
	"loss": 0.3396,
	"step": 7325
	},
	{
	"epoch": 3.788659793814433,
	"grad_norm": 0.4770311415195465,
	"learning_rate": 0.0002714572953736655,
	"loss": 0.3144,
	"step": 7350
	},
	{
	"epoch": 3.801546391752577,
	"grad_norm": 0.29138994216918945,
	"learning_rate": 0.0002713238434163701,
	"loss": 0.3403,
	"step": 7375
	},
	{
	"epoch": 3.8144329896907214,
	"grad_norm": 0.47035351395606995,
	"learning_rate": 0.0002711903914590747,
	"loss": 0.2623,
	"step": 7400
	},
	{
	"epoch": 3.8273195876288657,
	"grad_norm": 0.32780078053474426,
	"learning_rate": 0.00027105693950177937,
	"loss": 0.3863,
	"step": 7425
	},
	{
	"epoch": 3.8402061855670104,
	"grad_norm": 0.4419979751110077,
	"learning_rate": 0.00027092348754448396,
	"loss": 0.3207,
	"step": 7450
	},
	{
	"epoch": 3.8530927835051547,
	"grad_norm": 0.28167861700057983,
	"learning_rate": 0.0002707900355871886,
	"loss": 0.3308,
	"step": 7475
	},
	{
	"epoch": 3.865979381443299,
	"grad_norm": 0.3411625921726227,
	"learning_rate": 0.00027065658362989325,
	"loss": 0.3387,
	"step": 7500
	},
	{
	"epoch": 3.8788659793814433,
	"grad_norm": 0.31229549646377563,
	"learning_rate": 0.00027052313167259785,
	"loss": 0.408,
	"step": 7525
	},
	{
	"epoch": 3.8917525773195876,
	"grad_norm": 0.3603403866291046,
	"learning_rate": 0.0002703896797153025,
	"loss": 0.3259,
	"step": 7550
	},
	{
	"epoch": 3.904639175257732,
	"grad_norm": 0.2832438051700592,
	"learning_rate": 0.0002702562277580071,
	"loss": 0.3423,
	"step": 7575
	},
	{
	"epoch": 3.917525773195876,
	"grad_norm": 0.3435526192188263,
	"learning_rate": 0.00027012277580071173,
	"loss": 0.2835,
	"step": 7600
	},
	{
	"epoch": 3.930412371134021,
	"grad_norm": 0.3645428419113159,
	"learning_rate": 0.0002699893238434164,
	"loss": 0.3483,
	"step": 7625
	},
	{
	"epoch": 3.943298969072165,
	"grad_norm": 0.7062532901763916,
	"learning_rate": 0.00026985587188612097,
	"loss": 0.2586,
	"step": 7650
	},
	{
	"epoch": 3.9561855670103094,
	"grad_norm": 0.4606476426124573,
	"learning_rate": 0.0002697224199288256,
	"loss": 0.3939,
	"step": 7675
	},
	{
	"epoch": 3.9690721649484537,
	"grad_norm": 0.4727219045162201,
	"learning_rate": 0.0002695889679715302,
	"loss": 0.3151,
	"step": 7700
	},
	{
	"epoch": 3.981958762886598,
	"grad_norm": 0.2774180471897125,
	"learning_rate": 0.00026945551601423486,
	"loss": 0.3519,
	"step": 7725
	},
	{
	"epoch": 3.9948453608247423,
	"grad_norm": 0.4793704152107239,
	"learning_rate": 0.0002693220640569395,
	"loss": 0.3023,
	"step": 7750
	},
	{
	"epoch": 4.007731958762887,
	"grad_norm": 0.3699122965335846,
	"learning_rate": 0.0002691886120996441,
	"loss": 0.3664,
	"step": 7775
	},
	{
	"epoch": 4.020618556701031,
	"grad_norm": 0.6096347570419312,
	"learning_rate": 0.00026905516014234874,
	"loss": 0.2579,
	"step": 7800
	},
	{
	"epoch": 4.033505154639175,
	"grad_norm": 0.2851110100746155,
	"learning_rate": 0.00026892170818505333,
	"loss": 0.3347,
	"step": 7825
	},
	{
	"epoch": 4.046391752577319,
	"grad_norm": 0.5487604141235352,
	"learning_rate": 0.000268788256227758,
	"loss": 0.2676,
	"step": 7850
	},
	{
	"epoch": 4.059278350515464,
	"grad_norm": 0.29913634061813354,
	"learning_rate": 0.0002686548042704626,
	"loss": 0.3061,
	"step": 7875
	},
	{
	"epoch": 4.072164948453608,
	"grad_norm": 0.3672349750995636,
	"learning_rate": 0.0002685213523131672,
	"loss": 0.2632,
	"step": 7900
	},
	{
	"epoch": 4.085051546391752,
	"grad_norm": 0.5969862341880798,
	"learning_rate": 0.00026838790035587187,
	"loss": 0.2868,
	"step": 7925
	},
	{
	"epoch": 4.097938144329897,
	"grad_norm": 0.4409433901309967,
	"learning_rate": 0.0002682544483985765,
	"loss": 0.2907,
	"step": 7950
	},
	{
	"epoch": 4.110824742268041,
	"grad_norm": 0.4578838050365448,
	"learning_rate": 0.0002681209964412811,
	"loss": 0.3377,
	"step": 7975
	},
	{
	"epoch": 4.123711340206185,
	"grad_norm": 0.302491694688797,
	"learning_rate": 0.00026798754448398575,
	"loss": 0.2857,
	"step": 8000
	},
	{
	"epoch": 4.123711340206185,
	"eval_loss": 0.4647158980369568,
	"eval_runtime": 189.5598,
	"eval_samples_per_second": 6.462,
	"eval_steps_per_second": 0.812,
	"eval_wer": 1.0008163265306123,
	"step": 8000
	},
	{
	"epoch": 4.13659793814433,
	"grad_norm": 0.5263584852218628,
	"learning_rate": 0.00026785409252669034,
	"loss": 0.3246,
	"step": 8025
	},
	{
	"epoch": 4.149484536082475,
	"grad_norm": 0.48449578881263733,
	"learning_rate": 0.000267720640569395,
	"loss": 0.3163,
	"step": 8050
	},
	{
	"epoch": 4.162371134020619,
	"grad_norm": 0.3020855784416199,
	"learning_rate": 0.00026758718861209964,
	"loss": 0.3248,
	"step": 8075
	},
	{
	"epoch": 4.175257731958763,
	"grad_norm": 0.3554665148258209,
	"learning_rate": 0.00026745373665480423,
	"loss": 0.2863,
	"step": 8100
	},
	{
	"epoch": 4.188144329896907,
	"grad_norm": 0.4055439531803131,
	"learning_rate": 0.0002673202846975089,
	"loss": 0.3289,
	"step": 8125
	},
	{
	"epoch": 4.201030927835052,
	"grad_norm": 0.6498619914054871,
	"learning_rate": 0.00026718683274021347,
	"loss": 0.289,
	"step": 8150
	},
	{
	"epoch": 4.213917525773196,
	"grad_norm": 0.23331980407238007,
	"learning_rate": 0.0002670533807829181,
	"loss": 0.2744,
	"step": 8175
	},
	{
	"epoch": 4.22680412371134,
	"grad_norm": 0.5142727494239807,
	"learning_rate": 0.00026691992882562276,
	"loss": 0.3139,
	"step": 8200
	},
	{
	"epoch": 4.239690721649485,
	"grad_norm": 0.4468501806259155,
	"learning_rate": 0.00026678647686832735,
	"loss": 0.3392,
	"step": 8225
	},
	{
	"epoch": 4.252577319587629,
	"grad_norm": 0.36652007699012756,
	"learning_rate": 0.000266653024911032,
	"loss": 0.2499,
	"step": 8250
	},
	{
	"epoch": 4.265463917525773,
	"grad_norm": 0.3004089891910553,
	"learning_rate": 0.0002665195729537366,
	"loss": 0.31,
	"step": 8275
	},
	{
	"epoch": 4.278350515463917,
	"grad_norm": 0.4099670946598053,
	"learning_rate": 0.00026638612099644124,
	"loss": 0.2798,
	"step": 8300
	},
	{
	"epoch": 4.291237113402062,
	"grad_norm": 0.26817041635513306,
	"learning_rate": 0.0002662526690391459,
	"loss": 0.3055,
	"step": 8325
	},
	{
	"epoch": 4.304123711340206,
	"grad_norm": 0.4156699478626251,
	"learning_rate": 0.0002661192170818505,
	"loss": 0.2942,
	"step": 8350
	},
	{
	"epoch": 4.31701030927835,
	"grad_norm": 2.611400842666626,
	"learning_rate": 0.0002659857651245551,
	"loss": 0.3659,
	"step": 8375
	},
	{
	"epoch": 4.329896907216495,
	"grad_norm": 0.46959781646728516,
	"learning_rate": 0.00026585231316725977,
	"loss": 0.2982,
	"step": 8400
	},
	{
	"epoch": 4.342783505154639,
	"grad_norm": 0.2867629826068878,
	"learning_rate": 0.00026571886120996436,
	"loss": 0.3511,
	"step": 8425
	},
	{
	"epoch": 4.355670103092783,
	"grad_norm": 0.38449224829673767,
	"learning_rate": 0.000265585409252669,
	"loss": 0.2826,
	"step": 8450
	},
	{
	"epoch": 4.368556701030927,
	"grad_norm": 0.4524473249912262,
	"learning_rate": 0.0002654519572953736,
	"loss": 0.313,
	"step": 8475
	},
	{
	"epoch": 4.381443298969073,
	"grad_norm": 0.3989889919757843,
	"learning_rate": 0.00026531850533807825,
	"loss": 0.2825,
	"step": 8500
	},
	{
	"epoch": 4.394329896907217,
	"grad_norm": 0.3007287085056305,
	"learning_rate": 0.0002651850533807829,
	"loss": 0.3369,
	"step": 8525
	},
	{
	"epoch": 4.407216494845361,
	"grad_norm": 0.7760800123214722,
	"learning_rate": 0.0002650516014234875,
	"loss": 0.2835,
	"step": 8550
	},
	{
	"epoch": 4.420103092783505,
	"grad_norm": 0.27871614694595337,
	"learning_rate": 0.00026491814946619214,
	"loss": 0.3172,
	"step": 8575
	},
	{
	"epoch": 4.43298969072165,
	"grad_norm": 0.48607179522514343,
	"learning_rate": 0.0002647846975088968,
	"loss": 0.303,
	"step": 8600
	},
	{
	"epoch": 4.445876288659794,
	"grad_norm": 0.3540396988391876,
	"learning_rate": 0.0002646512455516014,
	"loss": 0.355,
	"step": 8625
	},
	{
	"epoch": 4.458762886597938,
	"grad_norm": 1.2004367113113403,
	"learning_rate": 0.000264517793594306,
	"loss": 0.3197,
	"step": 8650
	},
	{
	"epoch": 4.471649484536083,
	"grad_norm": 0.2405807226896286,
	"learning_rate": 0.00026438434163701067,
	"loss": 0.3179,
	"step": 8675
	},
	{
	"epoch": 4.484536082474227,
	"grad_norm": 0.36553826928138733,
	"learning_rate": 0.00026425088967971526,
	"loss": 0.2793,
	"step": 8700
	},
	{
	"epoch": 4.497422680412371,
	"grad_norm": 0.26435115933418274,
	"learning_rate": 0.0002641174377224199,
	"loss": 0.2849,
	"step": 8725
	},
	{
	"epoch": 4.510309278350515,
	"grad_norm": 0.6196132302284241,
	"learning_rate": 0.00026398398576512455,
	"loss": 0.3267,
	"step": 8750
	},
	{
	"epoch": 4.52319587628866,
	"grad_norm": 0.2987557649612427,
	"learning_rate": 0.00026385053380782915,
	"loss": 0.3152,
	"step": 8775
	},
	{
	"epoch": 4.536082474226804,
	"grad_norm": 0.4445992112159729,
	"learning_rate": 0.0002637170818505338,
	"loss": 0.3,
	"step": 8800
	},
	{
	"epoch": 4.548969072164948,
	"grad_norm": 0.4059930741786957,
	"learning_rate": 0.00026358362989323844,
	"loss": 0.3395,
	"step": 8825
	},
	{
	"epoch": 4.561855670103093,
	"grad_norm": 0.522637665271759,
	"learning_rate": 0.00026345017793594303,
	"loss": 0.2783,
	"step": 8850
	},
	{
	"epoch": 4.574742268041237,
	"grad_norm": 0.1963280737400055,
	"learning_rate": 0.0002633167259786477,
	"loss": 0.2979,
	"step": 8875
	},
	{
	"epoch": 4.587628865979381,
	"grad_norm": 0.7622120976448059,
	"learning_rate": 0.00026318327402135227,
	"loss": 0.3204,
	"step": 8900
	},
	{
	"epoch": 4.600515463917525,
	"grad_norm": 0.2749217450618744,
	"learning_rate": 0.0002630498220640569,
	"loss": 0.3365,
	"step": 8925
	},
	{
	"epoch": 4.61340206185567,
	"grad_norm": 0.5664824843406677,
	"learning_rate": 0.00026291637010676156,
	"loss": 0.2772,
	"step": 8950
	},
	{
	"epoch": 4.626288659793815,
	"grad_norm": 0.3661792278289795,
	"learning_rate": 0.00026278291814946616,
	"loss": 0.3314,
	"step": 8975
	},
	{
	"epoch": 4.639175257731958,
	"grad_norm": 0.37070122361183167,
	"learning_rate": 0.0002626494661921708,
	"loss": 0.2991,
	"step": 9000
	},
	{
	"epoch": 4.652061855670103,
	"grad_norm": 0.4963271915912628,
	"learning_rate": 0.00026251601423487545,
	"loss": 0.3312,
	"step": 9025
	},
	{
	"epoch": 4.664948453608248,
	"grad_norm": 0.5193173885345459,
	"learning_rate": 0.00026238256227758004,
	"loss": 0.2914,
	"step": 9050
	},
	{
	"epoch": 4.677835051546392,
	"grad_norm": 0.3158729076385498,
	"learning_rate": 0.0002622491103202847,
	"loss": 0.3317,
	"step": 9075
	},
	{
	"epoch": 4.690721649484536,
	"grad_norm": 0.37290090322494507,
	"learning_rate": 0.00026211565836298934,
	"loss": 0.2612,
	"step": 9100
	},
	{
	"epoch": 4.703608247422681,
	"grad_norm": 0.334089070558548,
	"learning_rate": 0.00026198220640569393,
	"loss": 0.3235,
	"step": 9125
	},
	{
	"epoch": 4.716494845360825,
	"grad_norm": 0.3259222209453583,
	"learning_rate": 0.0002618487544483986,
	"loss": 0.2952,
	"step": 9150
	},
	{
	"epoch": 4.729381443298969,
	"grad_norm": 0.2776556611061096,
	"learning_rate": 0.0002617153024911032,
	"loss": 0.3405,
	"step": 9175
	},
	{
	"epoch": 4.742268041237113,
	"grad_norm": 0.33884450793266296,
	"learning_rate": 0.0002615818505338078,
	"loss": 0.2813,
	"step": 9200
	},
	{
	"epoch": 4.755154639175258,
	"grad_norm": 0.48323071002960205,
	"learning_rate": 0.00026144839857651246,
	"loss": 0.3044,
	"step": 9225
	},
	{
	"epoch": 4.768041237113402,
	"grad_norm": 0.32996150851249695,
	"learning_rate": 0.00026131494661921705,
	"loss": 0.2817,
	"step": 9250
	},
	{
	"epoch": 4.780927835051546,
	"grad_norm": 0.3732437491416931,
	"learning_rate": 0.0002611814946619217,
	"loss": 0.3165,
	"step": 9275
	},
	{
	"epoch": 4.793814432989691,
	"grad_norm": 0.5148000717163086,
	"learning_rate": 0.00026104804270462635,
	"loss": 0.2636,
	"step": 9300
	},
	{
	"epoch": 4.806701030927835,
	"grad_norm": 0.3256881833076477,
	"learning_rate": 0.00026091459074733094,
	"loss": 0.3677,
	"step": 9325
	},
	{
	"epoch": 4.819587628865979,
	"grad_norm": 0.5248320698738098,
	"learning_rate": 0.0002607811387900356,
	"loss": 0.2959,
	"step": 9350
	},
	{
	"epoch": 4.832474226804123,
	"grad_norm": 0.25363728404045105,
	"learning_rate": 0.0002606476868327402,
	"loss": 0.355,
	"step": 9375
	},
	{
	"epoch": 4.845360824742268,
	"grad_norm": 1.110967755317688,
	"learning_rate": 0.0002605142348754448,
	"loss": 0.3208,
	"step": 9400
	},
	{
	"epoch": 4.858247422680412,
	"grad_norm": 0.3510916531085968,
	"learning_rate": 0.00026038078291814947,
	"loss": 0.3421,
	"step": 9425
	},
	{
	"epoch": 4.871134020618557,
	"grad_norm": 0.33312925696372986,
	"learning_rate": 0.00026024733096085406,
	"loss": 0.3046,
	"step": 9450
	},
	{
	"epoch": 4.8840206185567006,
	"grad_norm": 0.32453814148902893,
	"learning_rate": 0.0002601138790035587,
	"loss": 0.3294,
	"step": 9475
	},
	{
	"epoch": 4.896907216494846,
	"grad_norm": 0.3632301092147827,
	"learning_rate": 0.0002599804270462633,
	"loss": 0.3261,
	"step": 9500
	},
	{
	"epoch": 4.90979381443299,
	"grad_norm": 0.3007452189922333,
	"learning_rate": 0.00025984697508896795,
	"loss": 0.3524,
	"step": 9525
	},
	{
	"epoch": 4.922680412371134,
	"grad_norm": 0.47182586789131165,
	"learning_rate": 0.0002597135231316726,
	"loss": 0.3287,
	"step": 9550
	},
	{
	"epoch": 4.935567010309279,
	"grad_norm": 0.3959861397743225,
	"learning_rate": 0.0002595800711743772,
	"loss": 0.3134,
	"step": 9575
	},
	{
	"epoch": 4.948453608247423,
	"grad_norm": 0.28187814354896545,
	"learning_rate": 0.00025944661921708183,
	"loss": 0.3154,
	"step": 9600
	},
	{
	"epoch": 4.961340206185567,
	"grad_norm": 0.32686540484428406,
	"learning_rate": 0.0002593131672597865,
	"loss": 0.3464,
	"step": 9625
	},
	{
	"epoch": 4.974226804123711,
	"grad_norm": 0.46848079562187195,
	"learning_rate": 0.0002591797153024911,
	"loss": 0.2753,
	"step": 9650
	},
	{
	"epoch": 4.987113402061856,
	"grad_norm": 0.25264793634414673,
	"learning_rate": 0.0002590462633451957,
	"loss": 0.3403,
	"step": 9675
	},
	{
	"epoch": 5.0,
	"grad_norm": 0.4163696765899658,
	"learning_rate": 0.0002589128113879003,
	"loss": 0.2669,
	"step": 9700
	},
	{
	"epoch": 5.012886597938144,
	"grad_norm": 0.29742294549942017,
	"learning_rate": 0.00025877935943060496,
	"loss": 0.3203,
	"step": 9725
	},
	{
	"epoch": 5.025773195876289,
	"grad_norm": 0.8651419281959534,
	"learning_rate": 0.0002586459074733096,
	"loss": 0.2589,
	"step": 9750
	},
	{
	"epoch": 5.038659793814433,
	"grad_norm": 0.2916441261768341,
	"learning_rate": 0.0002585124555160142,
	"loss": 0.3,
	"step": 9775
	},
	{
	"epoch": 5.051546391752577,
	"grad_norm": 1.4987293481826782,
	"learning_rate": 0.00025837900355871884,
	"loss": 0.3148,
	"step": 9800
	},
	{
	"epoch": 5.064432989690721,
	"grad_norm": 0.46689650416374207,
	"learning_rate": 0.00025824555160142344,
	"loss": 0.2935,
	"step": 9825
	},
	{
	"epoch": 5.077319587628866,
	"grad_norm": 0.3726617991924286,
	"learning_rate": 0.0002581120996441281,
	"loss": 0.2871,
	"step": 9850
	},
	{
	"epoch": 5.09020618556701,
	"grad_norm": 0.29355180263519287,
	"learning_rate": 0.00025797864768683273,
	"loss": 0.2422,
	"step": 9875
	},
	{
	"epoch": 5.103092783505154,
	"grad_norm": 0.6249547600746155,
	"learning_rate": 0.0002578451957295373,
	"loss": 0.2749,
	"step": 9900
	},
	{
	"epoch": 5.115979381443299,
	"grad_norm": 0.42613521218299866,
	"learning_rate": 0.00025771174377224197,
	"loss": 0.2998,
	"step": 9925
	},
	{
	"epoch": 5.128865979381443,
	"grad_norm": 0.4285449981689453,
	"learning_rate": 0.00025757829181494656,
	"loss": 0.3241,
	"step": 9950
	},
	{
	"epoch": 5.141752577319588,
	"grad_norm": 0.2756471037864685,
	"learning_rate": 0.0002574448398576512,
	"loss": 0.2788,
	"step": 9975
	},
	{
	"epoch": 5.154639175257732,
	"grad_norm": 0.650787889957428,
	"learning_rate": 0.00025731138790035586,
	"loss": 0.2628,
	"step": 10000
	},
	{
	"epoch": 5.154639175257732,
	"eval_loss": 0.5844400525093079,
	"eval_runtime": 196.2011,
	"eval_samples_per_second": 6.244,
	"eval_steps_per_second": 0.785,
	"eval_wer": 1.006530612244898,
	"step": 10000
	},
	{
	"epoch": 5.154639175257732,
	"step": 10000,
	"total_flos": 5.52048529474528e+19,
	"train_loss": 0.6429409675121307,
	"train_runtime": 62307.8234,
	"train_samples_per_second": 22.413,
	"train_steps_per_second": 0.934
	}
	],
	"logging_steps": 25,
	"max_steps": 58200,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 30,
	"save_steps": 2000,
	"stateful_callbacks": {
	"EarlyStoppingCallback": {
	"args": {
	"early_stopping_patience": 3,
	"early_stopping_threshold": 0.0
	},
	"attributes": {
	"early_stopping_patience_counter": 0
	}
	},
	"TrainerControl": {
	"args": {
	"should_epoch_stop": false,
	"should_evaluate": false,
	"should_log": false,
	"should_save": true,
	"should_training_stop": true
	},
	"attributes": {}
	}
	},
	"total_flos": 5.52048529474528e+19,
	"train_batch_size": 12,
	"trial_name": null,
	"trial_params": null
	}