Training in progress, epoch 1

Browse files

Files changed (12) hide show

config.json +77 -0
model.safetensors +3 -0
preprocessor_config.json +22 -0
tmp-checkpoint-1927/config.json +77 -0
tmp-checkpoint-1927/model.safetensors +3 -0
tmp-checkpoint-1927/optimizer.pt +3 -0
tmp-checkpoint-1927/preprocessor_config.json +22 -0
tmp-checkpoint-1927/rng_state.pth +3 -0
tmp-checkpoint-1927/scheduler.pt +3 -0
tmp-checkpoint-1927/trainer_state.json +1193 -0
tmp-checkpoint-1927/training_args.bin +3 -0
training_args.bin +3 -0

config.json ADDED Viewed

	@@ -0,0 +1,77 @@

+{
+  "_name_or_path": "microsoft/swinv2-base-patch4-window12-192-22k",
+  "architectures": [
+    "Swinv2ForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "depths": [
+    2,
+    2,
+    18,
+    2
+  ],
+  "drop_path_rate": 0.1,
+  "embed_dim": 128,
+  "encoder_stride": 32,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 1024,
+  "id2label": {
+    "0": "Cracking",
+    "1": "For Review",
+    "2": "Joint Defect",
+    "3": "Non Distressed",
+    "4": "Patches",
+    "5": "Potholes",
+    "6": "Wearing Surface"
+  },
+  "image_size": 192,
+  "initializer_range": 0.02,
+  "label2id": {
+    "Cracking": 0,
+    "For Review": 1,
+    "Joint Defect": 2,
+    "Non Distressed": 3,
+    "Patches": 4,
+    "Potholes": 5,
+    "Wearing Surface": 6
+  },
+  "layer_norm_eps": 1e-05,
+  "mlp_ratio": 4.0,
+  "model_type": "swinv2",
+  "num_channels": 3,
+  "num_heads": [
+    4,
+    8,
+    16,
+    32
+  ],
+  "num_layers": 4,
+  "out_features": [
+    "stage4"
+  ],
+  "out_indices": [
+    4
+  ],
+  "patch_size": 4,
+  "path_norm": true,
+  "pretrained_window_sizes": [
+    0,
+    0,
+    0,
+    0
+  ],
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "stage_names": [
+    "stem",
+    "stage1",
+    "stage2",
+    "stage3",
+    "stage4"
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.37.2",
+  "use_absolute_embeddings": false,
+  "window_size": 12
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bb53057265614e15f3e69b87c9a2b665ad7f8ebe4815c0cac49e8d65bbb885ef
+size 347665996

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,22 @@

+{
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.485,
+    0.456,
+    0.406
+  ],
+  "image_processor_type": "ViTImageProcessor",
+  "image_std": [
+    0.229,
+    0.224,
+    0.225
+  ],
+  "resample": 3,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 192,
+    "width": 192
+  }
+}

tmp-checkpoint-1927/config.json ADDED Viewed

	@@ -0,0 +1,77 @@

+{
+  "_name_or_path": "microsoft/swinv2-base-patch4-window12-192-22k",
+  "architectures": [
+    "Swinv2ForImageClassification"
+  ],
+  "attention_probs_dropout_prob": 0.0,
+  "depths": [
+    2,
+    2,
+    18,
+    2
+  ],
+  "drop_path_rate": 0.1,
+  "embed_dim": 128,
+  "encoder_stride": 32,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.0,
+  "hidden_size": 1024,
+  "id2label": {
+    "0": "Cracking",
+    "1": "For Review",
+    "2": "Joint Defect",
+    "3": "Non Distressed",
+    "4": "Patches",
+    "5": "Potholes",
+    "6": "Wearing Surface"
+  },
+  "image_size": 192,
+  "initializer_range": 0.02,
+  "label2id": {
+    "Cracking": 0,
+    "For Review": 1,
+    "Joint Defect": 2,
+    "Non Distressed": 3,
+    "Patches": 4,
+    "Potholes": 5,
+    "Wearing Surface": 6
+  },
+  "layer_norm_eps": 1e-05,
+  "mlp_ratio": 4.0,
+  "model_type": "swinv2",
+  "num_channels": 3,
+  "num_heads": [
+    4,
+    8,
+    16,
+    32
+  ],
+  "num_layers": 4,
+  "out_features": [
+    "stage4"
+  ],
+  "out_indices": [
+    4
+  ],
+  "patch_size": 4,
+  "path_norm": true,
+  "pretrained_window_sizes": [
+    0,
+    0,
+    0,
+    0
+  ],
+  "problem_type": "single_label_classification",
+  "qkv_bias": true,
+  "stage_names": [
+    "stem",
+    "stage1",
+    "stage2",
+    "stage3",
+    "stage4"
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.37.2",
+  "use_absolute_embeddings": false,
+  "window_size": 12
+}

tmp-checkpoint-1927/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bb53057265614e15f3e69b87c9a2b665ad7f8ebe4815c0cac49e8d65bbb885ef
+size 347665996

tmp-checkpoint-1927/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:45306e971f034b6a44fb1b6533823e375f8648748fc407bf605fd014c68eb234
+size 695604061

tmp-checkpoint-1927/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,22 @@

+{
+  "do_normalize": true,
+  "do_rescale": true,
+  "do_resize": true,
+  "image_mean": [
+    0.485,
+    0.456,
+    0.406
+  ],
+  "image_processor_type": "ViTImageProcessor",
+  "image_std": [
+    0.229,
+    0.224,
+    0.225
+  ],
+  "resample": 3,
+  "rescale_factor": 0.00392156862745098,
+  "size": {
+    "height": 192,
+    "width": 192
+  }
+}

tmp-checkpoint-1927/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ee6091c68605ce96db6b57ef17cd847fef87ce93f476c85bb323e43c8d58493c
+size 14244

tmp-checkpoint-1927/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f6b93b2a842f7917bf3347f5f7e86b21562d10ffd84b6f28b1bdd5c888f1ba40
+size 1064

tmp-checkpoint-1927/trainer_state.json ADDED Viewed

	@@ -0,0 +1,1193 @@

+{
+  "best_metric": 1.2029738426208496,
+  "best_model_checkpoint": "swinv2-base-patch4-window12-192-22k-ConcreteClassifier-PVT\\checkpoint-1927",
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 1927,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.01,
+      "learning_rate": 1.7298045320878742e-06,
+      "loss": 2.1657,
+      "step": 10
+    },
+    {
+      "epoch": 0.01,
+      "learning_rate": 3.4596090641757485e-06,
+      "loss": 1.9738,
+      "step": 20
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 5.1894135962636225e-06,
+      "loss": 1.8167,
+      "step": 30
+    },
+    {
+      "epoch": 0.02,
+      "learning_rate": 6.919218128351497e-06,
+      "loss": 1.7554,
+      "step": 40
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 8.649022660439371e-06,
+      "loss": 1.6154,
+      "step": 50
+    },
+    {
+      "epoch": 0.03,
+      "learning_rate": 1.0378827192527245e-05,
+      "loss": 1.4087,
+      "step": 60
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 1.2108631724615119e-05,
+      "loss": 1.3473,
+      "step": 70
+    },
+    {
+      "epoch": 0.04,
+      "learning_rate": 1.3838436256702994e-05,
+      "loss": 1.2636,
+      "step": 80
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 1.5568240788790867e-05,
+      "loss": 1.251,
+      "step": 90
+    },
+    {
+      "epoch": 0.05,
+      "learning_rate": 1.7298045320878743e-05,
+      "loss": 1.5939,
+      "step": 100
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 1.9027849852966615e-05,
+      "loss": 1.2923,
+      "step": 110
+    },
+    {
+      "epoch": 0.06,
+      "learning_rate": 2.075765438505449e-05,
+      "loss": 0.9352,
+      "step": 120
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 2.2487458917142365e-05,
+      "loss": 1.3512,
+      "step": 130
+    },
+    {
+      "epoch": 0.07,
+      "learning_rate": 2.4217263449230237e-05,
+      "loss": 1.1637,
+      "step": 140
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 2.5947067981318112e-05,
+      "loss": 0.9679,
+      "step": 150
+    },
+    {
+      "epoch": 0.08,
+      "learning_rate": 2.7676872513405988e-05,
+      "loss": 1.0496,
+      "step": 160
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 2.940667704549386e-05,
+      "loss": 1.2054,
+      "step": 170
+    },
+    {
+      "epoch": 0.09,
+      "learning_rate": 3.1136481577581735e-05,
+      "loss": 0.9784,
+      "step": 180
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 3.286628610966961e-05,
+      "loss": 0.9918,
+      "step": 190
+    },
+    {
+      "epoch": 0.1,
+      "learning_rate": 3.4596090641757486e-05,
+      "loss": 1.1241,
+      "step": 200
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 3.632589517384536e-05,
+      "loss": 0.9452,
+      "step": 210
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 3.805569970593323e-05,
+      "loss": 0.7674,
+      "step": 220
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 3.97855042380211e-05,
+      "loss": 0.8534,
+      "step": 230
+    },
+    {
+      "epoch": 0.12,
+      "learning_rate": 4.151530877010898e-05,
+      "loss": 1.0076,
+      "step": 240
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 4.324511330219685e-05,
+      "loss": 0.9224,
+      "step": 250
+    },
+    {
+      "epoch": 0.13,
+      "learning_rate": 4.497491783428473e-05,
+      "loss": 1.1322,
+      "step": 260
+    },
+    {
+      "epoch": 0.14,
+      "learning_rate": 4.67047223663726e-05,
+      "loss": 0.7622,
+      "step": 270
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.8434526898460474e-05,
+      "loss": 0.941,
+      "step": 280
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 5.0164331430548346e-05,
+      "loss": 0.8296,
+      "step": 290
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 5.1894135962636225e-05,
+      "loss": 0.9002,
+      "step": 300
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 5.36239404947241e-05,
+      "loss": 0.9581,
+      "step": 310
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 5.5353745026811976e-05,
+      "loss": 0.7025,
+      "step": 320
+    },
+    {
+      "epoch": 0.17,
+      "learning_rate": 5.708354955889985e-05,
+      "loss": 0.979,
+      "step": 330
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 5.881335409098772e-05,
+      "loss": 1.0473,
+      "step": 340
+    },
+    {
+      "epoch": 0.18,
+      "learning_rate": 6.054315862307559e-05,
+      "loss": 0.9561,
+      "step": 350
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 6.227296315516347e-05,
+      "loss": 1.0593,
+      "step": 360
+    },
+    {
+      "epoch": 0.19,
+      "learning_rate": 6.400276768725135e-05,
+      "loss": 1.0084,
+      "step": 370
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 6.573257221933921e-05,
+      "loss": 1.1452,
+      "step": 380
+    },
+    {
+      "epoch": 0.2,
+      "learning_rate": 6.746237675142709e-05,
+      "loss": 0.9112,
+      "step": 390
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 6.919218128351497e-05,
+      "loss": 0.8299,
+      "step": 400
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 7.092198581560285e-05,
+      "loss": 1.014,
+      "step": 410
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 7.265179034769071e-05,
+      "loss": 0.8594,
+      "step": 420
+    },
+    {
+      "epoch": 0.22,
+      "learning_rate": 7.438159487977858e-05,
+      "loss": 0.9563,
+      "step": 430
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 7.611139941186646e-05,
+      "loss": 0.9631,
+      "step": 440
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 7.784120394395434e-05,
+      "loss": 0.8729,
+      "step": 450
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 7.95710084760422e-05,
+      "loss": 1.0304,
+      "step": 460
+    },
+    {
+      "epoch": 0.24,
+      "learning_rate": 8.130081300813008e-05,
+      "loss": 0.7785,
+      "step": 470
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 8.303061754021796e-05,
+      "loss": 0.9516,
+      "step": 480
+    },
+    {
+      "epoch": 0.25,
+      "learning_rate": 8.476042207230583e-05,
+      "loss": 0.875,
+      "step": 490
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 8.64902266043937e-05,
+      "loss": 1.1574,
+      "step": 500
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 8.822003113648158e-05,
+      "loss": 1.2652,
+      "step": 510
+    },
+    {
+      "epoch": 0.27,
+      "learning_rate": 8.994983566856946e-05,
+      "loss": 0.9341,
+      "step": 520
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 9.167964020065733e-05,
+      "loss": 0.859,
+      "step": 530
+    },
+    {
+      "epoch": 0.28,
+      "learning_rate": 9.34094447327452e-05,
+      "loss": 0.738,
+      "step": 540
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 9.513924926483307e-05,
+      "loss": 1.0468,
+      "step": 550
+    },
+    {
+      "epoch": 0.29,
+      "learning_rate": 9.686905379692095e-05,
+      "loss": 1.0018,
+      "step": 560
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 9.859885832900881e-05,
+      "loss": 0.9798,
+      "step": 570
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 0.00010032866286109669,
+      "loss": 1.0199,
+      "step": 580
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 0.00010205846739318457,
+      "loss": 0.9069,
+      "step": 590
+    },
+    {
+      "epoch": 0.31,
+      "learning_rate": 0.00010378827192527245,
+      "loss": 0.8453,
+      "step": 600
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 0.00010551807645736032,
+      "loss": 0.9513,
+      "step": 610
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 0.0001072478809894482,
+      "loss": 0.8157,
+      "step": 620
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 0.00010897768552153607,
+      "loss": 0.9546,
+      "step": 630
+    },
+    {
+      "epoch": 0.33,
+      "learning_rate": 0.00011070749005362395,
+      "loss": 1.0515,
+      "step": 640
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 0.00011243729458571182,
+      "loss": 1.2692,
+      "step": 650
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 0.0001141670991177997,
+      "loss": 0.8208,
+      "step": 660
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 0.00011589690364988756,
+      "loss": 0.9837,
+      "step": 670
+    },
+    {
+      "epoch": 0.35,
+      "learning_rate": 0.00011762670818197544,
+      "loss": 0.8842,
+      "step": 680
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 0.0001193565127140633,
+      "loss": 1.2168,
+      "step": 690
+    },
+    {
+      "epoch": 0.36,
+      "learning_rate": 0.00012108631724615118,
+      "loss": 0.8098,
+      "step": 700
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 0.00012281612177823906,
+      "loss": 1.1387,
+      "step": 710
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 0.00012454592631032694,
+      "loss": 1.0108,
+      "step": 720
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 0.00012627573084241482,
+      "loss": 0.8233,
+      "step": 730
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 0.0001280055353745027,
+      "loss": 1.0738,
+      "step": 740
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 0.00012973533990659055,
+      "loss": 1.0947,
+      "step": 750
+    },
+    {
+      "epoch": 0.39,
+      "learning_rate": 0.00013146514443867843,
+      "loss": 1.3367,
+      "step": 760
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 0.0001331949489707663,
+      "loss": 0.9517,
+      "step": 770
+    },
+    {
+      "epoch": 0.4,
+      "learning_rate": 0.00013492475350285418,
+      "loss": 1.2106,
+      "step": 780
+    },
+    {
+      "epoch": 0.41,
+      "learning_rate": 0.00013665455803494206,
+      "loss": 1.1231,
+      "step": 790
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 0.00013838436256702994,
+      "loss": 0.9463,
+      "step": 800
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 0.00014011416709911782,
+      "loss": 0.8069,
+      "step": 810
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 0.0001418439716312057,
+      "loss": 0.8983,
+      "step": 820
+    },
+    {
+      "epoch": 0.43,
+      "learning_rate": 0.00014357377616329355,
+      "loss": 1.2501,
+      "step": 830
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 0.00014530358069538143,
+      "loss": 1.0822,
+      "step": 840
+    },
+    {
+      "epoch": 0.44,
+      "learning_rate": 0.0001470333852274693,
+      "loss": 0.9581,
+      "step": 850
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 0.00014876318975955716,
+      "loss": 1.006,
+      "step": 860
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 0.00015049299429164504,
+      "loss": 1.2277,
+      "step": 870
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 0.00015222279882373292,
+      "loss": 0.8975,
+      "step": 880
+    },
+    {
+      "epoch": 0.46,
+      "learning_rate": 0.0001539526033558208,
+      "loss": 1.2464,
+      "step": 890
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 0.00015568240788790867,
+      "loss": 0.914,
+      "step": 900
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 0.00015741221241999653,
+      "loss": 1.1891,
+      "step": 910
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 0.0001591420169520844,
+      "loss": 0.9151,
+      "step": 920
+    },
+    {
+      "epoch": 0.48,
+      "learning_rate": 0.00016087182148417228,
+      "loss": 0.8521,
+      "step": 930
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 0.00016260162601626016,
+      "loss": 1.0762,
+      "step": 940
+    },
+    {
+      "epoch": 0.49,
+      "learning_rate": 0.00016433143054834804,
+      "loss": 1.1603,
+      "step": 950
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 0.00016606123508043592,
+      "loss": 1.1512,
+      "step": 960
+    },
+    {
+      "epoch": 0.5,
+      "learning_rate": 0.0001677910396125238,
+      "loss": 1.1018,
+      "step": 970
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 0.00016952084414461165,
+      "loss": 1.3488,
+      "step": 980
+    },
+    {
+      "epoch": 0.51,
+      "learning_rate": 0.00017125064867669953,
+      "loss": 1.0968,
+      "step": 990
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 0.0001729804532087874,
+      "loss": 1.0725,
+      "step": 1000
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 0.00017471025774087529,
+      "loss": 1.1117,
+      "step": 1010
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 0.00017644006227296316,
+      "loss": 0.9088,
+      "step": 1020
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 0.00017816986680505104,
+      "loss": 0.9328,
+      "step": 1030
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 0.00017989967133713892,
+      "loss": 1.4789,
+      "step": 1040
+    },
+    {
+      "epoch": 0.54,
+      "learning_rate": 0.0001816294758692268,
+      "loss": 1.0738,
+      "step": 1050
+    },
+    {
+      "epoch": 0.55,
+      "learning_rate": 0.00018335928040131465,
+      "loss": 1.2455,
+      "step": 1060
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 0.00018508908493340253,
+      "loss": 1.1487,
+      "step": 1070
+    },
+    {
+      "epoch": 0.56,
+      "learning_rate": 0.0001868188894654904,
+      "loss": 1.0046,
+      "step": 1080
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 0.0001885486939975783,
+      "loss": 1.2662,
+      "step": 1090
+    },
+    {
+      "epoch": 0.57,
+      "learning_rate": 0.00019027849852966614,
+      "loss": 1.2935,
+      "step": 1100
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 0.00019200830306175402,
+      "loss": 1.3252,
+      "step": 1110
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 0.0001937381075938419,
+      "loss": 1.0672,
+      "step": 1120
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 0.00019546791212592978,
+      "loss": 1.1187,
+      "step": 1130
+    },
+    {
+      "epoch": 0.59,
+      "learning_rate": 0.00019719771665801763,
+      "loss": 1.0334,
+      "step": 1140
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 0.0001989275211901055,
+      "loss": 1.2401,
+      "step": 1150
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 0.00020065732572219339,
+      "loss": 1.0143,
+      "step": 1160
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 0.00020238713025428126,
+      "loss": 1.0219,
+      "step": 1170
+    },
+    {
+      "epoch": 0.61,
+      "learning_rate": 0.00020411693478636914,
+      "loss": 0.9133,
+      "step": 1180
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 0.00020584673931845702,
+      "loss": 0.8646,
+      "step": 1190
+    },
+    {
+      "epoch": 0.62,
+      "learning_rate": 0.0002075765438505449,
+      "loss": 1.0987,
+      "step": 1200
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 0.00020930634838263278,
+      "loss": 1.1542,
+      "step": 1210
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 0.00021103615291472063,
+      "loss": 1.1115,
+      "step": 1220
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 0.0002127659574468085,
+      "loss": 1.2792,
+      "step": 1230
+    },
+    {
+      "epoch": 0.64,
+      "learning_rate": 0.0002144957619788964,
+      "loss": 1.4426,
+      "step": 1240
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 0.00021622556651098427,
+      "loss": 1.1541,
+      "step": 1250
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 0.00021795537104307214,
+      "loss": 1.3394,
+      "step": 1260
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 0.00021968517557516002,
+      "loss": 1.3261,
+      "step": 1270
+    },
+    {
+      "epoch": 0.66,
+      "learning_rate": 0.0002214149801072479,
+      "loss": 1.1333,
+      "step": 1280
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 0.00022314478463933578,
+      "loss": 1.2157,
+      "step": 1290
+    },
+    {
+      "epoch": 0.67,
+      "learning_rate": 0.00022487458917142363,
+      "loss": 1.1464,
+      "step": 1300
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 0.0002266043937035115,
+      "loss": 1.2047,
+      "step": 1310
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 0.0002283341982355994,
+      "loss": 0.8407,
+      "step": 1320
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 0.00023006400276768727,
+      "loss": 1.3505,
+      "step": 1330
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 0.00023179380729977512,
+      "loss": 1.0958,
+      "step": 1340
+    },
+    {
+      "epoch": 0.7,
+      "learning_rate": 0.000233523611831863,
+      "loss": 1.1707,
+      "step": 1350
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 0.00023525341636395088,
+      "loss": 0.889,
+      "step": 1360
+    },
+    {
+      "epoch": 0.71,
+      "learning_rate": 0.00023698322089603876,
+      "loss": 1.0459,
+      "step": 1370
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 0.0002387130254281266,
+      "loss": 1.2212,
+      "step": 1380
+    },
+    {
+      "epoch": 0.72,
+      "learning_rate": 0.00024044282996021449,
+      "loss": 1.0102,
+      "step": 1390
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 0.00024217263449230237,
+      "loss": 1.0178,
+      "step": 1400
+    },
+    {
+      "epoch": 0.73,
+      "learning_rate": 0.00024390243902439024,
+      "loss": 0.9676,
+      "step": 1410
+    },
+    {
+      "epoch": 0.74,
+      "learning_rate": 0.0002456322435564781,
+      "loss": 1.1611,
+      "step": 1420
+    },
+    {
+      "epoch": 0.74,
+      "learning_rate": 0.000247362048088566,
+      "loss": 1.2205,
+      "step": 1430
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 0.0002490918526206539,
+      "loss": 0.9813,
+      "step": 1440
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 0.00025082165715274176,
+      "loss": 1.1654,
+      "step": 1450
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 0.00025255146168482964,
+      "loss": 1.2854,
+      "step": 1460
+    },
+    {
+      "epoch": 0.76,
+      "learning_rate": 0.0002542812662169175,
+      "loss": 1.0573,
+      "step": 1470
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 0.0002560110707490054,
+      "loss": 1.2734,
+      "step": 1480
+    },
+    {
+      "epoch": 0.77,
+      "learning_rate": 0.0002577408752810932,
+      "loss": 1.2369,
+      "step": 1490
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 0.0002594706798131811,
+      "loss": 1.2364,
+      "step": 1500
+    },
+    {
+      "epoch": 0.78,
+      "learning_rate": 0.000261200484345269,
+      "loss": 1.1,
+      "step": 1510
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 0.00026293028887735685,
+      "loss": 0.9999,
+      "step": 1520
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 0.00026466009340944473,
+      "loss": 1.2802,
+      "step": 1530
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 0.0002663898979415326,
+      "loss": 1.0885,
+      "step": 1540
+    },
+    {
+      "epoch": 0.8,
+      "learning_rate": 0.0002681197024736205,
+      "loss": 1.2307,
+      "step": 1550
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 0.00026984950700570837,
+      "loss": 1.1289,
+      "step": 1560
+    },
+    {
+      "epoch": 0.81,
+      "learning_rate": 0.00027157931153779625,
+      "loss": 1.372,
+      "step": 1570
+    },
+    {
+      "epoch": 0.82,
+      "learning_rate": 0.0002733091160698841,
+      "loss": 1.0389,
+      "step": 1580
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 0.000275038920601972,
+      "loss": 1.2973,
+      "step": 1590
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 0.0002767687251340599,
+      "loss": 1.2623,
+      "step": 1600
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 0.00027849852966614776,
+      "loss": 1.2638,
+      "step": 1610
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 0.00028022833419823564,
+      "loss": 1.0289,
+      "step": 1620
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 0.0002819581387303235,
+      "loss": 1.2778,
+      "step": 1630
+    },
+    {
+      "epoch": 0.85,
+      "learning_rate": 0.0002836879432624114,
+      "loss": 1.4499,
+      "step": 1640
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 0.0002854177477944992,
+      "loss": 1.1778,
+      "step": 1650
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 0.0002871475523265871,
+      "loss": 0.9284,
+      "step": 1660
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 0.000288877356858675,
+      "loss": 1.0374,
+      "step": 1670
+    },
+    {
+      "epoch": 0.87,
+      "learning_rate": 0.00029060716139076286,
+      "loss": 1.714,
+      "step": 1680
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 0.00029233696592285074,
+      "loss": 1.3087,
+      "step": 1690
+    },
+    {
+      "epoch": 0.88,
+      "learning_rate": 0.0002940667704549386,
+      "loss": 0.9422,
+      "step": 1700
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 0.00029579657498702644,
+      "loss": 1.2895,
+      "step": 1710
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 0.0002975263795191143,
+      "loss": 1.1904,
+      "step": 1720
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 0.0002992561840512022,
+      "loss": 1.225,
+      "step": 1730
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 0.0003009859885832901,
+      "loss": 1.2768,
+      "step": 1740
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 0.00030271579311537796,
+      "loss": 1.2937,
+      "step": 1750
+    },
+    {
+      "epoch": 0.91,
+      "learning_rate": 0.00030444559764746583,
+      "loss": 1.2911,
+      "step": 1760
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 0.0003061754021795537,
+      "loss": 1.3184,
+      "step": 1770
+    },
+    {
+      "epoch": 0.92,
+      "learning_rate": 0.0003079052067116416,
+      "loss": 1.375,
+      "step": 1780
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 0.00030963501124372947,
+      "loss": 1.521,
+      "step": 1790
+    },
+    {
+      "epoch": 0.93,
+      "learning_rate": 0.00031136481577581735,
+      "loss": 1.2516,
+      "step": 1800
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 0.0003130946203079052,
+      "loss": 1.4221,
+      "step": 1810
+    },
+    {
+      "epoch": 0.94,
+      "learning_rate": 0.00031482442483999305,
+      "loss": 1.4243,
+      "step": 1820
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 0.00031655422937208093,
+      "loss": 1.0468,
+      "step": 1830
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 0.0003182840339041688,
+      "loss": 1.1835,
+      "step": 1840
+    },
+    {
+      "epoch": 0.96,
+      "learning_rate": 0.0003200138384362567,
+      "loss": 1.0788,
+      "step": 1850
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 0.00032174364296834457,
+      "loss": 0.9704,
+      "step": 1860
+    },
+    {
+      "epoch": 0.97,
+      "learning_rate": 0.00032347344750043245,
+      "loss": 1.6059,
+      "step": 1870
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 0.0003252032520325203,
+      "loss": 1.393,
+      "step": 1880
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 0.0003269330565646082,
+      "loss": 1.4794,
+      "step": 1890
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 0.0003286628610966961,
+      "loss": 1.2421,
+      "step": 1900
+    },
+    {
+      "epoch": 0.99,
+      "learning_rate": 0.00033039266562878396,
+      "loss": 1.1183,
+      "step": 1910
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 0.00033212247016087184,
+      "loss": 1.2477,
+      "step": 1920
+    },
+    {
+      "epoch": 1.0,
+      "eval_accuracy": {
+        "accuracy": 0.5325551232166018
+      },
+      "eval_f1": {
+        "f1": 0.5038817513721507
+      },
+      "eval_loss": 1.2029738426208496,
+      "eval_precision": {
+        "precision": 0.6627476748491293
+      },
+      "eval_recall": {
+        "recall": 0.5484607592874412
+      },
+      "eval_runtime": 214.6494,
+      "eval_samples_per_second": 17.96,
+      "eval_steps_per_second": 8.982,
+      "step": 1927
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 57810,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 30,
+  "save_steps": 500,
+  "total_flos": 8.889378394745733e+17,
+  "train_batch_size": 2,
+  "trial_name": null,
+  "trial_params": null
+}

tmp-checkpoint-1927/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fc7c0f633499ef7b79e3057e99e58bfbfb1c03c08f9b6fa020f2228d0e2537df
+size 4792

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fc7c0f633499ef7b79e3057e99e58bfbfb1c03c08f9b6fa020f2228d0e2537df
+size 4792