SjardiWillems commited on Mar 10, 2024

Commit

6aae154

verified ·

1 Parent(s): 873c85b

Training in progress, epoch 1

Browse files

Files changed (40) hide show

config.json +1 -1
model.safetensors +1 -1
run-0/checkpoint-18/config.json +1 -1
run-0/checkpoint-18/model.safetensors +1 -1
run-0/checkpoint-18/optimizer.pt +1 -1
run-0/checkpoint-18/rng_state.pth +1 -1
run-0/checkpoint-18/scheduler.pt +1 -1
run-0/checkpoint-18/trainer_state.json +19 -19
run-0/checkpoint-18/training_args.bin +1 -1
run-0/checkpoint-27/config.json +1 -1
run-0/checkpoint-27/model.safetensors +1 -1
run-0/checkpoint-27/optimizer.pt +1 -1
run-0/checkpoint-27/rng_state.pth +1 -1
run-0/checkpoint-27/scheduler.pt +1 -1
run-0/checkpoint-27/trainer_state.json +25 -25
run-0/checkpoint-27/training_args.bin +1 -1
run-0/checkpoint-36/config.json +1 -1
run-0/checkpoint-36/model.safetensors +1 -1
run-0/checkpoint-36/optimizer.pt +1 -1
run-0/checkpoint-36/rng_state.pth +1 -1
run-0/checkpoint-36/scheduler.pt +1 -1
run-0/checkpoint-36/trainer_state.json +31 -31
run-0/checkpoint-36/training_args.bin +1 -1
run-0/checkpoint-9/config.json +1 -1
run-0/checkpoint-9/model.safetensors +1 -1
run-0/checkpoint-9/optimizer.pt +1 -1
run-0/checkpoint-9/rng_state.pth +1 -1
run-0/checkpoint-9/scheduler.pt +1 -1
run-0/checkpoint-9/trainer_state.json +12 -12
run-0/checkpoint-9/training_args.bin +1 -1
run-1/checkpoint-18/config.json +1 -1
run-1/checkpoint-18/model.safetensors +1 -1
run-1/checkpoint-18/optimizer.pt +1 -1
run-1/checkpoint-18/rng_state.pth +2 -2
run-1/checkpoint-18/scheduler.pt +1 -1
run-1/checkpoint-18/trainer_state.json +12 -12
run-1/checkpoint-18/training_args.bin +1 -1
runs/Mar10_22-33-58_0f0a24039c15/events.out.tfevents.1710110166.0f0a24039c15.273.2 +3 -0
runs/Mar10_22-33-58_0f0a24039c15/events.out.tfevents.1710110209.0f0a24039c15.273.3 +3 -0
training_args.bin +1 -1

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "distilbert-base-uncased",
   "activation": "gelu",
   "architectures": [
     "DistilBertForSequenceClassification"

 {
+  "_name_or_path": "SjardiWillems/distilbert-base-uncased-finetuned-stsb",
   "activation": "gelu",
   "architectures": [
     "DistilBertForSequenceClassification"

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0dcd2510a5275529b69825a3741cb6de5f13602e1ab3eb4c0a68f4c82f8f7e05
 size 267829484

 version https://git-lfs.github.com/spec/v1
+oid sha256:4a25a8059c3029b9de30789699c137dc8b5ce341a94cb07d79ca20bf334b98b2
 size 267829484

run-0/checkpoint-18/config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "distilbert-base-uncased",
   "activation": "gelu",
   "architectures": [
     "DistilBertForSequenceClassification"

 {
+  "_name_or_path": "SjardiWillems/distilbert-base-uncased-finetuned-stsb",
   "activation": "gelu",
   "architectures": [
     "DistilBertForSequenceClassification"

run-0/checkpoint-18/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:baf1bc3b6031979712ae9a703e994639a838c6d1418547d3de4cd5d42fcc1987
 size 267829484

 version https://git-lfs.github.com/spec/v1
+oid sha256:250e556e5ecae9c440f30ad2f2b5412f125fa67c156fecc1239ac7ed30d3595d
 size 267829484

run-0/checkpoint-18/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:678ee58ea945e14347259ddbee8c7087506c15ab3bb2d556a6d4952c8c3a495f
 size 535721146

 version https://git-lfs.github.com/spec/v1
+oid sha256:cc1394e44db87faa7b14ce3a2f7dd51f1c75521dee741b69c852df26046c8701
 size 535721146

run-0/checkpoint-18/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e286b9bff8b53bef74ce22a2bb491418497057e71b61563237976997da7ac700
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:61d8acc069ff07bdf99f8e314288dd4857d5a8e40efe1eb1479d12cc53a2d060
 size 14244

run-0/checkpoint-18/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:39cff69ca41eb8f894bf9831891f8d1750928f9531a056de16a4c4e7a269dc4a
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:6518bd1ff3a8aabaaccae3c128329d66c13c19a4a3483ccf1540cb5b514a055c
 size 1064

run-0/checkpoint-18/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.4951149744376661,
-  "best_model_checkpoint": "distilbert-base-uncased-finetuned-stsb/run-0/checkpoint-18",
   "epoch": 2.0,
   "eval_steps": 500,
   "global_step": 18,
@@ -10,37 +10,37 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_loss": 2.302802324295044,
-      "eval_pearson": 0.11274566771797583,
-      "eval_runtime": 0.9178,
-      "eval_samples_per_second": 1634.281,
-      "eval_spearmanr": 0.12987920930990302,
-      "eval_steps_per_second": 102.415,
       "step": 9
     },
     {
       "epoch": 2.0,
-      "eval_loss": 2.3637888431549072,
-      "eval_pearson": 0.4951149744376661,
-      "eval_runtime": 1.7789,
-      "eval_samples_per_second": 843.198,
-      "eval_spearmanr": 0.4849163929338027,
-      "eval_steps_per_second": 52.84,
       "step": 18
     }
   ],
   "logging_steps": 500,
-  "max_steps": 45,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 5,
   "save_steps": 500,
   "total_flos": 0,
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
-    "learning_rate": 4.481764265618048e-05,
-    "num_train_epochs": 5,
     "per_device_train_batch_size": 64,
-    "seed": 34
   }
 }

 {
+  "best_metric": 0.8721480853088006,
+  "best_model_checkpoint": "distilbert-base-uncased-finetuned-stsb/run-0/checkpoint-9",
   "epoch": 2.0,
   "eval_steps": 500,
   "global_step": 18,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_loss": 0.5447242259979248,
+      "eval_pearson": 0.8721480853088006,
+      "eval_runtime": 0.7832,
+      "eval_samples_per_second": 1915.272,
+      "eval_spearmanr": 0.8694199881300932,
+      "eval_steps_per_second": 120.024,
       "step": 9
     },
     {
       "epoch": 2.0,
+      "eval_loss": 0.5480599999427795,
+      "eval_pearson": 0.8721355234643248,
+      "eval_runtime": 0.7998,
+      "eval_samples_per_second": 1875.436,
+      "eval_spearmanr": 0.8693922461181149,
+      "eval_steps_per_second": 117.527,
       "step": 18
     }
   ],
   "logging_steps": 500,
+  "max_steps": 36,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 4,
   "save_steps": 500,
   "total_flos": 0,
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
+    "learning_rate": 3.1992432473500055e-06,
+    "num_train_epochs": 4,
     "per_device_train_batch_size": 64,
+    "seed": 25
   }
 }

run-0/checkpoint-18/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5c09fba38efbfaed97000a3a94d8c55aa1cde1316bbda4831aa4e5e1bd7ee7a7
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:f60e6fcaaa02ec39d4a651a97e61c3bf1d26dfb974d7e291de6d7d5b31621d03
 size 4920

run-0/checkpoint-27/config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "distilbert-base-uncased",
   "activation": "gelu",
   "architectures": [
     "DistilBertForSequenceClassification"

 {
+  "_name_or_path": "SjardiWillems/distilbert-base-uncased-finetuned-stsb",
   "activation": "gelu",
   "architectures": [
     "DistilBertForSequenceClassification"

run-0/checkpoint-27/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8be6f6fa0df4bfbbbfda08cce877b6e7e3b0283edbd2c7b75f7df9bb5286c0b1
 size 267829484

 version https://git-lfs.github.com/spec/v1
+oid sha256:57f7a07c1063c508b3d228e052775539361edffa3120f7ec8c441a206bd36e17
 size 267829484

run-0/checkpoint-27/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a8b66082d319b2338bcfea10c929a0420129fc6863b06548d301048bdc23bd87
 size 535721146

 version https://git-lfs.github.com/spec/v1
+oid sha256:049cb4ad328db832910db524db19174e82c3790dee996e2b4e5635e3017e549a
 size 535721146

run-0/checkpoint-27/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a8d52213f53e08ff3d1242d3153448b0b10804720396a2908b09ce5eb6baf816
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:94416933a34c33d9dc264b88e08186868fbfdcbbebdbe57b68f97fb4f5001a76
 size 14244

run-0/checkpoint-27/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d5e15d089373332dccb9316de3e868ab812d210567758f27a5c51bef54f05aa9
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:9711e1024fc5d0c4ccaf04a6f24bb39779ce3008a416334c416310f1561eb05c
 size 1064

run-0/checkpoint-27/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.6914272738462158,
-  "best_model_checkpoint": "distilbert-base-uncased-finetuned-stsb/run-0/checkpoint-27",
   "epoch": 3.0,
   "eval_steps": 500,
   "global_step": 27,
@@ -10,47 +10,47 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_loss": 2.302802324295044,
-      "eval_pearson": 0.11274566771797583,
-      "eval_runtime": 0.9178,
-      "eval_samples_per_second": 1634.281,
-      "eval_spearmanr": 0.12987920930990302,
-      "eval_steps_per_second": 102.415,
       "step": 9
     },
     {
       "epoch": 2.0,
-      "eval_loss": 2.3637888431549072,
-      "eval_pearson": 0.4951149744376661,
-      "eval_runtime": 1.7789,
-      "eval_samples_per_second": 843.198,
-      "eval_spearmanr": 0.4849163929338027,
-      "eval_steps_per_second": 52.84,
       "step": 18
     },
     {
       "epoch": 3.0,
-      "eval_loss": 1.796323537826538,
-      "eval_pearson": 0.6914272738462158,
-      "eval_runtime": 2.2193,
-      "eval_samples_per_second": 675.895,
-      "eval_spearmanr": 0.6818774421011495,
-      "eval_steps_per_second": 42.356,
       "step": 27
     }
   ],
   "logging_steps": 500,
-  "max_steps": 45,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 5,
   "save_steps": 500,
   "total_flos": 0,
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
-    "learning_rate": 4.481764265618048e-05,
-    "num_train_epochs": 5,
     "per_device_train_batch_size": 64,
-    "seed": 34
   }
 }

 {
+  "best_metric": 0.8721480853088006,
+  "best_model_checkpoint": "distilbert-base-uncased-finetuned-stsb/run-0/checkpoint-9",
   "epoch": 3.0,
   "eval_steps": 500,
   "global_step": 27,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_loss": 0.5447242259979248,
+      "eval_pearson": 0.8721480853088006,
+      "eval_runtime": 0.7832,
+      "eval_samples_per_second": 1915.272,
+      "eval_spearmanr": 0.8694199881300932,
+      "eval_steps_per_second": 120.024,
       "step": 9
     },
     {
       "epoch": 2.0,
+      "eval_loss": 0.5480599999427795,
+      "eval_pearson": 0.8721355234643248,
+      "eval_runtime": 0.7998,
+      "eval_samples_per_second": 1875.436,
+      "eval_spearmanr": 0.8693922461181149,
+      "eval_steps_per_second": 117.527,
       "step": 18
     },
     {
       "epoch": 3.0,
+      "eval_loss": 0.5524753332138062,
+      "eval_pearson": 0.8720958832456878,
+      "eval_runtime": 0.8181,
+      "eval_samples_per_second": 1833.518,
+      "eval_spearmanr": 0.8692888421323478,
+      "eval_steps_per_second": 114.9,
       "step": 27
     }
   ],
   "logging_steps": 500,
+  "max_steps": 36,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 4,
   "save_steps": 500,
   "total_flos": 0,
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
+    "learning_rate": 3.1992432473500055e-06,
+    "num_train_epochs": 4,
     "per_device_train_batch_size": 64,
+    "seed": 25
   }
 }

run-0/checkpoint-27/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5c09fba38efbfaed97000a3a94d8c55aa1cde1316bbda4831aa4e5e1bd7ee7a7
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:f60e6fcaaa02ec39d4a651a97e61c3bf1d26dfb974d7e291de6d7d5b31621d03
 size 4920

run-0/checkpoint-36/config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "distilbert-base-uncased",
   "activation": "gelu",
   "architectures": [
     "DistilBertForSequenceClassification"

 {
+  "_name_or_path": "SjardiWillems/distilbert-base-uncased-finetuned-stsb",
   "activation": "gelu",
   "architectures": [
     "DistilBertForSequenceClassification"

run-0/checkpoint-36/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4970e9ff8f9a3040577b0049ae497296e6987a30fac9b1978c983f913df74fa5
 size 267829484

 version https://git-lfs.github.com/spec/v1
+oid sha256:99130246f850b335d16368056f449bcf22e5f0ac4608fd37c6ce45301896260e
 size 267829484

run-0/checkpoint-36/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8139b1565518d5a05b7de8a7feebaf2491cddb1d6df45d777067b9c734fa147a
 size 535721146

 version https://git-lfs.github.com/spec/v1
+oid sha256:3444f61430e39e85436c8651941ccf15a7102ca6e0df3e906b7bb1a59cda6a38
 size 535721146

run-0/checkpoint-36/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bab4519567a43826cccf1e52a5b955644cdaddb11d27e410800b049731a6001b
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:eb8170a1ecebb86f83c3c63adfe7ec6b60b173d1e2760643f11a339ed5fc9145
 size 14244

run-0/checkpoint-36/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b82dab0331e4c7b81b892b8fe9731b1b085524364be8bf73cf5a4d037bc735a6
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:8bc4e4a4c4c97266dd280160c5cbd6b7a2031b23f141764dcc7d3246e73dd9ab
 size 1064

run-0/checkpoint-36/trainer_state.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "best_metric": 0.7636700196702717,
-  "best_model_checkpoint": "distilbert-base-uncased-finetuned-stsb/run-0/checkpoint-36",
   "epoch": 4.0,
   "eval_steps": 500,
   "global_step": 36,
@@ -10,57 +10,57 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_loss": 2.302802324295044,
-      "eval_pearson": 0.11274566771797583,
-      "eval_runtime": 0.9178,
-      "eval_samples_per_second": 1634.281,
-      "eval_spearmanr": 0.12987920930990302,
-      "eval_steps_per_second": 102.415,
       "step": 9
     },
     {
       "epoch": 2.0,
-      "eval_loss": 2.3637888431549072,
-      "eval_pearson": 0.4951149744376661,
-      "eval_runtime": 1.7789,
-      "eval_samples_per_second": 843.198,
-      "eval_spearmanr": 0.4849163929338027,
-      "eval_steps_per_second": 52.84,
       "step": 18
     },
     {
       "epoch": 3.0,
-      "eval_loss": 1.796323537826538,
-      "eval_pearson": 0.6914272738462158,
-      "eval_runtime": 2.2193,
-      "eval_samples_per_second": 675.895,
-      "eval_spearmanr": 0.6818774421011495,
-      "eval_steps_per_second": 42.356,
       "step": 27
     },
     {
       "epoch": 4.0,
-      "eval_loss": 1.0367522239685059,
-      "eval_pearson": 0.7636700196702717,
-      "eval_runtime": 1.9263,
-      "eval_samples_per_second": 778.713,
-      "eval_spearmanr": 0.7608002745735356,
-      "eval_steps_per_second": 48.799,
       "step": 36
     }
   ],
   "logging_steps": 500,
-  "max_steps": 45,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 5,
   "save_steps": 500,
   "total_flos": 0,
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
-    "learning_rate": 4.481764265618048e-05,
-    "num_train_epochs": 5,
     "per_device_train_batch_size": 64,
-    "seed": 34
   }
 }

 {
+  "best_metric": 0.8721480853088006,
+  "best_model_checkpoint": "distilbert-base-uncased-finetuned-stsb/run-0/checkpoint-9",
   "epoch": 4.0,
   "eval_steps": 500,
   "global_step": 36,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_loss": 0.5447242259979248,
+      "eval_pearson": 0.8721480853088006,
+      "eval_runtime": 0.7832,
+      "eval_samples_per_second": 1915.272,
+      "eval_spearmanr": 0.8694199881300932,
+      "eval_steps_per_second": 120.024,
       "step": 9
     },
     {
       "epoch": 2.0,
+      "eval_loss": 0.5480599999427795,
+      "eval_pearson": 0.8721355234643248,
+      "eval_runtime": 0.7998,
+      "eval_samples_per_second": 1875.436,
+      "eval_spearmanr": 0.8693922461181149,
+      "eval_steps_per_second": 117.527,
       "step": 18
     },
     {
       "epoch": 3.0,
+      "eval_loss": 0.5524753332138062,
+      "eval_pearson": 0.8720958832456878,
+      "eval_runtime": 0.8181,
+      "eval_samples_per_second": 1833.518,
+      "eval_spearmanr": 0.8692888421323478,
+      "eval_steps_per_second": 114.9,
       "step": 27
     },
     {
       "epoch": 4.0,
+      "eval_loss": 0.551840603351593,
+      "eval_pearson": 0.8720820978778318,
+      "eval_runtime": 0.8121,
+      "eval_samples_per_second": 1847.035,
+      "eval_spearmanr": 0.8692799150799397,
+      "eval_steps_per_second": 115.748,
       "step": 36
     }
   ],
   "logging_steps": 500,
+  "max_steps": 36,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 4,
   "save_steps": 500,
   "total_flos": 0,
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
+    "learning_rate": 3.1992432473500055e-06,
+    "num_train_epochs": 4,
     "per_device_train_batch_size": 64,
+    "seed": 25
   }
 }

run-0/checkpoint-36/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5c09fba38efbfaed97000a3a94d8c55aa1cde1316bbda4831aa4e5e1bd7ee7a7
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:f60e6fcaaa02ec39d4a651a97e61c3bf1d26dfb974d7e291de6d7d5b31621d03
 size 4920

run-0/checkpoint-9/config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "distilbert-base-uncased",
   "activation": "gelu",
   "architectures": [
     "DistilBertForSequenceClassification"

 {
+  "_name_or_path": "SjardiWillems/distilbert-base-uncased-finetuned-stsb",
   "activation": "gelu",
   "architectures": [
     "DistilBertForSequenceClassification"

run-0/checkpoint-9/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ed7607757531a0d94c65185f850961773e46fcb5d119d13e3863e3c032cea5c7
 size 267829484

 version https://git-lfs.github.com/spec/v1
+oid sha256:e39a74e3412b7ce246af399e46ae105919f882a446102bcaf23e220168790195
 size 267829484

run-0/checkpoint-9/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:56767472c0e4d4198194df7f7120021bd7533a01fa83803560f3bf641087884b
 size 535721146

 version https://git-lfs.github.com/spec/v1
+oid sha256:c08dd262e470e0524997cb67fb2e3a4c2db33dd0edd707187872dd19ba15a24d
 size 535721146

run-0/checkpoint-9/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0628cec758e075b259c6a730232907c8a667241d8e97a9db6dc34062350c612c
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:b1c477474348c1df62a9084b72b01c804768024f0fbdc61c346010f9d1b10922
 size 14244

run-0/checkpoint-9/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8d27024e44c494ad9fc8a5e273b59caa9e40de909254f40876c0dacfd47db5cf
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:2d63b663be8c07f0ce81b50e045f2c99645bc25fac3d7678962e0b549daa6a8a
 size 1064

run-0/checkpoint-9/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.11274566771797583,
   "best_model_checkpoint": "distilbert-base-uncased-finetuned-stsb/run-0/checkpoint-9",
   "epoch": 1.0,
   "eval_steps": 500,
@@ -10,27 +10,27 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_loss": 2.302802324295044,
-      "eval_pearson": 0.11274566771797583,
-      "eval_runtime": 0.9178,
-      "eval_samples_per_second": 1634.281,
-      "eval_spearmanr": 0.12987920930990302,
-      "eval_steps_per_second": 102.415,
       "step": 9
     }
   ],
   "logging_steps": 500,
-  "max_steps": 45,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 5,
   "save_steps": 500,
   "total_flos": 0,
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
-    "learning_rate": 4.481764265618048e-05,
-    "num_train_epochs": 5,
     "per_device_train_batch_size": 64,
-    "seed": 34
   }
 }

 {
+  "best_metric": 0.8721480853088006,
   "best_model_checkpoint": "distilbert-base-uncased-finetuned-stsb/run-0/checkpoint-9",
   "epoch": 1.0,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_loss": 0.5447242259979248,
+      "eval_pearson": 0.8721480853088006,
+      "eval_runtime": 0.7832,
+      "eval_samples_per_second": 1915.272,
+      "eval_spearmanr": 0.8694199881300932,
+      "eval_steps_per_second": 120.024,
       "step": 9
     }
   ],
   "logging_steps": 500,
+  "max_steps": 36,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 4,
   "save_steps": 500,
   "total_flos": 0,
   "train_batch_size": 64,
   "trial_name": null,
   "trial_params": {
+    "learning_rate": 3.1992432473500055e-06,
+    "num_train_epochs": 4,
     "per_device_train_batch_size": 64,
+    "seed": 25
   }
 }

run-0/checkpoint-9/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5c09fba38efbfaed97000a3a94d8c55aa1cde1316bbda4831aa4e5e1bd7ee7a7
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:f60e6fcaaa02ec39d4a651a97e61c3bf1d26dfb974d7e291de6d7d5b31621d03
 size 4920

run-1/checkpoint-18/config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "distilbert-base-uncased",
   "activation": "gelu",
   "architectures": [
     "DistilBertForSequenceClassification"

 {
+  "_name_or_path": "SjardiWillems/distilbert-base-uncased-finetuned-stsb",
   "activation": "gelu",
   "architectures": [
     "DistilBertForSequenceClassification"

run-1/checkpoint-18/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4530a8987afcc9341cc7563e3f5928ebbd7e33a6394892be9fb3ed2814e9ae01
 size 267829484

 version https://git-lfs.github.com/spec/v1
+oid sha256:4a25a8059c3029b9de30789699c137dc8b5ce341a94cb07d79ca20bf334b98b2
 size 267829484

run-1/checkpoint-18/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:89d8a3c21dddd5c4837a07b5d4d33ca418ac0cefddf3c3e641d7ed2d7c959ad7
 size 535721146

 version https://git-lfs.github.com/spec/v1
+oid sha256:11c39a820456e5835a872fdfc74c59117037bc93fba03a5357f8df563755d701
 size 535721146

run-1/checkpoint-18/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fecb2849d94555e25eddc7fc457dd09217fe0b8511a41e4b415e0d296de65cf9
-size 14180

 version https://git-lfs.github.com/spec/v1
+oid sha256:38d9c8211eaefc1de952192b16ec0ad898149980c1c189259271b0fe27693dff
+size 14244

run-1/checkpoint-18/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a0fcb701eb87535ed6005cd3531d8d7cd2516006d5a144652d4ab32a08c40df6
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:16e3964de5e9a4cac9c51d262db82d939d6ab3cbc33cf27a50e6f5d3f0cf52da
 size 1064

run-1/checkpoint-18/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.7009517245792942,
   "best_model_checkpoint": "distilbert-base-uncased-finetuned-stsb/run-1/checkpoint-18",
   "epoch": 1.0,
   "eval_steps": 500,
@@ -10,27 +10,27 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_loss": 1.5346204042434692,
-      "eval_pearson": 0.7009517245792942,
-      "eval_runtime": 0.7943,
-      "eval_samples_per_second": 1888.564,
-      "eval_spearmanr": 0.7023215368118,
-      "eval_steps_per_second": 118.35,
       "step": 18
     }
   ],
   "logging_steps": 500,
-  "max_steps": 90,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 5,
   "save_steps": 500,
   "total_flos": 0,
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": {
-    "learning_rate": 9.415997134117997e-05,
-    "num_train_epochs": 5,
     "per_device_train_batch_size": 32,
-    "seed": 10
   }
 }

 {
+  "best_metric": 0.8691249759376469,
   "best_model_checkpoint": "distilbert-base-uncased-finetuned-stsb/run-1/checkpoint-18",
   "epoch": 1.0,
   "eval_steps": 500,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_loss": 0.557124674320221,
+      "eval_pearson": 0.8691249759376469,
+      "eval_runtime": 0.7812,
+      "eval_samples_per_second": 1920.155,
+      "eval_spearmanr": 0.8666509292845571,
+      "eval_steps_per_second": 120.33,
       "step": 18
     }
   ],
   "logging_steps": 500,
+  "max_steps": 72,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 4,
   "save_steps": 500,
   "total_flos": 0,
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": {
+    "learning_rate": 7.44467340014099e-06,
+    "num_train_epochs": 4,
     "per_device_train_batch_size": 32,
+    "seed": 30
   }
 }

run-1/checkpoint-18/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:51a139e4fa7709c7bede3ad4026fd0ba3a4115364cd5d45e61fa50850707d74a
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:d8bbecda551ee7774c80dd57136f1f1d264226e7fa9fd5f1198bdad5c555c247
 size 4920

runs/Mar10_22-33-58_0f0a24039c15/events.out.tfevents.1710110166.0f0a24039c15.273.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:20da40305ac9cb0da0e16503277b2787835958cc23e488d4dc715582e182d309
+size 6531

runs/Mar10_22-33-58_0f0a24039c15/events.out.tfevents.1710110209.0f0a24039c15.273.3 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:70ff2b6dd32dda34d84eed876ca4506798f04db6ec7261b2cf9312b1fa41de9f
+size 6529

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5bf4c1b3c6d9255806c36a32a5c528952a786e3305f5919ac5d589bd0a204ae4
 size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:d8bbecda551ee7774c80dd57136f1f1d264226e7fa9fd5f1198bdad5c555c247
 size 4920