Model save

Browse files

Files changed (10) hide show

all_results.json +7 -7
eval_results.json +4 -4
model-00001-of-00003.safetensors +1 -1
model-00002-of-00003.safetensors +1 -1
model-00003-of-00003.safetensors +1 -1
runs/Nov09_02-07-37_ip-26-0-144-35/events.out.tfevents.1699495735.ip-26-0-144-35.317141.0 +3 -0
runs/Nov09_02-07-37_ip-26-0-144-35/events.out.tfevents.1699507701.ip-26-0-144-35.317141.1 +3 -0
train_results.json +3 -3
trainer_state.json +23 -23
training_args.bin +1 -1

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
     "epoch": 0.67,
-    "eval_loss": 0.9324695467948914,
-    "eval_runtime": 331.4133,
     "eval_samples": 23110,
-    "eval_samples_per_second": 69.732,
-    "eval_steps_per_second": 0.546,
-    "train_loss": 0.9717059337040957,
-    "train_runtime": 11636.4515,
     "train_samples": 207865,
-    "train_samples_per_second": 17.863,
     "train_steps_per_second": 0.035
 }

 {
     "epoch": 0.67,
+    "eval_loss": 0.9324741959571838,
+    "eval_runtime": 329.8618,
     "eval_samples": 23110,
+    "eval_samples_per_second": 70.06,
+    "eval_steps_per_second": 0.549,
+    "train_loss": 0.9717525305116878,
+    "train_runtime": 11635.2882,
     "train_samples": 207865,
+    "train_samples_per_second": 17.865,
     "train_steps_per_second": 0.035
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 0.67,
-    "eval_loss": 0.9324695467948914,
-    "eval_runtime": 331.4133,
     "eval_samples": 23110,
-    "eval_samples_per_second": 69.732,
-    "eval_steps_per_second": 0.546
 }

 {
     "epoch": 0.67,
+    "eval_loss": 0.9324741959571838,
+    "eval_runtime": 329.8618,
     "eval_samples": 23110,
+    "eval_samples_per_second": 70.06,
+    "eval_steps_per_second": 0.549
 }

model-00001-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7a5a9a3ba34e8a93479e3c32c586d97e5043895240fadfdf110fdaf2282cf0c8
 size 4943162336

 version https://git-lfs.github.com/spec/v1
+oid sha256:20e559f5bacc048426347855c065fe0ea22051e726980180fd355f08f23d3af7
 size 4943162336

model-00002-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:80aae64f36ee2cadee0cda2d2fe5ef705505a6280b13e1861f48813af6321f59
 size 4999819336

 version https://git-lfs.github.com/spec/v1
+oid sha256:6c12a664f67d2f8f80d64f6d37209fc3fc41757f8ad6dc3b40a83fd731d0bf84
 size 4999819336

model-00003-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6f5f730d4f2cb41c73c4b91d612e2231c8eed1bc47779f6ec3d324a27d76b195
 size 4540516344

 version https://git-lfs.github.com/spec/v1
+oid sha256:b65ce0fc315aa5f4c8d001e39730681c1111b74d6bc47761d5e943493c9075b8
 size 4540516344

runs/Nov09_02-07-37_ip-26-0-144-35/events.out.tfevents.1699495735.ip-26-0-144-35.317141.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7c214dfb70cb5cad55741b0942a5a9f02f54b203d012ead4aea864b49e555ef3
+size 13396

runs/Nov09_02-07-37_ip-26-0-144-35/events.out.tfevents.1699507701.ip-26-0-144-35.317141.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:38f305950c24021ebd4b4c8ebc937d3370450e9fb7845f6bbd8bdb55aad6dca4
+size 359

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 0.67,
-    "train_loss": 0.9717059337040957,
-    "train_runtime": 11636.4515,
     "train_samples": 207865,
-    "train_samples_per_second": 17.863,
     "train_steps_per_second": 0.035
 }

 {
     "epoch": 0.67,
+    "train_loss": 0.9717525305116878,
+    "train_runtime": 11635.2882,
     "train_samples": 207865,
+    "train_samples_per_second": 17.865,
     "train_steps_per_second": 0.035
 }

trainer_state.json CHANGED Viewed

@@ -23,43 +23,43 @@
     {
       "epoch": 0.02,
       "learning_rate": 1.997007728639956e-05,
-      "loss": 1.1489,
       "step": 10
     },
     {
       "epoch": 0.04,
       "learning_rate": 1.9932715879473385e-05,
-      "loss": 1.0705,
       "step": 15
     },
     {
       "epoch": 0.05,
       "learning_rate": 1.9880488219356086e-05,
-      "loss": 1.0486,
       "step": 20
     },
     {
       "epoch": 0.06,
       "learning_rate": 1.981347247496222e-05,
-      "loss": 1.0137,
       "step": 25
     },
     {
       "epoch": 0.07,
       "learning_rate": 1.973176894846855e-05,
-      "loss": 0.9985,
       "step": 30
     },
     {
       "epoch": 0.09,
       "learning_rate": 1.963549992519223e-05,
-      "loss": 0.9962,
       "step": 35
     },
     {
       "epoch": 0.1,
       "learning_rate": 1.9524809490566878e-05,
-      "loss": 0.9805,
       "step": 40
     },
     {
@@ -77,7 +77,7 @@
     {
       "epoch": 0.14,
       "learning_rate": 1.910797282022027e-05,
-      "loss": 0.9725,
       "step": 55
     },
     {
@@ -95,13 +95,13 @@
     {
       "epoch": 0.17,
       "learning_rate": 1.8568571761675893e-05,
-      "loss": 0.9532,
       "step": 70
     },
     {
       "epoch": 0.18,
       "learning_rate": 1.8362743705288127e-05,
-      "loss": 0.9606,
       "step": 75
     },
     {
@@ -113,7 +113,7 @@
     {
       "epoch": 0.21,
       "learning_rate": 1.791386494010081e-05,
-      "loss": 0.9642,
       "step": 85
     },
     {
@@ -179,13 +179,13 @@
     {
       "epoch": 0.34,
       "learning_rate": 1.4684084406997903e-05,
-      "loss": 0.9428,
       "step": 140
     },
     {
       "epoch": 0.36,
       "learning_rate": 1.4338837391175582e-05,
-      "loss": 0.9486,
       "step": 145
     },
     {
@@ -215,7 +215,7 @@
     {
       "epoch": 0.42,
       "learning_rate": 1.252585165803135e-05,
-      "loss": 0.9464,
       "step": 170
     },
     {
@@ -239,7 +239,7 @@
     {
       "epoch": 0.47,
       "learning_rate": 1.1004233054136726e-05,
-      "loss": 0.9422,
       "step": 190
     },
     {
@@ -269,7 +269,7 @@
     {
       "epoch": 0.53,
       "learning_rate": 9.072784204417995e-06,
-      "loss": 0.9461,
       "step": 215
     },
     {
@@ -340,19 +340,19 @@
     },
     {
       "epoch": 0.67,
-      "eval_loss": 0.9323223233222961,
-      "eval_runtime": 337.1471,
-      "eval_samples_per_second": 68.546,
-      "eval_steps_per_second": 0.537,
       "step": 272
     },
     {
       "epoch": 0.67,
       "step": 272,
       "total_flos": 455322233733120.0,
-      "train_loss": 0.9717059337040957,
-      "train_runtime": 11636.4515,
-      "train_samples_per_second": 17.863,
       "train_steps_per_second": 0.035
     }
   ],

     {
       "epoch": 0.02,
       "learning_rate": 1.997007728639956e-05,
+      "loss": 1.1492,
       "step": 10
     },
     {
       "epoch": 0.04,
       "learning_rate": 1.9932715879473385e-05,
+      "loss": 1.0712,
       "step": 15
     },
     {
       "epoch": 0.05,
       "learning_rate": 1.9880488219356086e-05,
+      "loss": 1.0494,
       "step": 20
     },
     {
       "epoch": 0.06,
       "learning_rate": 1.981347247496222e-05,
+      "loss": 1.0139,
       "step": 25
     },
     {
       "epoch": 0.07,
       "learning_rate": 1.973176894846855e-05,
+      "loss": 0.9987,
       "step": 30
     },
     {
       "epoch": 0.09,
       "learning_rate": 1.963549992519223e-05,
+      "loss": 0.9963,
       "step": 35
     },
     {
       "epoch": 0.1,
       "learning_rate": 1.9524809490566878e-05,
+      "loss": 0.9806,
       "step": 40
     },
     {
     {
       "epoch": 0.14,
       "learning_rate": 1.910797282022027e-05,
+      "loss": 0.9726,
       "step": 55
     },
     {
     {
       "epoch": 0.17,
       "learning_rate": 1.8568571761675893e-05,
+      "loss": 0.9533,
       "step": 70
     },
     {
       "epoch": 0.18,
       "learning_rate": 1.8362743705288127e-05,
+      "loss": 0.9607,
       "step": 75
     },
     {
     {
       "epoch": 0.21,
       "learning_rate": 1.791386494010081e-05,
+      "loss": 0.9643,
       "step": 85
     },
     {
     {
       "epoch": 0.34,
       "learning_rate": 1.4684084406997903e-05,
+      "loss": 0.9427,
       "step": 140
     },
     {
       "epoch": 0.36,
       "learning_rate": 1.4338837391175582e-05,
+      "loss": 0.9485,
       "step": 145
     },
     {
     {
       "epoch": 0.42,
       "learning_rate": 1.252585165803135e-05,
+      "loss": 0.9463,
       "step": 170
     },
     {
     {
       "epoch": 0.47,
       "learning_rate": 1.1004233054136726e-05,
+      "loss": 0.9421,
       "step": 190
     },
     {
     {
       "epoch": 0.53,
       "learning_rate": 9.072784204417995e-06,
+      "loss": 0.9462,
       "step": 215
     },
     {
     },
     {
       "epoch": 0.67,
+      "eval_loss": 0.932327389717102,
+      "eval_runtime": 335.4717,
+      "eval_samples_per_second": 68.888,
+      "eval_steps_per_second": 0.54,
       "step": 272
     },
     {
       "epoch": 0.67,
       "step": 272,
       "total_flos": 455322233733120.0,
+      "train_loss": 0.9717525305116878,
+      "train_runtime": 11635.2882,
+      "train_samples_per_second": 17.865,
       "train_steps_per_second": 0.035
     }
   ],

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9d36e932256b4bf120a53214b3521b397d76398deb28d40b0620d488061c0d60
 size 5179

 version https://git-lfs.github.com/spec/v1
+oid sha256:f71ca7f71743b3a6bdbe97c61df987f92fb4922a63571f5a765dc7d768f13928
 size 5179