End of training

Files changed (8) hide show

.gitattributes CHANGED Viewed

@@ -30,3 +30,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+model.safetensors filter=lfs diff=lfs merge=lfs -text

README.md CHANGED Viewed

@@ -1,5 +1,6 @@
 ---
 license: apache-2.0
 tags:
 - generated_from_trainer
 model-index:
@@ -14,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [distilgpt2](https://huggingface.co/distilgpt2) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 3.9043
 ## Model description
@@ -45,14 +46,14 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| No log        | 1.0   | 25   | 3.9350          |
-| No log        | 2.0   | 50   | 3.9107          |
-| No log        | 3.0   | 75   | 3.9043          |
 ### Framework versions
-- Transformers 4.23.1
-- Pytorch 1.12.1+cu113
-- Datasets 2.5.2
-- Tokenizers 0.13.1

 ---
 license: apache-2.0
+base_model: distilgpt2
 tags:
 - generated_from_trainer
 model-index:
 This model is a fine-tuned version of [distilgpt2](https://huggingface.co/distilgpt2) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 3.8283
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 3.9484        | 1.0   | 1321 | 3.8403          |
+| 3.8458        | 2.0   | 2642 | 3.8302          |
+| 3.8048        | 3.0   | 3963 | 3.8283          |
 ### Framework versions
+- Transformers 4.35.2
+- Pytorch 2.1.0+cu121
+- Datasets 2.16.1
+- Tokenizers 0.15.1

config.json CHANGED Viewed

@@ -40,7 +40,7 @@
     }
   },
   "torch_dtype": "float32",
-  "transformers_version": "4.23.1",
   "use_cache": true,
   "vocab_size": 50257
 }

     }
   },
   "torch_dtype": "float32",
+  "transformers_version": "4.35.2",
   "use_cache": true,
   "vocab_size": 50257
 }

generation_config.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
-  "do_sample": true,
   "eos_token_id": 50256,
-  "max_new_tokens": 50,
-  "transformers_version": "4.25.1"
 }

 {
+  "_from_model_config": true,
+  "bos_token_id": 50256,
   "eos_token_id": 50256,
+  "transformers_version": "4.35.2"
 }

model.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:0b1ef6fb0d840c329fad1aaf481c146ba2d99662c4f492f7a77edef289acd49d
+size 327657928

runs/Jan25_22-46-54_39d8ef62d37f/events.out.tfevents.1706222815.39d8ef62d37f.274.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:4f662f88f53ddfc2aeabfad2c6fb00f0ba9acb956cbcb600c7366db04760365b
+size 6843

runs/Jan25_22-46-54_39d8ef62d37f/events.out.tfevents.1706223749.39d8ef62d37f.274.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:922f21d1bfb934ebd74aa40cd876c6cae69d379cdb1bd41ee86a77b657aff110
+size 359

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:deb6b976ef304b497c0f2a026c9000efb0f31aabe0753ad853141a9481f0cf17
-size 3375

 version https://git-lfs.github.com/spec/v1
+oid sha256:e8ca1dba5a796132a21a5ceb6c72c3000596c831168a0201370cfb007a0d8b9d
+size 4600