keras
/

gpt2_extra_large_en

Text Generation

Model card Files Files and versions

mattdangerw commited on Dec 23, 2024

Commit

7a0598c

·

verified ·

1 Parent(s): 2cea611

Upload folder using huggingface_hub

Files changed (3) hide show

config.json +2 -4
metadata.json +6 -3
tokenizer.json +15 -9

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-    "module": "keras_nlp.src.models.gpt2.gpt2_backbone",
     "class_name": "GPT2Backbone",
     "config": {
         "name": "gpt2_backbone",
@@ -12,7 +12,5 @@
         "dropout": 0.1,
         "max_sequence_length": 1024
     },
-    "registered_name": "keras_nlp>GPT2Backbone",
-    "assets": [],
-    "weights": "model.weights.h5"
 }

 {
+    "module": "keras_hub.src.models.gpt2.gpt2_backbone",
     "class_name": "GPT2Backbone",
     "config": {
         "name": "gpt2_backbone",
         "dropout": 0.1,
         "max_sequence_length": 1024
     },
+    "registered_name": "keras_hub>GPT2Backbone"
 }

metadata.json CHANGED Viewed

@@ -1,6 +1,9 @@
 {
-    "keras_version": "3.0.1",
-    "keras_nlp_version": "0.7.0",
     "parameter_count": 1557611200,
-    "date_saved": "2023-12-27@02:11:27"
 }

 {
+    "keras_version": "3.7.0",
+    "keras_hub_version": "0.19.0",
     "parameter_count": 1557611200,
+    "date_saved": "2024-12-21@18:40:47",
+    "tasks": [
+        "CausalLM"
+    ]
 }

tokenizer.json CHANGED Viewed

@@ -1,17 +1,23 @@
 {
-    "module": "keras_nlp.src.models.gpt2.gpt2_tokenizer",
     "class_name": "GPT2Tokenizer",
     "config": {
         "name": "gpt2_tokenizer",
         "trainable": true,
-        "dtype": "int32",
         "sequence_length": null,
-        "add_prefix_space": false
     },
-    "registered_name": "keras_nlp>GPT2Tokenizer",
-    "assets": [
-        "assets/tokenizer/merges.txt",
-        "assets/tokenizer/vocabulary.json"
-    ],
-    "weights": null
 }

 {
+    "module": "keras_hub.src.models.gpt2.gpt2_tokenizer",
     "class_name": "GPT2Tokenizer",
     "config": {
         "name": "gpt2_tokenizer",
         "trainable": true,
+        "dtype": {
+            "module": "keras",
+            "class_name": "DTypePolicy",
+            "config": {
+                "name": "int32"
+            },
+            "registered_name": null
+        },
+        "config_file": "tokenizer.json",
         "sequence_length": null,
+        "add_prefix_space": false,
+        "unsplittable_tokens": [
+            "<|endoftext|>"
+        ]
     },
+    "registered_name": "keras_hub>GPT2Tokenizer"
 }