Upload folder using huggingface_hub

Browse files

Files changed (8) hide show

config.json +1 -2
generation_config.json +1 -1
onnx/decoder_model_merged.onnx +1 -1
onnx/decoder_model_merged_quantized.onnx +2 -2
onnx/decoder_model_quantized.onnx +2 -2
onnx/decoder_with_past_model_quantized.onnx +2 -2
onnx/encoder_model_quantized.onnx +2 -2
quant_config.json +89 -0

config.json CHANGED Viewed

@@ -139,8 +139,7 @@
     50360,
     50361
   ],
-  "torch_dtype": "float32",
-  "transformers_version": "4.29.2",
   "use_cache": true,
   "use_weighted_layer_sum": false,
   "vocab_size": 51864

     50360,
     50361
   ],
+  "transformers_version": "4.30.2",
   "use_cache": true,
   "use_weighted_layer_sum": false,
   "vocab_size": 51864

generation_config.json CHANGED Viewed

@@ -110,5 +110,5 @@
     50360,
     50361
   ],
-  "transformers_version": "4.29.2"
 }

     50360,
     50361
   ],
+  "transformers_version": "4.30.2"
 }

onnx/decoder_model_merged.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:779d5e8b901ffefae8d8f6e289081a79501d2af7afae1e86048b6c1218b95f12
 size 314706485

 version https://git-lfs.github.com/spec/v1
+oid sha256:b86d63f0644a5df4c335edddfc8c52feb1377bdffa6927f587506c609e409077
 size 314706485

onnx/decoder_model_merged_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cba9300ac67addfd76033fc395a6b7449a024bdda955eb3e2a830932fde6ba3b
-size 80630991

 version https://git-lfs.github.com/spec/v1
+oid sha256:95c3939f7b64dedfea7bff57264c1635bbcf6dace6837bafc6da3167bcdc8211
+size 80171680

onnx/decoder_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e371e69760f78464236aebedef51907ff30d1039f6a7b91b79ea702cf8207a40
-size 80281155

 version https://git-lfs.github.com/spec/v1
+oid sha256:6cc9146e51bebedcb6f2fdbdb3e6f4544aa4d99d49032fe3421c87497d340f95
+size 79821844

onnx/decoder_with_past_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e8911b5725dc6008a010d08ededd0d64e612138bd71e8fce591f928e0ede9e38
-size 77024457

 version https://git-lfs.github.com/spec/v1
+oid sha256:835b6873332400f93027d88c8a38dd089f9489a34c78954467aa7bb16894e927
+size 76595926

onnx/encoder_model_quantized.onnx CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2e5c7694b53a299a30beb6c6b9b4934f814cf3382bec0957b612ee0934b78858
-size 23321703

 version https://git-lfs.github.com/spec/v1
+oid sha256:7dc3dace4e873e8d62b34fa0524b9d26198eebb06b6282785716cbd53c853026
+size 23183306

quant_config.json ADDED Viewed

	@@ -0,0 +1,89 @@

+{
+    "per_channel": false,
+    "reduce_range": false,
+    "per_model_config": {
+        "encoder_model": {
+            "op_types": [
+                "Reshape",
+                "Shape",
+                "Unsqueeze",
+                "Div",
+                "Sub",
+                "Erf",
+                "Gather",
+                "Sqrt",
+                "Concat",
+                "Add",
+                "MatMul",
+                "Constant",
+                "Pow",
+                "ReduceMean",
+                "Transpose",
+                "Mul",
+                "Softmax",
+                "Conv"
+            ],
+            "weight_type": "QUInt8"
+        },
+        "decoder_model": {
+            "op_types": [
+                "Erf",
+                "Gather",
+                "Cast",
+                "ConstantOfShape",
+                "Transpose",
+                "Reshape",
+                "Sqrt",
+                "Softmax",
+                "Mul",
+                "Concat",
+                "Unsqueeze",
+                "Where",
+                "Less",
+                "MatMul",
+                "Slice",
+                "Shape",
+                "Range",
+                "Div",
+                "Squeeze",
+                "Add",
+                "Expand",
+                "Constant",
+                "Pow",
+                "Equal",
+                "ReduceMean",
+                "Sub"
+            ],
+            "weight_type": "QInt8"
+        },
+        "decoder_model_merged": {
+            "op_types": [
+                "If"
+            ],
+            "weight_type": "QInt8"
+        },
+        "decoder_with_past_model": {
+            "op_types": [
+                "Reshape",
+                "Shape",
+                "Unsqueeze",
+                "Div",
+                "Erf",
+                "Gather",
+                "Sqrt",
+                "Add",
+                "MatMul",
+                "Constant",
+                "Slice",
+                "Pow",
+                "ReduceMean",
+                "Sub",
+                "Mul",
+                "Softmax",
+                "Transpose",
+                "Concat"
+            ],
+            "weight_type": "QInt8"
+        }
+    }
+}