NoorNizar
/

Meta-Llama-3-8B-Instruct-WINT4

Text Generation

text-generation-inference

8-bit precision

compressed-tensors

Model card Files Files and versions Community

Meta-Llama-3-8B-Instruct-WINT4

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

NoorNizar's picture

Upload 4-bit int quantized model via script

7b76fa0 verified 21 days ago

.gitattributes

1.57 kB

Upload 4-bit int quantized model via script 21 days ago
README.md

2.14 kB

Upload 4-bit int quantized model via script 21 days ago
config.json

1.49 kB

Upload 4-bit int quantized model via script 21 days ago
generation_config.json

194 Bytes

Upload 4-bit int quantized model via script 21 days ago
model-00001-of-00002.safetensors

5 GB
LFS

Upload 4-bit int quantized model via script 21 days ago
model-00002-of-00002.safetensors

4.08 GB
LFS

Upload 4-bit int quantized model via script 21 days ago
model.safetensors.index.json

43.5 kB

Upload 4-bit int quantized model via script 21 days ago
recipe.yaml

244 Bytes

Upload 4-bit int quantized model via script 21 days ago
special_tokens_map.json

325 Bytes

Upload 4-bit int quantized model via script 21 days ago
tokenizer.json

17.2 MB
LFS

Upload 4-bit int quantized model via script 21 days ago
tokenizer_config.json

51 kB

Upload 4-bit int quantized model via script 21 days ago