NoorNizar
/

Llama-3.2-3B-Instruct-WINT4

Text Generation

text-generation-inference

8-bit precision

compressed-tensors

Model card Files Files and versions Community

Llama-3.2-3B-Instruct-WINT4

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

NoorNizar's picture

Upload 4-bit int quantized model via script

c0cf7ad verified 21 days ago

.gitattributes

1.57 kB

Upload 4-bit int quantized model via script 21 days ago
README.md

2.12 kB

Upload 4-bit int quantized model via script 21 days ago
config.json

1.67 kB

Upload 4-bit int quantized model via script 21 days ago
generation_config.json

184 Bytes

Upload 4-bit int quantized model via script 21 days ago
model.safetensors

4.4 GB
LFS

Upload 4-bit int quantized model via script 21 days ago
recipe.yaml

244 Bytes

Upload 4-bit int quantized model via script 21 days ago
special_tokens_map.json

325 Bytes

Upload 4-bit int quantized model via script 21 days ago
tokenizer.json

17.2 MB
LFS

Upload 4-bit int quantized model via script 21 days ago
tokenizer_config.json

54.6 kB

Upload 4-bit int quantized model via script 21 days ago