NoorNizar
/

Llama-3.2-3B-Instruct-WINT8

Text Generation

text-generation-inference

8-bit precision

compressed-tensors

Model card Files Files and versions Community

Llama-3.2-3B-Instruct-WINT8

Ctrl+K

Ctrl+K

1 contributor

History: 8 commits

NoorNizar's picture

Update config.json

56a2e7b verified about 1 month ago

.gitattributes

1.57 kB

Upload 8-bit quantized weights via llmcompressor script about 1 month ago
README.md

2.12 kB

Upload 8-bit int quantized model via script about 1 month ago
config.json

1.65 kB

Update config.json about 1 month ago
generation_config.json

184 Bytes

Upload 8-bit int quantized model via script about 1 month ago
model-00001-of-00003.safetensors

4.98 GB
LFS

Upload 8-bit quantized weights via llmcompressor script about 1 month ago
model-00002-of-00003.safetensors

4.11 GB
LFS

Upload 8-bit quantized weights via llmcompressor script about 1 month ago
model-00003-of-00003.safetensors

2.1 GB
LFS

Upload 8-bit quantized weights via llmcompressor script about 1 month ago
model.safetensors

4.4 GB
LFS

Upload 8-bit int quantized model via script about 1 month ago
model.safetensors.index.json

43.5 kB

Upload 8-bit quantized weights via llmcompressor script about 1 month ago
recipe.yaml

244 Bytes

Upload 8-bit quantized weights via llmcompressor script about 1 month ago
special_tokens_map.json

325 Bytes

Upload 8-bit quantized weights via llmcompressor script about 1 month ago
tokenizer.json

17.2 MB
LFS

Upload 8-bit int quantized model via script about 1 month ago
tokenizer_config.json

54.6 kB

Upload 8-bit int quantized model via script about 1 month ago