NoorNizar
/

Meta-Llama-3-8B-Instruct-WINT8

Text Generation

text-generation-inference

8-bit precision

compressed-tensors

Model card Files Files and versions Community

Meta-Llama-3-8B-Instruct-WINT8

Ctrl+K

Ctrl+K

1 contributor

History: 3 commits

NoorNizar's picture

Update model card (via --mco)

de4b46d verified 3 months ago

.gitattributes

1.57 kB

Upload 8-bit quantized weights via llmcompressor script 3 months ago
README.md

2.14 kB

Update model card (via --mco) 3 months ago
config.json

1.49 kB

Upload 8-bit quantized weights via llmcompressor script 3 months ago
generation_config.json

194 Bytes

Upload 8-bit quantized weights via llmcompressor script 3 months ago
model-00001-of-00002.safetensors

5 GB
LFS

Upload 8-bit quantized weights via llmcompressor script 3 months ago
model-00002-of-00002.safetensors

4.08 GB
LFS

Upload 8-bit quantized weights via llmcompressor script 3 months ago
model.safetensors.index.json

43.5 kB

Upload 8-bit quantized weights via llmcompressor script 3 months ago
recipe.yaml

244 Bytes

Upload 8-bit quantized weights via llmcompressor script 3 months ago
special_tokens_map.json

325 Bytes

Upload 8-bit quantized weights via llmcompressor script 3 months ago
tokenizer.json

17.2 MB
LFS

Upload 8-bit quantized weights via llmcompressor script 3 months ago
tokenizer_config.json

51 kB

Upload 8-bit quantized weights via llmcompressor script 3 months ago