NoorNizar
/

Meta-Llama-3-8B-Instruct-WFP8

Text Generation

text-generation-inference

compressed-tensors

Model card Files Files and versions Community

Meta-Llama-3-8B-Instruct-WFP8

Ctrl+K

Ctrl+K

1 contributor

History: 3 commits

NoorNizar's picture

Upload 8-bit float quantized model via script

1917b2b verified about 1 month ago

.gitattributes

1.57 kB

Upload 8-bit quantized weights via llmcompressor script about 1 month ago
README.md

2.14 kB

Upload 8-bit float quantized model via script about 1 month ago
config.json

1.49 kB

Upload 8-bit quantized weights via llmcompressor script about 1 month ago
generation_config.json

194 Bytes

Upload 8-bit quantized weights via llmcompressor script about 1 month ago
model-00001-of-00002.safetensors

5 GB
LFS

Upload 8-bit quantized weights via llmcompressor script about 1 month ago
model-00002-of-00002.safetensors

4.08 GB
LFS

Upload 8-bit quantized weights via llmcompressor script about 1 month ago
model.safetensors.index.json

43.5 kB

Upload 8-bit quantized weights via llmcompressor script about 1 month ago
recipe.yaml

246 Bytes

Upload 8-bit quantized weights via llmcompressor script about 1 month ago
special_tokens_map.json

325 Bytes

Upload 8-bit quantized weights via llmcompressor script about 1 month ago
tokenizer.json

17.2 MB
LFS

Upload 8-bit quantized weights via llmcompressor script about 1 month ago
tokenizer_config.json

51 kB

Upload 8-bit quantized weights via llmcompressor script about 1 month ago