Qwen
/

Qwen3-32B-FP8

Text Generation

text-generation-inference

Model card Files Files and versions

Commit History

Update README.md

c2d5a15
verified

littlebird13 commited on May 21

update tokenizer_config.json

d0a17c0

feihu.hf commited on May 19

Remove vLLM FP8 Limitation (#3)

98a6390
verified

simon-mo commited on Apr 30

Update README.md

37f3f67
verified

yangapku commited on Apr 29

Update README.md

6e71f0f
verified

yangapku commited on Apr 28

Update README.md

48dd627
verified

littlebird13 commited on Apr 28

Update README.md

6913646
verified

jklj077 commited on Apr 28

Delete special_tokens_map.json

dcadc0d
verified

littlebird13 commited on Apr 28

Delete added_tokens.json

87b3d4d
verified

littlebird13 commited on Apr 28

Update README.md

49e5bc4
verified

littlebird13 commited on Apr 28

Update generation_config.json

3ca9f67
verified

littlebird13 commited on Apr 28

Update README.md

8404e43
verified

littlebird13 commited on Apr 28

Upload folder using huggingface_hub

6e2312b
verified

littlebird13 commited on Apr 28

initial commit

36c62d7
verified

littlebird13 commited on Apr 28