RedHatAI
/

TinyLlama-1.1B-Chat-v1.0-marlin

Text Generation

text-generation-inference

4-bit precision

Model card Files Files and versions Community

TinyLlama-1.1B-Chat-v1.0-marlin / quantization

Ctrl+K

Ctrl+K

2 contributors

History: 3 commits

robertgshaw2's picture

Update quantization/apply_gptq_save_marlin.py

29715d8 verified about 1 year ago

apply_gptq_save_marlin.py

2.2 kB

Update quantization/apply_gptq_save_marlin.py about 1 year ago
requirements.txt

52 Bytes

Create requirements.txt about 1 year ago