ArliAI
/

Llama-3.1-8B-ArliAI-RPMax-v1.1

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

OwenArli commited on Sep 8

Commit

8ba539a

•

1 Parent(s): 5eb47d8

Update README.md

Files changed (1) hide show

README.md +4 -0

README.md CHANGED Viewed

@@ -30,7 +30,11 @@ You can access the model at https://arliai.com and ask questions at https://www.
 The model is available in quantized formats:
 * **FP16**: https://huggingface.co/ArliAI/Llama-3.1-8B-ArliAI-RPMax-v1.1
 * **GGUF**: https://huggingface.co/ArliAI/Llama-3.1-8B-ArliAI-RPMax-v1.1-GGUF
 ## Suggested Prompt Format

 The model is available in quantized formats:
+We recommend using full weights or GPTQ
 * **FP16**: https://huggingface.co/ArliAI/Llama-3.1-8B-ArliAI-RPMax-v1.1
+* **GPTQ_Q4**: https://huggingface.co/ArliAI/Llama-3.1-8B-ArliAI-RPMax-v1.1-GPTQ_Q4
+* **GPTQ_Q8**: https://huggingface.co/ArliAI/Llama-3.1-8B-ArliAI-RPMax-v1.1-GPTQ_Q8
 * **GGUF**: https://huggingface.co/ArliAI/Llama-3.1-8B-ArliAI-RPMax-v1.1-GGUF
 ## Suggested Prompt Format