best speed/perplexity quant for mobile devices with 8bit acceleration

Files changed (2) hide show

.gitattributes CHANGED Viewed

@@ -56,3 +56,4 @@ qwen7bv2inst_iq4xs_embedding8_outputq8.gguf filter=lfs diff=lfs merge=lfs -text
 qwen7bv2inst_Iq4xs_output6k.gguf filter=lfs diff=lfs merge=lfs -text
 qwen7bv2instruct_q8.gguf filter=lfs diff=lfs merge=lfs -text
 qwen7bv2inst_q4km_embeddingf16_outputf16.gguf filter=lfs diff=lfs merge=lfs -text

 qwen7bv2inst_Iq4xs_output6k.gguf filter=lfs diff=lfs merge=lfs -text
 qwen7bv2instruct_q8.gguf filter=lfs diff=lfs merge=lfs -text
 qwen7bv2inst_q4km_embeddingf16_outputf16.gguf filter=lfs diff=lfs merge=lfs -text
+qwen7bv2inst_iq4xs_output8bit.gguf filter=lfs diff=lfs merge=lfs -text

qwen7bv2_iq4xs_output8bit.gguf → qwen7bv2inst_iq4xs_output8bit.gguf RENAMED Viewed

File without changes