gptq 4bit

by myx0 - opened Apr 20, 2024

Discussion

myx0

Apr 20, 2024

А есть квантованая модель 4-5 бит, чтобы помещалась в 10 гигов video RAM?

xsa-dev

Apr 20, 2024

Привет

IlyaGusev

Owner Apr 20, 2024

https://huggingface.co/IlyaGusev/saiga_llama3_8b_gguf же. GPTQ версии нет, но её должно быть несложно сварить самостоятельно.

Silvelter

Apr 21, 2024

•

edited Apr 30, 2024

@myx0 Если есть желание использовать exllama то вот - https://huggingface.co/Slvcxc/saiga_llama3_8b-V4-8.0bpw-h8-exl2, правда в качестве особо не уверен, ибо ранее никогда не квантовал модели для русского языка.

IlyaGusev changed discussion status to closed Jul 3, 2024

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment