operablepattern
/

gemma-2b-it-Q

Text Generation

Inference Endpoints

Model card Files Files and versions Community

gemma-2b-it-Q / README.md

operablepattern's picture

operablepattern

Update README.md

bef64c8 verified 8 months ago

|

history blame contribute delete

706 Bytes

	---
	license: other
	license_name: gemma-terms-of-use
	license_link: https://ai.google.dev/gemma/terms
	---

	This repository contains gemma 2B models quantized using llama.cpp.

	For details of the model see https://huggingface.co/google/gemma-2b-it.

	Details of the k-quants can be found here: https://github.com/ggerganov/llama.cpp/pull/1684

	## Provided files

	\| Name \| Quant method \| Bits \| Size \|
	\| ---- \| ---- \| ---- \| ---- \|
	\| [gemma-2b-it-Q4_K_M.gguf](https://huggingface.co/operablepattern/gemma-2b-it-Q/blob/main/gemma-2b-it-Q4_K_M.gguf) \| Q4_K_M \| 4 \| 1.63 GB\|
	\| [gemma-2b-it-Q5_K_M.gguf](https://huggingface.co/operablepattern/gemma-2b-it-Q/blob/main/gemma-2b-it-Q5_K_M.gguf) \| Q5_K_M \| 5 \| 1.84 GB\|