bartowski commited on Jun 28

Commit

6c5900b

•

1 Parent(s): 4266152

Llamacpp quants

Browse files

Files changed (28) hide show

README.md +5 -3
gemma-2-27b-it-IQ2_M.gguf +2 -2
gemma-2-27b-it-IQ2_S.gguf +2 -2
gemma-2-27b-it-IQ2_XS.gguf +2 -2
gemma-2-27b-it-IQ3_M.gguf +2 -2
gemma-2-27b-it-IQ3_XS.gguf +2 -2
gemma-2-27b-it-IQ3_XXS.gguf +2 -2
gemma-2-27b-it-IQ4_XS.gguf +2 -2
gemma-2-27b-it-Q2_K.gguf +2 -2
gemma-2-27b-it-Q2_K_L.gguf +2 -2
gemma-2-27b-it-Q3_K_L.gguf +2 -2
gemma-2-27b-it-Q3_K_M.gguf +2 -2
gemma-2-27b-it-Q3_K_S.gguf +2 -2
gemma-2-27b-it-Q3_K_XL.gguf +2 -2
gemma-2-27b-it-Q4_K_L.gguf +2 -2
gemma-2-27b-it-Q4_K_M.gguf +2 -2
gemma-2-27b-it-Q4_K_S.gguf +2 -2
gemma-2-27b-it-Q5_K_L.gguf +2 -2
gemma-2-27b-it-Q5_K_M.gguf +2 -2
gemma-2-27b-it-Q5_K_S.gguf +2 -2
gemma-2-27b-it-Q6_K.gguf +2 -2
gemma-2-27b-it-Q6_K_L.gguf +2 -2
gemma-2-27b-it-Q8_0.gguf +2 -2
gemma-2-27b-it-Q8_0_L.gguf +2 -2
gemma-2-27b-it-f32.gguf/gemma-2-27b-it-f32-00001-of-00003.gguf +2 -2
gemma-2-27b-it-f32.gguf/gemma-2-27b-it-f32-00002-of-00003.gguf +2 -2
gemma-2-27b-it-f32.gguf/gemma-2-27b-it-f32-00003-of-00003.gguf +2 -2
gemma-2-27b-it.imatrix +1 -1

README.md CHANGED Viewed

@@ -25,6 +25,8 @@ All quants made using imatrix option with dataset from [here](https://gist.githu
 <bos><start_of_turn>user
 {prompt}<end_of_turn>
 <start_of_turn>model
 ```
@@ -38,7 +40,7 @@ Note that this model does not support a System prompt.
 | [gemma-2-27b-it-Q8_0.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-Q8_0.gguf) | Q8_0 | 28.93GB | Extremely high quality, generally unneeded but max available quant. |
 | [gemma-2-27b-it-Q6_K_L.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-Q6_K_L.gguf) | Q6_K_L | 23.73GB | *Experimental*, uses f16 for embed and output weights. Please provide any feedback of differences. Very high quality, near perfect, *recommended*. |
 | [gemma-2-27b-it-Q6_K.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-Q6_K.gguf) | Q6_K | 22.34GB | Very high quality, near perfect, *recommended*. |
-| [gemma-2-27b-it-Q5_K_L.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-Q5_K_L.gguf) | Q5_K_L | 20.80GB | *Experimental*, uses f16 for embed and output weights. Please provide any feedback of differences. High quality, *recommended*. |
 | [gemma-2-27b-it-Q5_K_M.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-Q5_K_M.gguf) | Q5_K_M | 19.40GB | High quality, *recommended*. |
 | [gemma-2-27b-it-Q5_K_S.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-Q5_K_S.gguf) | Q5_K_S | 18.88GB | High quality, *recommended*. |
 | [gemma-2-27b-it-Q4_K_L.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-Q4_K_L.gguf) | Q4_K_L | 18.03GB | *Experimental*, uses f16 for embed and output weights. Please provide any feedback of differences. Good quality, uses about 4.83 bits per weight, *recommended*. |
@@ -52,10 +54,10 @@ Note that this model does not support a System prompt.
 | [gemma-2-27b-it-Q3_K_S.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-Q3_K_S.gguf) | Q3_K_S | 12.16GB | Low quality, not recommended. |
 | [gemma-2-27b-it-IQ3_XS.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-IQ3_XS.gguf) | IQ3_XS | 11.55GB | Lower quality, new method with decent performance, slightly better than Q3_K_S. |
 | [gemma-2-27b-it-IQ3_XXS.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-IQ3_XXS.gguf) | IQ3_XXS | 10.75GB | Lower quality, new method with decent performance, comparable to Q3 quants. |
-| [gemma-2-27b-it-Q2_K.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-Q2_K.gguf) | Q2_K | 10.45GB | Very low quality but surprisingly usable. |
 | [gemma-2-27b-it-IQ2_M.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-IQ2_M.gguf) | IQ2_M | 9.39GB | Very low quality, uses SOTA techniques to also be surprisingly usable. |
 | [gemma-2-27b-it-IQ2_S.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-IQ2_S.gguf) | IQ2_S | 8.65GB | Very low quality, uses SOTA techniques to be usable. |
-| [gemma-2-27b-it-IQ2_XS.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-IQ2_XS.gguf) | IQ2_XS | 8.40GB | Very low quality, uses SOTA techniques to be usable. |
 ## Downloading using huggingface-cli

 <bos><start_of_turn>user
 {prompt}<end_of_turn>
 <start_of_turn>model
+<end_of_turn>
+<start_of_turn>model
 ```
 | [gemma-2-27b-it-Q8_0.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-Q8_0.gguf) | Q8_0 | 28.93GB | Extremely high quality, generally unneeded but max available quant. |
 | [gemma-2-27b-it-Q6_K_L.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-Q6_K_L.gguf) | Q6_K_L | 23.73GB | *Experimental*, uses f16 for embed and output weights. Please provide any feedback of differences. Very high quality, near perfect, *recommended*. |
 | [gemma-2-27b-it-Q6_K.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-Q6_K.gguf) | Q6_K | 22.34GB | Very high quality, near perfect, *recommended*. |
+| [gemma-2-27b-it-Q5_K_L.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-Q5_K_L.gguf) | Q5_K_L | 20.79GB | *Experimental*, uses f16 for embed and output weights. Please provide any feedback of differences. High quality, *recommended*. |
 | [gemma-2-27b-it-Q5_K_M.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-Q5_K_M.gguf) | Q5_K_M | 19.40GB | High quality, *recommended*. |
 | [gemma-2-27b-it-Q5_K_S.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-Q5_K_S.gguf) | Q5_K_S | 18.88GB | High quality, *recommended*. |
 | [gemma-2-27b-it-Q4_K_L.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-Q4_K_L.gguf) | Q4_K_L | 18.03GB | *Experimental*, uses f16 for embed and output weights. Please provide any feedback of differences. Good quality, uses about 4.83 bits per weight, *recommended*. |
 | [gemma-2-27b-it-Q3_K_S.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-Q3_K_S.gguf) | Q3_K_S | 12.16GB | Low quality, not recommended. |
 | [gemma-2-27b-it-IQ3_XS.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-IQ3_XS.gguf) | IQ3_XS | 11.55GB | Lower quality, new method with decent performance, slightly better than Q3_K_S. |
 | [gemma-2-27b-it-IQ3_XXS.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-IQ3_XXS.gguf) | IQ3_XXS | 10.75GB | Lower quality, new method with decent performance, comparable to Q3 quants. |
+| [gemma-2-27b-it-Q2_K.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-Q2_K.gguf) | Q2_K | 10.44GB | Very low quality but surprisingly usable. |
 | [gemma-2-27b-it-IQ2_M.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-IQ2_M.gguf) | IQ2_M | 9.39GB | Very low quality, uses SOTA techniques to also be surprisingly usable. |
 | [gemma-2-27b-it-IQ2_S.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-IQ2_S.gguf) | IQ2_S | 8.65GB | Very low quality, uses SOTA techniques to be usable. |
+| [gemma-2-27b-it-IQ2_XS.gguf](https://huggingface.co/bartowski/gemma-2-27b-it-GGUF/blob/main/gemma-2-27b-it-IQ2_XS.gguf) | IQ2_XS | 8.39GB | Very low quality, uses SOTA techniques to be usable. |
 ## Downloading using huggingface-cli

gemma-2-27b-it-IQ2_M.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:210ba473aa5c402376fb2cc3a0aa64b08941edd62cfc4961f439945c7c7b9ab5
-size 9399287232

 version https://git-lfs.github.com/spec/v1
+oid sha256:2ac5e0423a14bd124310a9bbff4dfd2d0a6a8165162fd3c9f5090869a692d2e4
+size 9398878560

gemma-2-27b-it-IQ2_S.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ab27afe42f164ef25fae6eef20568ff526b22e288c1b945562e67dd7c6d80f8a
-size 8652570048

 version https://git-lfs.github.com/spec/v1
+oid sha256:eb8acc19032705252b5891883ef339107a4e7236da266307c3f2ff485414c45c
+size 8652161376

gemma-2-27b-it-IQ2_XS.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:77605be226eb01df5f0713bdb0d5cdf32ddef662242e56b7f97ab413c0767760
-size 8400125376

 version https://git-lfs.github.com/spec/v1
+oid sha256:0667fdc5bc7635eb379f9cce9f3225719f87d3e062a4227be127f154d6843c00
+size 8399716704

gemma-2-27b-it-IQ3_M.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8333450a4fa2465ea3db1602c9c4ab95df81a8f8bccb163497d9b81f9b8f5512
-size 12455317440

 version https://git-lfs.github.com/spec/v1
+oid sha256:b56de27535c598d0419eb2e93502d8be65baac7b5cdfda610b8541cd2adf67dc
+size 12454830432

gemma-2-27b-it-IQ3_XS.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f71094993f91f96f30441fe777fc1ccd03d6351e82c2ee4d33139e58c6aad485
-size 11551117248

 version https://git-lfs.github.com/spec/v1
+oid sha256:3dfc33b9619f6c141a2b680fa5d625ce3f9b514b5e62b233ad5fd58985e056c8
+size 11550630240

gemma-2-27b-it-IQ3_XXS.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b3afbd24429c11fc1a476c28902cc29d9d3050a8934ae06aca52c1dd5ef7683e
-size 10751163840

 version https://git-lfs.github.com/spec/v1
+oid sha256:e9dd8bcb4c6cec2c35bd1cdeaa295f6788ff8a7c656a2448b8f67db557fabc05
+size 10750755168

gemma-2-27b-it-IQ4_XS.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:243740a513b51a9bbe06ba23886fc16aa2af2358c9e4d528f3d7477cc5ba8b86
-size 14814908352

 version https://git-lfs.github.com/spec/v1
+oid sha256:136db68716327171facb0da75f5396e61175d99b953bdcbed8c1b228c366c85f
+size 14814421344

gemma-2-27b-it-Q2_K.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bbec921d5d38e2e70cc330f6c8dc6b778ba52d25d67c261ae72c17a602eee926
-size 10450063296

 version https://git-lfs.github.com/spec/v1
+oid sha256:589b098ead37615a95d83181ce0f0d3a162b7bd720eae370029b5f452ef36612
+size 10449576288

gemma-2-27b-it-Q2_K_L.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cb6ed1dd06b184ed66a2d5d6c709ee52a31efcf51621eae0a349adb3d5e56762
-size 11842375104

 version https://git-lfs.github.com/spec/v1
+oid sha256:ae47e19306cbc099f405720e84d65f5168cd1e315de886436bbd7e9b2fb00012
+size 11841192288

gemma-2-27b-it-Q3_K_L.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a4b3a4ce2ef7f54efae106e51997d244a636013b08e1a0362373f3b8cdd8d941
-size 14519848896

 version https://git-lfs.github.com/spec/v1
+oid sha256:ef6c739293a83b428950abda322dbcd20893002b404f244f4c5881898e38a0bf
+size 14519361888

gemma-2-27b-it-Q3_K_M.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:87c449bf6bb9b63f9ac6565acfd74cccd66952d7977546fedce1d0401c825e56
-size 13425135552

 version https://git-lfs.github.com/spec/v1
+oid sha256:f0cc746e782593662436433a1541bd3dfcf3fc64b8ba9564361b2eeab5475937
+size 13424648544

gemma-2-27b-it-Q3_K_S.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:11a593e33fc1d5b07e78751c9056abbfd326cca8d80c4a7827488abdd9893a02
-size 12169547712

 version https://git-lfs.github.com/spec/v1
+oid sha256:8fe7885f7bdb3bf0bc8548c296f437fb576ed906043fd9f9c0c7ac84246d0972
+size 12169060704

gemma-2-27b-it-Q3_K_XL.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:819c2a159aa7d0bb0157e1e59d8e81d71c4d9a6ce877e0534fa7152b94f3c66d
-size 15912160704

 version https://git-lfs.github.com/spec/v1
+oid sha256:042f847a41a3dfcf83414b203054ca044acab33d741114c864f15dd0c5539338
+size 15910977888

gemma-2-27b-it-Q4_K_L.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:43319ad31888314879be17087e27a1e1d6378e56a5189ddb6624e09283181990
-size 18038181312

 version https://git-lfs.github.com/spec/v1
+oid sha256:c7d35766b774effed0fb93535c2ec4a19a52a1ac263a865388ce8a1f4217297d
+size 18036998496

gemma-2-27b-it-Q4_K_M.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e54e7b800d464af4fa9966020e4a1b1d386cd9346de2d851a7bfe7d0797c44c4
-size 16645869504

 version https://git-lfs.github.com/spec/v1
+oid sha256:be6739763f1b7661d32bd63e05bc1131e5bb9dac436b249faf6c6edffa601c96
+size 16645382496

gemma-2-27b-it-Q4_K_S.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4bd22f4b682cf80703f2bbd56faaa4e7389e1c1515516520791d633981bf2baf
-size 15739752384

 version https://git-lfs.github.com/spec/v1
+oid sha256:4605b0667036d027a179e718a7182118d00db6242ca6f08d9e1ab0ba4afecd54
+size 15739265376

gemma-2-27b-it-Q5_K_L.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c18751b5a67c1fd769e6df604ce26ead3e2eab99a263d712314b2c07c6a41d88
-size 20800916928

 version https://git-lfs.github.com/spec/v1
+oid sha256:da959f7228be368760c7b0e55ae68b522582966b1d1b22ef4c6b2994a482ee18
+size 20799734112

gemma-2-27b-it-Q5_K_M.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:63e379a35a495349e3091ee83426fd4b28a3294629146549272896c5c0650683
-size 19408605120

 version https://git-lfs.github.com/spec/v1
+oid sha256:96c90d894225c760044fc37e0b0912c67268a7870fe01d445b1821b561ee0bab
+size 19408118112

gemma-2-27b-it-Q5_K_S.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:156cbe9e21cfc9703ffb8cf7f24405de3f8285119ed3c1c703a2902937700a17
-size 18884693952

 version https://git-lfs.github.com/spec/v1
+oid sha256:bd0a3f5a02417eeb0e3a6bc45b0bce6b9b1f24d36afed1e8b1c93ff5d82f17a0
+size 18884206944

gemma-2-27b-it-Q6_K.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d5b35c93ec98c64a2a36283f5e583b59b4fe16dce15290956704c91f051c5e1e
-size 22344011712

 version https://git-lfs.github.com/spec/v1
+oid sha256:460d88c4ad506163673fde237fef6be2c231a056926a40ef859ce32456c7a424
+size 22343524704

gemma-2-27b-it-Q6_K_L.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:480824ff171578d95673f443289586e4f3fe5f4e5e76d050765e9151cdf1aa0e
-size 23736323520

 version https://git-lfs.github.com/spec/v1
+oid sha256:a7f00d33b1feb33184d50cabf047cc9d53fb56ecb5f839e0cb8fbfba0f826a11
+size 23735140704

gemma-2-27b-it-Q8_0.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f9f6b7107c7e29dd227dcf4e0524b0f64cae33cbcf18d9952c0ee91aa3cf44c9
-size 28938018240

 version https://git-lfs.github.com/spec/v1
+oid sha256:784146b99cc08e237292638d064150909a7e82cf6ecc55bed7d81328c58d42d2
+size 28937388384

gemma-2-27b-it-Q8_0_L.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7f13c6df81fda56b2bf363b211473aae8c142d94547900663271dd45deb9f325
-size 30044491200

 version https://git-lfs.github.com/spec/v1
+oid sha256:96f1c2a3807b2e8d56a705713a064fc03879da21564472fcdfc0477c0b65ba05
+size 30043308384

gemma-2-27b-it-f32.gguf/gemma-2-27b-it-f32-00001-of-00003.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:abbd11eea0b1ba6f0e1093930268e01397e514ab0e48eb509b2970558ca94b20
-size 39607950848

 version https://git-lfs.github.com/spec/v1
+oid sha256:40cffae24f3b2ef81b71f3f9395641e2d7b3b648c81ff6b37d16b496b655463b
+size 39605588416

gemma-2-27b-it-f32.gguf/gemma-2-27b-it-f32-00002-of-00003.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:42b85bc7430a43dda0b558323b14460e0e2326bbee276143ccfcaabd5678207a
-size 39977250368

 version https://git-lfs.github.com/spec/v1
+oid sha256:ee1299b5d2d728b578c7d9e309ff87d13b4701dd01a7b268c4d2393e128e881a
+size 39864004064

gemma-2-27b-it-f32.gguf/gemma-2-27b-it-f32-00003-of-00003.gguf CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4a1990ff17113151f8114854d605d2e012df9af64cf8063d56addefde1728893
-size 29331734880

 version https://git-lfs.github.com/spec/v1
+oid sha256:f7c97c2904b8af2f09fa1d83304f6b6d3640f3b00474685e994b49fed6c31e8f
+size 29444981280

gemma-2-27b-it.imatrix CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9e90f2ac6a11ab92242966156e976ac4dc8b73c35714b66e37445c474b270f74
 size 11786697

 version https://git-lfs.github.com/spec/v1
+oid sha256:fa62436bc9274e797e6a525815823c8c9f3baf1a011c4da34ee3252bc77cefd8
 size 11786697