huihui-ai
/

DeepSeek-V3-bf16

Model card Files Files and versions Community

huihui-ai commited on Jan 17

Commit

9e76422

·

verified ·

1 Parent(s): 70fe8b6

Update README.md

Files changed (1) hide show

README.md +9 -2

README.md CHANGED Viewed

@@ -34,7 +34,6 @@ python fp8_cast_bf16.py --input-fp8-hf-path /home/admin/models/deepseek-ai/DeepS
 ```
 ## BF16 to f16.gguf
 1. Use the [llama.cpp](https://github.com/ggerganov/llama.cpp) conversion program to convert DeepSeek-V3-bf16 to gguf format, requires an additional approximately 1.3 TB of space.
-**Note:** this model requires [Ollama 0.5.5](https://github.com/ollama/ollama/releases/tag/v0.5.5)
 ```
 python convert_hf_to_gguf.py /home/admin/models/deepseek-ai/DeepSeek-V3-bf16 --outfile /home/admin/models/deepseek-ai/DeepSeek-V3-bf16/ggml-model-f16.gguf --outtype f16
 ```
@@ -47,4 +46,12 @@ llama-quantize /home/admin/models/deepseek-ai/DeepSeek-V3-bf16/ggml-model-f16.gg
 3. Use llama-cli to test.
 ```
 llama-cli -m /home/admin/models/deepseek-ai/DeepSeek-V3-bf16/ggml-model-Q2_K.gguf -n 2048
-```

 ```
 ## BF16 to f16.gguf
 1. Use the [llama.cpp](https://github.com/ggerganov/llama.cpp) conversion program to convert DeepSeek-V3-bf16 to gguf format, requires an additional approximately 1.3 TB of space.
 ```
 python convert_hf_to_gguf.py /home/admin/models/deepseek-ai/DeepSeek-V3-bf16 --outfile /home/admin/models/deepseek-ai/DeepSeek-V3-bf16/ggml-model-f16.gguf --outtype f16
 ```
 3. Use llama-cli to test.
 ```
 llama-cli -m /home/admin/models/deepseek-ai/DeepSeek-V3-bf16/ggml-model-Q2_K.gguf -n 2048
+```
+## Use with ollama
+**Note:** this model requires [Ollama 0.5.5](https://github.com/ollama/ollama/releases/tag/v0.5.5)
+You can use [huihui_ai/deepseek-v3:671b-q2_K](https://ollama.com/huihui_ai/deepseek-v3:671b-q2_K) directly
+```
+ollama run huihui_ai/deepseek-v3:671b-q2_K
+```