cmp-nct/xcomposer2_gguf_for_llama.cpp_development

llm_load_print_meta: model type = 7B
llm_load_print_meta: model ftype = Q3_K - Small
llm_load_print_meta: model params = 8.34 B
llm_load_print_meta: model size = 3.48 GiB (3.58 BPW)
llm_load_print_meta: general.name = InternLM2
llm_load_print_meta: BOS token = 1 ''
llm_load_print_meta: EOS token = 2 ''
llm_load_print_meta: UNK token = 0 ''
llm_load_print_meta: PAD token = 2 ''
llm_load_print_meta: LF token = 13 '<0x0A>'
llm_load_tensors: ggml ctx size = 0.23 MiB
llama_model_load: error loading model: done_getting_tensors: wrong number of tensors; expected 611, got 291

Sums match. Obsidian multi-modal gguf works. So there is a problem with the small model.

cmp-nct
/

xcomposer2_gguf_for_llama.cpp_development

Doesn't work.