CaceAI
/

Llama3-8B-Fusion-ChatQA-Chinese

Text Generation

shenzhi-wang/Llama3-8B-Chinese-Chat

nvidia/Llama3-ChatQA-1.5-8B

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Llama3-8B-Fusion-ChatQA-Chinese / README.md

zjyhf's picture

Upload folder using huggingface_hub

3ccd146 verified 6 months ago

|

855 Bytes

	---
	license: apache-2.0
	tags:
	- merge
	- mergekit
	- lazymergekit
	- shenzhi-wang/Llama3-8B-Chinese-Chat
	- nvidia/Llama3-ChatQA-1.5-8B
	---

	# Llama3-8B-Fusion-ChatQA-Chinese

	Llama3-8B-Fusion-ChatQA-Chinese is a merge of the following models using [mergekit](https://github.com/cg123/mergekit):
	* [shenzhi-wang/Llama3-8B-Chinese-Chat](https://huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat)
	* [nvidia/Llama3-ChatQA-1.5-8B](https://huggingface.co/nvidia/Llama3-ChatQA-1.5-8B)

	## Configuration

	\```yaml
	models:
	- model: meta-llama/Meta-Llama-3-8B
	- model: shenzhi-wang/Llama3-8B-Chinese-Chat
	parameters:
	density: 0.5
	weight: 0.6
	- model: nvidia/Llama3-ChatQA-1.5-8B
	parameters:
	density: 0.5
	weight: 0.4
	merge_method: dare_ties
	base_model: meta-llama/Meta-Llama-3-8B
	parameters:
	int8_mask: true
	dtype: bfloat16
	\```