Triangle104
/

Gemmadevi-Stock-10B

Text Generation

text-generation-inference

Model card Files Files and versions Community

Merge

This is a merge of pre-trained language models created using mergekit.

Merge Method

This model was merged using the Model Stock merge method using TheDrummer/Gemmasutra-9B-v1.1 as a base.

Models Merged

The following models were included in the merge:

Configuration

The following YAML configuration was used to produce this model:

models:
  - model: TheDrummer/Gemmasutra-9B-v1.1
  - model: Rombo-Org/Rombo-LLM-V2.7-gemma-2-9b
  - model: allura-org/G2-9B-Aletheia-v1
  - model: anthracite-org/magnum-v4-9b
  - model: nbeerbower/Gemma2-Gutenberg-Doppel-9B
  - model: DavidAU/Gemma-The-Writer-Mighty-Sword-9B
merge_method: model_stock
base_model: TheDrummer/Gemmasutra-9B-v1.1
parameters:
    normalize: true
dtype: bfloat16

Open LLM Leaderboard Evaluation Results

Detailed results can be found here

Metric	Value
Avg.	21.58
IFEval (0-Shot)	15.82
BBH (3-Shot)	43.62
MATH Lvl 5 (4-Shot)	2.79
GPQA (0-shot)	13.76
MuSR (0-shot)	17.23
MMLU-PRO (5-shot)	36.24

Downloads last month: 6

Safetensors

Model size

10.2B params

Tensor type

BF16

·

Model tree for Triangle104/Gemmadevi-Stock-10B

DavidAU/Gemma-The-Writer-Mighty-Sword-9B

Rombo-Org/Rombo-LLM-V2.7-gemma-2-9b

TheDrummer/Gemmasutra-9B-v1.1

allura-org/G2-9B-Aletheia-v1

anthracite-org/magnum-v4-9b

nbeerbower/Gemma2-Gutenberg-Doppel-9B

Merge model

this model

Merges

1 model

Quantizations

1 model

Spaces using Triangle104/Gemmadevi-Stock-10B 9

Collections including Triangle104/Gemmadevi-Stock-10B

Gemma

Google-based models • 361 items • Updated Jul 13 • 1

RP

Roleplaying Models • 1903 items • Updated 26 days ago • 9

Merges

Personal Merges • 108 items • Updated May 5 • 1

Evaluation results

strict accuracy on IFEval (0-Shot)
Open LLM Leaderboard

15.820
normalized accuracy on BBH (3-Shot)
Open LLM Leaderboard

43.620
exact match on MATH Lvl 5 (4-Shot)
Open LLM Leaderboard

2.790
acc_norm on GPQA (0-shot)
Open LLM Leaderboard

13.760
acc_norm on MuSR (0-shot)
Open LLM Leaderboard

17.230
accuracy on MMLU-PRO (5-shot)
test set Open LLM Leaderboard

36.240

View on Papers With Code