SeaLLMs
/

SeaLLM-13B-Chat

Model card Files Files and versions Community

nxphi47 commited on Oct 25, 2023

Commit

5fb2655

·

1 Parent(s): 5ba1105

Update README.md

Files changed (1) hide show

README.md +15 -8

README.md CHANGED Viewed

@@ -102,7 +102,6 @@ Evaluated by
 Introduction about the M3Exam
 <!-- | Qwen-7b-chat          | 33.91 | 60.85 | 29.57 |  0.00 | 18.04
 | Qwen-13b-v3-pro       | 75.30 | 89.27 | 56.68 | 49.46 | 39.35
 | Qwen-13b-v3-pro-SFT   | 38.20 |  4.23 | 46.39 | 33.97 | 19.79
@@ -136,14 +135,14 @@ Introduction about the M3Exam
 | SeaLLM-13bChat/SFT/v2 | 62.23 | 41.00 | 47.23 | 35.10 | 30.77 -->
-### MMLU - Retaining English-based knowledge
-| MMLU           |  Average | STEM | Social Sciences | Humanities | Others |
 |-----------| ------- | ------- |  ------- | ------- | ------- |
-| Llama-2-13b    |     46.9 | 35.8 |            53.8 |       45.0 |   53.3 |
-| Llama-2-13b-chat?    |     46.9 | 35.8 |            53.8 |       45.0 |   53.3 |
-| SeaLLM-13bChat/SFT/v1 | 64.30 | 45.58 | 48.13 | 37.76 | 30.77
-| SeaLLM-13bChat/SFT/v2 | 62.23 | 41.00 | 47.23 | 35.10 | 30.77
 ### NLP tasks
@@ -162,7 +161,7 @@ Read-Comphrension | En | Zh | Vi | Id | Th | ALL | SEA
 #### Translation
-4-shot
 Model | En-Zh | En-Vi | En-Id | En-Th | En->X | Zh-En | Vi-En | Id-En | Th-En | X->En
 |-------- | ---- | ---- |  ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- |
@@ -171,6 +170,13 @@ Model | En-Zh | En-Vi | En-Id | En-Th | En->X | Zh-En | Vi-En | Id-En | Th-En |
 | SeaLLM-13b-chat-v1 | 22.77 | 58.96 | 64.78 | 42.38 | 55.37 | 53.20 | 60.29 | 65.03 | 57.24 | 60.85
 | SeaLLM-13b-chat-v2 | 22.75 | 58.78 | 65.90 | 42.60 | 55.76 | 53.34 | 60.80 | 65.44 | 57.05 | 61.10
 #### Summarization
@@ -194,3 +200,4 @@ If you find our project useful, hope you can star our repo and cite our work as
   year = 2023,
 }
 ```

 Introduction about the M3Exam
 <!-- | Qwen-7b-chat          | 33.91 | 60.85 | 29.57 |  0.00 | 18.04
 | Qwen-13b-v3-pro       | 75.30 | 89.27 | 56.68 | 49.46 | 39.35
 | Qwen-13b-v3-pro-SFT   | 38.20 |  4.23 | 46.39 | 33.97 | 19.79
 | SeaLLM-13bChat/SFT/v2 | 62.23 | 41.00 | 47.23 | 35.10 | 30.77 -->
+### MMLU - Preserving English-based knowledge
+| 13B Models | STEM | Humanities | Social | Others | Average
 |-----------| ------- | ------- |  ------- | ------- | ------- |
+| Llama-2                 | 44.10 | 52.80 | 62.60 | 61.10 | 54.80
+| Llama-2-chat            | 43.70 | 49.30 | 62.60 | 60.10 | 53.50
+| SeaLLM-13bChat/SFT/v2   | 43.67 | 52.09 | 62.69 | 61.20 | 54.70
+| SeaLLM-13bChat/SFT/v3   | 43.30 | 52.80 | 63.10 | 61.20 | 55.00
 ### NLP tasks
 #### Translation
+Translation between SEA-En. Scores in chrF++
 Model | En-Zh | En-Vi | En-Id | En-Th | En->X | Zh-En | Vi-En | Id-En | Th-En | X->En
 |-------- | ---- | ---- |  ---- | ---- | ---- | ---- | ---- | ---- | ---- | ---- |
 | SeaLLM-13b-chat-v1 | 22.77 | 58.96 | 64.78 | 42.38 | 55.37 | 53.20 | 60.29 | 65.03 | 57.24 | 60.85
 | SeaLLM-13b-chat-v2 | 22.75 | 58.78 | 65.90 | 42.60 | 55.76 | 53.34 | 60.80 | 65.44 | 57.05 | 61.10
+Translation between SEA-SEA
+Model | Vi-Id | Id-Vi | Vi-Th | Th-Vi | Id-Th | Th-Id
+|-------- | ---- | ---- |  ---- | ---- | ---- | ---- |
+ChatGPT                     | 56.75 | 54.17 | 40.48 | 46.54 | 40.59 | 51.87
+SeaLLM-13b-base mixed SFT   | 54.56 | 54.76 | 36.68 | 51.88 | 39.36 | 47.99
+SeaLLM-13b-Chat/SFT/v2      | 53.75 | 52.47 | 32.76 | 49.20 | 40.43 | 50.03
 #### Summarization
   year = 2023,
 }
 ```