llm-jp
/

llm-jp-13b-v2.0

Text Generation

text-generation-inference

Model card Files Files and versions Community

hkiyomaru commited on Apr 29, 2024

Commit

17a7ee5

·

verified ·

1 Parent(s): ed3c0b7

Update README.md

Files changed (1) hide show

README.md +9 -6

README.md CHANGED Viewed

@@ -111,7 +111,7 @@ Please refer to [README.md](https://github.com/llm-jp/llm-jp-tokenizer) of `llm-
 The models have been pre-trained using a blend of the following datasets.
 | Language | Dataset | Tokens|
-|:---:|:---:|:---:|
 |Japanese|[Wikipedia](https://huggingface.co/datasets/wikipedia)|1.4B
 ||[Common Crawl](https://gitlab.llm-jp.nii.ac.jp/datasets/llm-jp-corpus)|130.7B
 |English|[Wikipedia](https://huggingface.co/datasets/wikipedia)|4.7B
@@ -123,11 +123,14 @@ The models have been pre-trained using a blend of the following datasets.
 The models have been fine-tuned on the following datasets.
 | Language | Dataset | description |
-|:---|:---:|:---:|
-|Japanese|[jaster](https://github.com/llm-jp/llm-jp-eval)| An automatically transformed data from the existing Japanese NLP datasets |
-||[databricks-dolly-15k](https://huggingface.co/datasets/databricks/databricks-dolly-15k)| A translated one by DeepL in LLM-jp |
-||[OpenAssistant Conversations Dataset](https://huggingface.co/datasets/OpenAssistant/oasst1)| A translated one by DeepL in LLM-jp |
 ## Evaluation

 The models have been pre-trained using a blend of the following datasets.
 | Language | Dataset | Tokens|
+|:---|:---|:---|
 |Japanese|[Wikipedia](https://huggingface.co/datasets/wikipedia)|1.4B
 ||[Common Crawl](https://gitlab.llm-jp.nii.ac.jp/datasets/llm-jp-corpus)|130.7B
 |English|[Wikipedia](https://huggingface.co/datasets/wikipedia)|4.7B
 The models have been fine-tuned on the following datasets.
 | Language | Dataset | description |
+|:---|:---|:---|
+|Japanese|[ichikara-instruction-004-001](https://liat-aip.sakura.ne.jp/wp/llm%e3%81%ae%e3%81%9f%e3%82%81%e3%81%ae%e6%97%a5%e6%9c%ac%e8%aa%9e%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%a9%e3%82%af%e3%82%b7%e3%83%a7%e3%83%b3%e3%83%87%e3%83%bc%e3%82%bf%e4%bd%9c%e6%88%90/llm%e3%81%ae%e3%81%9f%e3%82%81%e3%81%ae%e6%97%a5%e6%9c%ac%e8%aa%9e%e3%82%a4%e3%83%b3%e3%82%b9%e3%83%88%e3%83%a9%e3%82%af%e3%82%b7%e3%83%a7%e3%83%b3%e3%83%87%e3%83%bc%e3%82%bf-%e5%85%ac%e9%96%8b/)| A manually constructed Japanese instruction dataset |
+|        |[answer-carefully-001]()| A manually constructed Japanese instruction dataset focusing on LLMs' safety |
+|        |[databricks-dolly-15k-ja](https://huggingface.co/datasets/llm-jp/databricks-dolly-15k-ja)| [databricks-dolly-15k](https://huggingface.co/datasets/databricks/databricks-dolly-15k) translated into Japanese using DeepL  |
+|        |[oasst1-21k-ja](https://huggingface.co/datasets/llm-jp/oasst1-21k-ja)| A subset of [oasst1](https://huggingface.co/datasets/OpenAssistant/oasst1) translated into Japanese using DeepL |
+|        |[oasst2-33k-ja](https://huggingface.co/datasets/llm-jp/oasst2-33k-ja)| A subset of [oasst2](https://huggingface.co/datasets/OpenAssistant/oasst2) translated into Japanese using DeepL |
+|English |[oasst1-21k-en](https://huggingface.co/datasets/llm-jp/oasst1-21k-en)| A subset of [oasst1](https://huggingface.co/datasets/OpenAssistant/oasst1) |
+|        |[oasst2-33k-en](https://huggingface.co/datasets/llm-jp/oasst2-33k-en)| A subset of [oasst2](https://huggingface.co/datasets/OpenAssistant/oasst2) |
 ## Evaluation