File size: 4,916 Bytes
d308caa cb653d5 d308caa cb653d5 d308caa b329e2e cb653d5 b329e2e cb653d5 b329e2e cb653d5 b329e2e 2d60d3c fa4ab23 cb653d5 b329e2e cb653d5 b329e2e d308caa cb653d5 d308caa |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 |
---
library_name: transformers
tags:
- unsloth
license: gemma
datasets:
- llm-jp/magpie-sft-v1.0
- DeL-TaiseiOzaki/Tengentoppa-sft-qwen2.5-32b-reasoning-100k
- weblab-GENIAC/Open-Platypus-Japanese-masked
- weblab-GENIAC/aya-ja-nemotron-dpo-masked
base_model:
- google/gemma-2-27b
---
## 学習データセット
gemma-2利用にあたり、ライセンス制約上の懸念のあるデータセットは利用していない。
### SFT使用データ
- [llm-jp/magpie-sft-v1.0](https://huggingface.co/datasets/llm-jp/magpie-sft-v1.0) (apache-2.0)
- [DeL-TaiseiOzaki/Tengentoppa-sft-qwen2.5-32b-reasoning-100k](https://huggingface.co/datasets/DeL-TaiseiOzaki/Tengentoppa-sft-qwen2.5-32b-reasoning-100k) (apache-2.0)
- [weblab-GENIAC/Open-Platypus-Japanese-masked](https://huggingface.co/datasets/weblab-GENIAC/Open-Platypus-Japanese-masked) (MIT)
- MITライセンスのデータのみ抽出して使用。
### DPO使用データ
- [weblab-GENIAC/aya-ja-nemotron-dpo-masked](https://huggingface.co/datasets/weblab-GENIAC/aya-ja-nemotron-dpo-masked) (apache-2.0)
## モデル作成手順
- ベースモデル([google/gemma-2-27b](https://huggingface.co/google/gemma-2-27b))にSFT使用データ(サンプリング)を使って、Loraアダプタを作成([Taka2024/gemma-2-27b-it-2_lora](https://huggingface.co/Taka2024/gemma-2-27b-it-2_lora))
- ベースモデルとLoraアダプタをマージ([Taka2024/gemma-2-27b-it-2_lora_merged](https://huggingface.co/Taka2024/gemma-2-27b-it-2_lora_merged))
- マージしたモデルにDPO使用データ(サンプリング)を使って、DPOアダプタを作成(Taka2024/gemma-2-27b-dpo-1)
## 推論手順
unsloth版のサンプルコード(Google Colab L4使用)をベースとし、推論は1時間以内で終了するようになっている。
```
# 必要なライブラリをインストール
%%capture
!pip install unsloth
!pip uninstall unsloth -y && pip install --upgrade --no-cache-dir "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git"
!pip install -U torch
!pip install -U peft
```
```
# 必要なライブラリを読み込み
from unsloth import FastLanguageModel
from peft import PeftModel
import torch
import json
from tqdm import tqdm
import re
```
```
HF_TOKEN = "" #必要なトークンを設定してください
```
```
!huggingface-cli login --token $HF_TOKEN
```
```
# unslothのFastLanguageModelで元のモデルをロード。
dtype = None # Noneにしておけば自動で設定
load_in_4bit = True # 今回は27Bモデルを扱うためTrue
model_id = "Taka2024/gemma-2-27b-it-2_lora_merged"
adapter_dpo_id = "Taka2024/gemma-2-27b-dpo-1"
model, tokenizer = FastLanguageModel.from_pretrained(
model_name=model_id,
dtype=dtype,
load_in_4bit=load_in_4bit,
trust_remote_code=True,
)
```
```
# 元のモデルにDPOのアダプタを統合。
model = PeftModel.from_pretrained(model, adapter_dpo_id, token = HF_TOKEN)
```
```
# タスクとなるデータの読み込み。
# 事前にデータをアップロードしてください。
datasets = []
with open("/content/elyza-tasks-100-TV_0.jsonl", "r") as f:
item = ""
for line in f:
line = line.strip()
item += line
if item.endswith("}"):
datasets.append(json.loads(item))
item = ""
```
```
# モデルを用いてタスクの推論。
# 推論するためにモデルのモードを変更
FastLanguageModel.for_inference(model)
results = []
for dt in tqdm(datasets):
input = dt["input"]
prompt = f"""### あなたは日本人のための優秀なコンシェルジュです。指示には必ずわかりやすい日本語で回答してください。\n### 指示\n{input}\n### 回答\n"""
inputs = tokenizer([prompt], return_tensors = "pt").to(model.device)
outputs = model.generate(**inputs, max_new_tokens = 512, use_cache = True, do_sample=False, repetition_penalty=1.2)
prediction = tokenizer.decode(outputs[0], skip_special_tokens=True).split('\n### 回答')[-1]
results.append({"task_id": dt["task_id"], "input": input, "output": prediction})
```
```
# 結果をjsonlで保存。
# ここではadapter_idを元にファイル名を決定しているが、ファイル名は任意で問題なし。
json_file_id = re.sub(".*/", "", "gemma-2-27b-dpo-1")
with open(f"/content/{json_file_id}_output_IF.jsonl", 'w', encoding='utf-8') as f:
for result in results:
json.dump(result, f, ensure_ascii=False)
f.write('\n')
```
## Uploaded model
- **Developed by:** Taka2024
- **License:** gemma
- **Finetuned from model :** google/gemma-2-27b
This gemma2 model was trained 2x faster with [Unsloth](https://github.com/unslothai/unsloth) and Huggingface's TRL library.
[<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200"/>](https://github.com/unslothai/unsloth)
|