File size: 970 Bytes
e3e555a
 
 
 
 
 
 
 
 
 
 
 
9d035d8
e3e555a
 
 
 
 
 
 
 
1a779f0
e3e555a
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
---
language:
- ja
metrics:
- accuracy
- f1
---
# multilingual-sentimentsデータセットをbertベースのモデルでfinetuningしたもの

- ベースモデル:cl-tohoku/bert-base-japanese-whole-word-masking
- データセット:tyqiangz/multilingual-sentiments
- バッチサイズ: 16固定
- オプティマイザ: adafactor
- Optunaでハイパーパラメータ探索
  - 学習率スケジュールのタイプ(lr_scheduler_type): constant, linear, cosine
  - 学習率(learning rate): 1e-6 ~ 1e-4
  - 勾配累積ステップ(gradient_accumulation_steps): 1, 2, 4, 8, 16
  - 正則化(weight_decay): 1e-6 ~ 1e-1

- Optunaでの探索結果は以下
  - 学習率スケジュールタイプ(lr_scheduler_type): cosine
  - 学習率(learning rate): 2.64959745375728e-05
  - 勾配累積ステップ(gradient_accumulation_steps): 4
  - 正則化(weight_decay): 1.1217342612041105e-06

このハイパーパラメータを使って再度finetuningした.