A-Funakoshi commited on
Commit
58056b5
·
1 Parent(s): 41062fa

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +25 -0
README.md ADDED
@@ -0,0 +1,25 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - ja
4
+ metrics:
5
+ - accuracy
6
+ - f1
7
+ ---
8
+ - ベースモデル:cl-tohoku/bert-base-japanese-whole-word-masking
9
+ - データセット:llm-book/wrime-sentiment
10
+ - オプティマイザ: adamw
11
+ - Optunaでハイパーパラメータ探索
12
+ - 学習率スケジュールのタイプ(lr_scheduler_type): constant, linear, cosine
13
+ - 学習率(learning rate): 1e-6 ~ 1e-4
14
+ - バッチサイズ(per_device_train_batch_size): 16, 32, 64, 128, 256
15
+ - 正則化(weight_decay): 1e-6 ~ 1e-1
16
+
17
+ - Optunaでの探索結果は以下
18
+ - 学習率スケジュールタイプ(lr_scheduler_type): cosine
19
+ - 学習率(learning rate): 3.912141264809884e-05
20
+ - バッチサイズ(per_device_train_batch_size): 128
21
+ - 正則化(weight_decay): 5.220051265759252e-05
22
+ - Epoch: 100
23
+ - EarlyStopping: early_stopping_patience=3
24
+
25
+ このハイパーパラメータを使って再度finetuningした.