Bartelds commited on
Commit
b0703a6
·
1 Parent(s): a353715

Upload checkpoint, sanitized config, and transcripts for group-dro_mms_set_5

Browse files
Files changed (5) hide show
  1. README.md +41 -0
  2. config.yaml +1436 -0
  3. hyp.trn +0 -0
  4. ref.trn +0 -0
  5. valid.loss.best.pth +3 -0
README.md ADDED
@@ -0,0 +1,41 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ title: "Group-DRO MMS-based ASR model - set 5"
3
+ language: multilingual
4
+ tags:
5
+ - asr
6
+ - group-dro
7
+ - MMS
8
+ license: cc-by-nc-4.0
9
+ ---
10
+
11
+ # Group-DRO MMS-based ASR model - set 5
12
+
13
+ This repository contains a Group-DRO MMS-based automatic speech recognition (ASR) model trained with ESPnet.
14
+ The model was trained on balanced training data from set 5.
15
+
16
+ ## Intended Use
17
+
18
+ This model is intended for ASR. Users can run inference using the provided checkpoint (`valid.loss.best.pth`) and configuration file (`config.yaml`):
19
+ ```bash
20
+ import soundfile as sf
21
+ from espnet2.bin.asr_inference import Speech2Text
22
+
23
+ asr_train_config = "group-dro_mms_set_5/config.yaml"
24
+ asr_model_file = "group-dro_mms_set_5/valid.loss.best.pth"
25
+
26
+ model = Speech2Text.from_pretrained(
27
+ asr_train_config=asr_train_config,
28
+ asr_model_file=asr_model_file
29
+ )
30
+
31
+ speech, _ = sf.read("input.wav")
32
+ text, *_ = model(speech)[0]
33
+
34
+ print("Recognized text:", text)
35
+ ```
36
+
37
+ ## How to Use
38
+
39
+ 1. Clone this repository.
40
+ 2. Use ESPnet’s inference scripts with the provided `config.yaml` and checkpoint file.
41
+ 3. Ensure any external resources referenced in `config.yaml` are available at the indicated relative paths.
config.yaml ADDED
@@ -0,0 +1,1436 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ accum_grad: 16
2
+ adapter: lora
3
+ adapter_conf: {}
4
+ allow_multi_rates: false
5
+ allow_variable_data_keys: false
6
+ aux_ctc_tasks: []
7
+ batch_bins: 1000000
8
+ batch_size: 4
9
+ batch_type: sorted
10
+ best_model_criterion:
11
+ - - valid
12
+ - loss
13
+ - min
14
+ bpemodel: null
15
+ chunk_default_fs: null
16
+ chunk_excluded_key_prefixes: []
17
+ chunk_length: 500
18
+ chunk_shift_ratio: 0.5
19
+ cleaner: null
20
+ collect_stats: false
21
+ create_graph_in_tensorboard: false
22
+ ctc_conf:
23
+ accumulation: false
24
+ agg: mean
25
+ ctc_type: droctc
26
+ dro_group_count: 6
27
+ dro_q_epsilon: 1.0e-10
28
+ dro_step_size: 0.0001
29
+ final_step_size: 0.001
30
+ init_strategy: uniform
31
+ initial_step_size: 0.0001
32
+ laplace_smoothing: 0.0
33
+ max_epoch: 40
34
+ normalize_grad: false
35
+ num_iters_per_epoch: 1200
36
+ running_mean_window: -1
37
+ scheduling: false
38
+ use_running_mean: false
39
+ warmup_steps: 0
40
+ cudnn_benchmark: false
41
+ cudnn_deterministic: true
42
+ cudnn_enabled: true
43
+ decoder: null
44
+ decoder_conf: {}
45
+ detect_anomaly: false
46
+ distributed: false
47
+ drop_last_iter: false
48
+ dry_run: false
49
+ duration_batch_length: -1
50
+ early_stopping_criterion:
51
+ - valid
52
+ - loss
53
+ - min
54
+ encoder: transformer
55
+ encoder_conf:
56
+ attention_dropout_rate: 0.1
57
+ attention_heads: 8
58
+ dropout_rate: 0.1
59
+ input_layer: conv2d2
60
+ linear_units: 1024
61
+ normalize_before: true
62
+ num_blocks: 2
63
+ output_size: 256
64
+ positional_dropout_rate: 0.1
65
+ exclude_weight_decay: false
66
+ exclude_weight_decay_conf: {}
67
+ fold_length:
68
+ - 80000
69
+ - 150
70
+ freeze_param: []
71
+ frontend: s3prl
72
+ frontend_conf:
73
+ download_dir: ./hub
74
+ frontend_conf:
75
+ path_or_url: facebook/mms-300m
76
+ upstream: hf_wav2vec2_custom
77
+ fs: 16k
78
+ multilayer_feature: true
79
+ g2p: null
80
+ grad_clip: 5.0
81
+ grad_clip_type: 2.0
82
+ grad_noise: false
83
+ ignore_init_mismatch: false
84
+ init: xavier_uniform
85
+ init_param: []
86
+ input_size: null
87
+ iterator_type: sequence
88
+ joint_net_conf: null
89
+ keep_nbest_models: 3
90
+ log_interval: null
91
+ log_level: INFO
92
+ max_cache_fd: 32
93
+ max_cache_size: 0.0
94
+ max_epoch: 40
95
+ model: espnet
96
+ model_conf:
97
+ ctc_weight: 1.0
98
+ multiple_iterator: false
99
+ multiprocessing_distributed: false
100
+ nbest_averaging_interval: 0
101
+ ngpu: 1
102
+ no_forward_run: false
103
+ noise_apply_prob: 1.0
104
+ noise_db_range: '13_15'
105
+ noise_scp: null
106
+ non_linguistic_symbols: ./nlsyms.txt
107
+ normalize: utterance_mvn
108
+ normalize_conf: {}
109
+ num_att_plot: 3
110
+ num_cache_chunks: 1024
111
+ num_iters_per_epoch: 1200
112
+ num_workers: 4
113
+ optim: adam
114
+ optim_conf:
115
+ lr: 0.0001
116
+ weight_decay: 1.0e-06
117
+ output_dir: ./inference_results
118
+ patience: null
119
+ postencoder: null
120
+ postencoder_conf: {}
121
+ preencoder: linear
122
+ preencoder_conf:
123
+ input_size: 1024
124
+ output_size: 80
125
+ preprocessor: default
126
+ preprocessor_conf: {}
127
+ pretrain_path: null
128
+ print_config: false
129
+ required:
130
+ - output_dir
131
+ - token_list
132
+ resume: true
133
+ rir_apply_prob: 1.0
134
+ rir_scp: null
135
+ save_strategy: all
136
+ scheduler: null
137
+ scheduler_conf: {}
138
+ seed: 0
139
+ sharded_ddp: false
140
+ short_noise_thres: 0.5
141
+ shuffle_within_batch: false
142
+ sort_batch: descending
143
+ sort_in_batch: descending
144
+ specaug: specaug
145
+ specaug_conf:
146
+ apply_freq_mask: true
147
+ apply_time_mask: true
148
+ apply_time_warp: true
149
+ freq_mask_width_range:
150
+ - 0
151
+ - 27
152
+ num_freq_mask: 2
153
+ num_time_mask: 10
154
+ time_mask_width_ratio_range:
155
+ - 0.0
156
+ - 0.05
157
+ time_warp_mode: bicubic
158
+ time_warp_window: 5
159
+ speech_volume_normalize: null
160
+ token_list:
161
+ - <blank>
162
+ - <unk>
163
+ - <space>
164
+ - E
165
+ - A
166
+ - N
167
+ - I
168
+ - S
169
+ - R
170
+ - T
171
+ - O
172
+ - D
173
+ - L
174
+ - О
175
+ - H
176
+ - U
177
+ - C
178
+ - י
179
+ - ו
180
+ - Е
181
+ - И
182
+ - А
183
+ - M
184
+ - Н
185
+ - Т
186
+ - ה
187
+ - G
188
+ - С
189
+ - ל
190
+ - P
191
+ - Р
192
+ - В
193
+ - B
194
+ - מ
195
+ - ת
196
+ - ר
197
+ - Л
198
+ - F
199
+ - ב
200
+ - W
201
+ - א
202
+ - ש
203
+ - М
204
+ - К
205
+ - Д
206
+ - נ
207
+ - V
208
+ - ם
209
+ - П
210
+ - Y
211
+ - Я
212
+ - У
213
+ - '[deu]'
214
+ - ע
215
+ - Ы
216
+ - '[eng]'
217
+ - K
218
+ - ד
219
+ - ח
220
+ - ק
221
+ - Г
222
+ - כ
223
+ - פ
224
+ - の
225
+ - Б
226
+ - З
227
+ - ס
228
+ - Ь
229
+ - Ч
230
+ - Z
231
+ - ג
232
+ - し
233
+ - に
234
+ - ט
235
+ - Й
236
+ - は
237
+ - '[heb]'
238
+ - Q
239
+ - で
240
+ - Ж
241
+ - Х
242
+ - た
243
+ - '[rus]'
244
+ - צ
245
+ - '[spa]'
246
+ - ま
247
+ - Ó
248
+ - '[jpn]'
249
+ - Ю
250
+ - す
251
+ - る
252
+ - を
253
+ - い
254
+ - ן
255
+ - '0'
256
+ - と
257
+ - が
258
+ - ז
259
+ - J
260
+ - て
261
+ - Í
262
+ - れ
263
+ - Ш
264
+ - '1'
265
+ - ン
266
+ - Ü
267
+ - Ц
268
+ - な
269
+ - Ä
270
+ - Á
271
+ - ー
272
+ - り
273
+ - こ
274
+ - Щ
275
+ - Ф
276
+ - '2'
277
+ - X
278
+ - Э
279
+ - さ
280
+ - か
281
+ - あ
282
+ - ス
283
+ - É
284
+ - ル
285
+ - ך
286
+ - も
287
+ - う
288
+ - ら
289
+ - ア
290
+ - Ö
291
+ - く
292
+ - っ
293
+ - イ
294
+ - よ
295
+ - ト
296
+ - '6'
297
+ - ラ
298
+ - き
299
+ - 人
300
+ - ん
301
+ - Ё
302
+ - ף
303
+ - '3'
304
+ - '5'
305
+ - け
306
+ - '9'
307
+ - ッ
308
+ - リ
309
+ - ド
310
+ - '4'
311
+ - や
312
+ - そ
313
+ - ロ
314
+ - 国
315
+ - 地
316
+ - Ñ
317
+ - '8'
318
+ - せ
319
+ - 的
320
+ - シ
321
+ - め
322
+ - タ
323
+ - カ
324
+ - 日
325
+ - つ
326
+ - ジ
327
+ - Ú
328
+ - ク
329
+ - フ
330
+ - 発
331
+ - ャ
332
+ - テ
333
+ - え
334
+ - 場
335
+ - «
336
+ - '7'
337
+ - 合
338
+ - ば
339
+ - ど
340
+ - »
341
+ - 行
342
+ - 上
343
+ - 大
344
+ - コ
345
+ - 間
346
+ - ち
347
+ - 生
348
+ - 年
349
+ - 物
350
+ - 一
351
+ - 動
352
+ - 者
353
+ - オ
354
+ - わ
355
+ - ץ
356
+ - 時
357
+ - 法
358
+ - だ
359
+ - 中
360
+ - バ
361
+ - 方
362
+ - 要
363
+ - 前
364
+ - サ
365
+ - チ
366
+ - ウ
367
+ - 会
368
+ - ブ
369
+ - べ
370
+ - レ
371
+ - ィ
372
+ - 月
373
+ - 手
374
+ - 告
375
+ - 分
376
+ - 定
377
+ - プ
378
+ - ネ
379
+ - ニ
380
+ - 以
381
+ - 彼
382
+ - 常
383
+ - 最
384
+ - 部
385
+ - 性
386
+ - 事
387
+ - 後
388
+ - グ
389
+ - 多
390
+ - 報
391
+ - 見
392
+ - 学
393
+ - ほ
394
+ - 可
395
+ - ェ
396
+ - 用
397
+ - パ
398
+ - み
399
+ - お
400
+ - ュ
401
+ - メ
402
+ - 体
403
+ - 立
404
+ - 通
405
+ - 入
406
+ - 理
407
+ - ょ
408
+ - ム
409
+ - 能
410
+ - 出
411
+ - デ
412
+ - 成
413
+ - 下
414
+ - キ
415
+ - 金
416
+ - マ
417
+ - 示
418
+ - 必
419
+ - 所
420
+ - 力
421
+ - エ
422
+ - セ
423
+ - 他
424
+ - 子
425
+ - 同
426
+ - ズ
427
+ - ピ
428
+ - 選
429
+ - 点
430
+ - 語
431
+ - ��
432
+ - ケ
433
+ - ナ
434
+ - 長
435
+ - 高
436
+ - 新
437
+ - Ъ
438
+ - ビ
439
+ - ガ
440
+ - 先
441
+ - 表
442
+ - 関
443
+ - ず
444
+ - 当
445
+ - ツ
446
+ - 電
447
+ - 明
448
+ - 機
449
+ - 過
450
+ - 集
451
+ - 世
452
+ - 期
453
+ - 使
454
+ - 結
455
+ - 観
456
+ - 在
457
+ - 内
458
+ - 数
459
+ - 種
460
+ - 問
461
+ - 計
462
+ - 度
463
+ - 光
464
+ - 氏
465
+ - 曜
466
+ - 験
467
+ - 議
468
+ - げ
469
+ - 面
470
+ - 持
471
+ - 実
472
+ - 空
473
+ - 自
474
+ - 気
475
+ - ダ
476
+ - 試
477
+ - 開
478
+ - 形
479
+ - 業
480
+ - 際
481
+ - 変
482
+ - 非
483
+ - 考
484
+ - 域
485
+ - 全
486
+ - 話
487
+ - 調
488
+ - 件
489
+ - 流
490
+ - ミ
491
+ - 主
492
+ - 特
493
+ - 住
494
+ - 族
495
+ - 予
496
+ - 教
497
+ - 活
498
+ - ョ
499
+ - 向
500
+ - 異
501
+ - 決
502
+ - 供
503
+ - 言
504
+ - 院
505
+ - 文
506
+ - 死
507
+ - 対
508
+ - じ
509
+ - 正
510
+ - 現
511
+ - 作
512
+ - ろ
513
+ - 述
514
+ - 題
515
+ - 外
516
+ - 球
517
+ - 意
518
+ - ハ
519
+ - 名
520
+ - 民
521
+ - 州
522
+ - 米
523
+ - 画
524
+ - ホ
525
+ - 軍
526
+ - ボ
527
+ - 始
528
+ - 重
529
+ - 水
530
+ - 陸
531
+ - 書
532
+ - 界
533
+ - 記
534
+ - 何
535
+ - 戦
536
+ - ギ
537
+ - 員
538
+ - 離
539
+ - 食
540
+ - 約
541
+ - 状
542
+ - 番
543
+ - 組
544
+ - 得
545
+ - 経
546
+ - ペ
547
+ - 島
548
+ - 設
549
+ - ゴ
550
+ - 々
551
+ - 目
552
+ - 知
553
+ - 果
554
+ - 社
555
+ - 本
556
+ - 受
557
+ - 制
558
+ - 影
559
+ - 小
560
+ - へ
561
+ - ポ
562
+ - 旅
563
+ - 位
564
+ - 車
565
+ - 私
566
+ - 故
567
+ - 火
568
+ - 去
569
+ - 提
570
+ - 質
571
+ - 不
572
+ - 認
573
+ - 航
574
+ - 宿
575
+ - ソ
576
+ - 北
577
+ - 起
578
+ - 研
579
+ - 価
580
+ - 児
581
+ - 身
582
+ - 第
583
+ - 式
584
+ - 府
585
+ - 家
586
+ - 初
587
+ - 音
588
+ - 連
589
+ - 例
590
+ - 録
591
+ - 近
592
+ - 違
593
+ - 利
594
+ - 訪
595
+ - 型
596
+ - 星
597
+ - 念
598
+ - 今
599
+ - 限
600
+ - 陽
601
+ - ザ
602
+ - ベ
603
+ - む
604
+ - 広
605
+ - ァ
606
+ - 確
607
+ - ヴ
608
+ - 来
609
+ - 呼
610
+ - 収
611
+ - 泊
612
+ - 施
613
+ - 激
614
+ - 降
615
+ - 育
616
+ - 係
617
+ - 切
618
+ - 山
619
+ - 止
620
+ - 究
621
+ - 加
622
+ - 任
623
+ - 監
624
+ - 原
625
+ - 因
626
+ - 強
627
+ - 政
628
+ - 路
629
+ - 規
630
+ - 税
631
+ - 建
632
+ - 客
633
+ - 相
634
+ - 判
635
+ - 険
636
+ - 張
637
+ - モ
638
+ - 応
639
+ - 査
640
+ - 王
641
+ - 元
642
+ - 続
643
+ - ゲ
644
+ - ヨ
645
+ - び
646
+ - 感
647
+ - ヒ
648
+ - 類
649
+ - 存
650
+ - 投
651
+ - 局
652
+ - 、
653
+ - 症
654
+ - 再
655
+ - 料
656
+ - 安
657
+ - 太
658
+ - 味
659
+ - 量
660
+ - 情
661
+ - 務
662
+ - 抗
663
+ - 有
664
+ - ォ
665
+ - 海
666
+ - 由
667
+ - 英
668
+ - 撃
669
+ - 評
670
+ - 協
671
+ - 野
672
+ - 親
673
+ - 放
674
+ - 害
675
+ - 検
676
+ - 更
677
+ - 登
678
+ - 基
679
+ - 神
680
+ - 公
681
+ - 難
682
+ - 指
683
+ - 保
684
+ - 震
685
+ - 台
686
+ - 領
687
+ - 暴
688
+ - 付
689
+ - 回
690
+ - 科
691
+ - 送
692
+ - 直
693
+ - 与
694
+ - 帰
695
+ - 視
696
+ - 両
697
+ - 握
698
+ - 歩
699
+ - 天
700
+ - 心
701
+ - 参
702
+ - 響
703
+ - 楽
704
+ - 産
705
+ - 婚
706
+ - 属
707
+ - 医
708
+ - 速
709
+ - 細
710
+ - 準
711
+ - ־
712
+ - 史
713
+ - 済
714
+ - 障
715
+ - 軽
716
+ - 側
717
+ - 悪
718
+ - 工
719
+ - 習
720
+ - ノ
721
+ - 権
722
+ - 戻
723
+ - 申
724
+ - 遺
725
+ - 唆
726
+ - 被
727
+ - 交
728
+ - 況
729
+ - ユ
730
+ - 訴
731
+ - ワ
732
+ - 割
733
+ - 否
734
+ - 融
735
+ - 信
736
+ - 二
737
+ - 除
738
+ - 様
739
+ - ぐ
740
+ - 殿
741
+ - 運
742
+ - 演
743
+ - 余
744
+ - 解
745
+ - 道
746
+ - 病
747
+ - 低
748
+ - ぎ
749
+ - 代
750
+ - 週
751
+ - 市
752
+ - ヘ
753
+ - 比
754
+ - 資
755
+ - 庭
756
+ - 統
757
+ - 残
758
+ - 適
759
+ - 首
760
+ - 撮
761
+ - 望
762
+ - 遠
763
+ - 別
764
+ - 案
765
+ - 売
766
+ - 誌
767
+ - 術
768
+ - 急
769
+ - 着
770
+ - 委
771
+ - 支
772
+ - 優
773
+ - 写
774
+ - 落
775
+ - 港
776
+ - 傾
777
+ - 置
778
+ - 夫
779
+ - 乗
780
+ - 亡
781
+ - 系
782
+ - 殺
783
+ - 識
784
+ - 欠
785
+ - 素
786
+ - 挙
787
+ - 周
788
+ - 共
789
+ - 療
790
+ - 端
791
+ - 捕
792
+ - 染
793
+ - 司
794
+ - 潜
795
+ - 歴
796
+ - 品
797
+ - 買
798
+ - 択
799
+ - 肢
800
+ - 眺
801
+ - 態
802
+ - 良
803
+ - 源
804
+ - 繰
805
+ - 伝
806
+ - 雨
807
+ - 季
808
+ - 込
809
+ - 律
810
+ - ヌ
811
+ - 紀
812
+ - 征
813
+ - 服
814
+ - 諸
815
+ - 求
816
+ - 延
817
+ - 倒
818
+ - 突
819
+ - 午
820
+ - 頃
821
+ - 東
822
+ - ゆ
823
+ - 映
824
+ - 証
825
+ - 改
826
+ - ざ
827
+ - 伸
828
+ - 無
829
+ - 増
830
+ - 攻
831
+ - 察
832
+ - 隊
833
+ - 群
834
+ - 管
835
+ - 苦
836
+ - 禁
837
+ - 換
838
+ - 葉
839
+ - 模
840
+ - 率
841
+ - 課
842
+ - 区
843
+ - ぞ
844
+ - 営
845
+ - ご
846
+ - 取
847
+ - 致
848
+ - 幅
849
+ - 触
850
+ - 号
851
+ - 説
852
+ - 導
853
+ - 鳥
854
+ - 備
855
+ - 象
856
+ - 便
857
+ - 較
858
+ - 女
859
+ - 寒
860
+ - 温
861
+ - 岸
862
+ - 荷
863
+ - 敗
864
+ - 飛
865
+ - 衆
866
+ - 足
867
+ - 接
868
+ - 単
869
+ - 進
870
+ - 争
871
+ - 覚
872
+ - 獲
873
+ - 十
874
+ - 省
875
+ - 把
876
+ - 微
877
+ - 暖
878
+ - 焦
879
+ - 囲
880
+ - 雑
881
+ - 独
882
+ - 配
883
+ - 校
884
+ - 早
885
+ - 南
886
+ - 満
887
+ - 濃
888
+ - ゥ
889
+ - 町
890
+ - 論
891
+ - 刑
892
+ - 票
893
+ - 波
894
+ - 裁
895
+ - 歌
896
+ - 扱
897
+ - 少
898
+ - 菌
899
+ - 終
900
+ - 真
901
+ - 刻
902
+ - 逮
903
+ - 土
904
+ - 般
905
+ - 懸
906
+ - 党
907
+ - 断
908
+ - 傷
909
+ - 負
910
+ - 氷
911
+ - 厚
912
+ - 漁
913
+ - 師
914
+ - 消
915
+ - 酸
916
+ - 著
917
+ - ぼ
918
+ - 巨
919
+ - 図
920
+ - 券
921
+ - 館
922
+ - 爆
923
+ - 警
924
+ - 圏
925
+ - 跡
926
+ - 拠
927
+ - 紙
928
+ - 雲
929
+ - 将
930
+ - 援
931
+ - 猫
932
+ - 移
933
+ - 処
934
+ - 責
935
+ - づ
936
+ - 拒
937
+ - 効
938
+ - 頼
939
+ - 密
940
+ - 閉
941
+ - 購
942
+ - 容
943
+ - 削
944
+ - 欧
945
+ - 防
946
+ - 盟
947
+ - 折
948
+ - 専
949
+ - 門
950
+ - 極
951
+ - 到
952
+ - 達
953
+ - 聞
954
+ - 摘
955
+ - 紛
956
+ - 竜
957
+ - 巻
958
+ - 室
959
+ - 許
960
+ - 承
961
+ - 請
962
+ - 弓
963
+ - 弟
964
+ - 頻
965
+ - 疲
966
+ - 古
967
+ - 庁
968
+ - 反
969
+ - 官
970
+ - 境
971
+ - 勢
972
+ - 母
973
+ - 販
974
+ - 歳
975
+ - 義
976
+ - 河
977
+ - 口
978
+ - 革
979
+ - 命
980
+ - 抑
981
+ - 圧
982
+ - 各
983
+ - 木
984
+ - 技
985
+ - 構
986
+ - 造
987
+ - 競
988
+ - 復
989
+ - 緊
990
+ - ぶ
991
+ - 製
992
+ - 商
993
+ - 絶
994
+ - 失
995
+ - 覆
996
+ - 廃
997
+ - 祖
998
+ - 催
999
+ - 痛
1000
+ - 快
1001
+ - 益
1002
+ - 侵
1003
+ - 墜
1004
+ - 徴
1005
+ - 斜
1006
+ - 美
1007
+ - 魅
1008
+ - 了
1009
+ - 器
1010
+ - 干
1011
+ - 然
1012
+ - 測
1013
+ - 距
1014
+ - 婦
1015
+ - 祝
1016
+ - 村
1017
+ - 次
1018
+ - 読
1019
+ - 敷
1020
+ - 厳
1021
+ - 胎
1022
+ - 肺
1023
+ - 熟
1024
+ - 印
1025
+ - 刷
1026
+ - 滞
1027
+ - 洋
1028
+ - 昨
1029
+ - 功
1030
+ - 驚
1031
+ - 右
1032
+ - 左
1033
+ - 訛
1034
+ - 郷
1035
+ - 貧
1036
+ - 惑
1037
+ - 華
1038
+ - 総
1039
+ - 矛
1040
+ - 盾
1041
+ - 頂
1042
+ - 洞
1043
+ - 窟
1044
+ - 辞
1045
+ - 思
1046
+ - 推
1047
+ - 衛
1048
+ - 兵
1049
+ - 振
1050
+ - 担
1051
+ - 渡
1052
+ - 患
1053
+ - 団
1054
+ - ヤ
1055
+ - 皆
1056
+ - 還
1057
+ - 船
1058
+ - 鏡
1059
+ - 胞
1060
+ - 照
1061
+ - 億
1062
+ - 釈
1063
+ - 犬
1064
+ - 罪
1065
+ - 帝
1066
+ - 転
1067
+ - ×
1068
+ - 夜
1069
+ - 採
1070
+ - 具
1071
+ - 深
1072
+ - 千
1073
+ - 布
1074
+ - 危
1075
+ - 襲
1076
+ - 宅
1077
+ - 免
1078
+ - 疫
1079
+ - 為
1080
+ - 芸
1081
+ - 勧
1082
+ - 固
1083
+ - 像
1084
+ - 届
1085
+ - 怪
1086
+ - 我
1087
+ - 標
1088
+ - 半
1089
+ - 沿
1090
+ - 声
1091
+ - 朝
1092
+ - 礁
1093
+ - 「
1094
+ - 」
1095
+ - 崩
1096
+ - 枚
1097
+ - 引
1098
+ - —
1099
+ - 熱
1100
+ - 災
1101
+ - 玉
1102
+ - 卵
1103
+ - 須
1104
+ - 含
1105
+ - 涙
1106
+ - 乾
1107
+ - 超
1108
+ - 湖
1109
+ - 西
1110
+ - 誕
1111
+ - 渉
1112
+ - 拾
1113
+ - 囚
1114
+ - 陥
1115
+ - 派
1116
+ - 待
1117
+ - 久
1118
+ - 麓
1119
+ - 暗
1120
+ - 敵
1121
+ - 阻
1122
+ - 駐
1123
+ - 屯
1124
+ - 添
1125
+ - 尿
1126
+ - 晶
1127
+ - 列
1128
+ - 巣
1129
+ - 懲
1130
+ - 戒
1131
+ - 績
1132
+ - 善
1133
+ - 互
1134
+ - 棄
1135
+ - 注
1136
+ - 借
1137
+ - 啓
1138
+ - 蒙
1139
+ - 差
1140
+ - 討
1141
+ - 維
1142
+ - 仕
1143
+ - 翌
1144
+ - 裕
1145
+ - 役
1146
+ - 嵐
1147
+ - 漏
1148
+ - 斗
1149
+ - 渦
1150
+ - 個
1151
+ - 誘
1152
+ - 晰
1153
+ - 夢
1154
+ - 繁
1155
+ - 弊
1156
+ - 七
1157
+ - 格
1158
+ - 索
1159
+ - 店
1160
+ - 街
1161
+ - 屋
1162
+ - 築
1163
+ - ���
1164
+ - 洪
1165
+ - 臆
1166
+ - 環
1167
+ - 冷
1168
+ - 貼
1169
+ - 未
1170
+ - 罰
1171
+ - 貿
1172
+ - 易
1173
+ - 従
1174
+ - 息
1175
+ - 貨
1176
+ - 労
1177
+ - 働
1178
+ - 階
1179
+ - 級
1180
+ - 刺
1181
+ - 頭
1182
+ - 脳
1183
+ - 喜
1184
+ - 策
1185
+ - 傘
1186
+ - 羽
1187
+ - 毛
1188
+ - 血
1189
+ - 猛
1190
+ - 禽
1191
+ - 爪
1192
+ - 遅
1193
+ - 博
1194
+ - 希
1195
+ - 薄
1196
+ - 慣
1197
+ - 避
1198
+ - 慢
1199
+ - 疼
1200
+ - 窃
1201
+ - 盗
1202
+ - 乞
1203
+ - 搾
1204
+ - 契
1205
+ - 絡
1206
+ - 滑
1207
+ - 走
1208
+ - 鎖
1209
+ - 値
1210
+ - 飲
1211
+ - 風
1212
+ - 凝
1213
+ - 窓
1214
+ - 若
1215
+ - 殊
1216
+ - 妙
1217
+ - 鍵
1218
+ - 盤
1219
+ - 叩
1220
+ - 屠
1221
+ - 節
1222
+ - 衣
1223
+ - 範
1224
+ - 複
1225
+ - 友
1226
+ - 戚
1227
+ - 完
1228
+ - 吸
1229
+ - 闘
1230
+ - 材
1231
+ - 勉
1232
+ - 好
1233
+ - 句
1234
+ - 章
1235
+ - 座
1236
+ - 席
1237
+ - 覧
1238
+ - 掲
1239
+ - 載
1240
+ - 破
1241
+ - 綻
1242
+ - 扉
1243
+ - 平
1244
+ - 央
1245
+ - 簡
1246
+ - 挫
1247
+ - 条
1248
+ - 至
1249
+ - 返
1250
+ - 署
1251
+ - 批
1252
+ - 准
1253
+ - 裏
1254
+ - 鳴
1255
+ - 磁
1256
+ - 憲
1257
+ - 答
1258
+ - 井
1259
+ - 狭
1260
+ - 退
1261
+ - 字
1262
+ - 訓
1263
+ - 秀
1264
+ - 魚
1265
+ - 毒
1266
+ - 恐
1267
+ - 怖
1268
+ - 怯
1269
+ - 妃
1270
+ - 徒
1271
+ - 宮
1272
+ - 修
1273
+ - 齢
1274
+ - 童
1275
+ - 肝
1276
+ - 胆
1277
+ - 癌
1278
+ - 欲
1279
+ - 宇
1280
+ - 宙
1281
+ - 混
1282
+ - 赤
1283
+ - 潮
1284
+ - 候
1285
+ - 薬
1286
+ - 治
1287
+ - 遂
1288
+ - 晴
1289
+ - 憾
1290
+ - 飼
1291
+ - 犯
1292
+ - 嫌
1293
+ - 荒
1294
+ - ゃ
1295
+ - 横
1296
+ - 越
1297
+ - 披
1298
+ - 露
1299
+ - 狩
1300
+ - 猟
1301
+ - 背
1302
+ - 景
1303
+ - 鉛
1304
+ - 筆
1305
+ - 途
1306
+ - 豚
1307
+ - 蚊
1308
+ - 帳
1309
+ - 虫
1310
+ - 剤
1311
+ - 散
1312
+ - 措
1313
+ - 賞
1314
+ - 該
1315
+ - 賊
1316
+ - 狂
1317
+ - 逃
1318
+ - 滝
1319
+ - 昼
1320
+ - 涼
1321
+ - 執
1322
+ - 万
1323
+ - 称
1324
+ - 補
1325
+ - 助
1326
+ - 駆
1327
+ - 射
1328
+ - 粒
1329
+ - 誰
1330
+ - 卒
1331
+ - 額
1332
+ - 寄
1333
+ - 幼
1334
+ - 揃
1335
+ - 想
1336
+ - 継
1337
+ - 皇
1338
+ - 募
1339
+ - 尾
1340
+ - 花
1341
+ - 沢
1342
+ - 郵
1343
+ - 恒
1344
+ - 賀
1345
+ - 銃
1346
+ - 妻
1347
+ - 瓶
1348
+ - 守
1349
+ - 棒
1350
+ - 織
1351
+ - 艦
1352
+ - 富
1353
+ - 困
1354
+ - 減
1355
+ - 則
1356
+ - 園
1357
+ - 訳
1358
+ - 追
1359
+ - 末
1360
+ - 核
1361
+ - 炉
1362
+ - 鹿
1363
+ - 譲
1364
+ - ふ
1365
+ - 耐
1366
+ - 和
1367
+ - 勝
1368
+ - 香
1369
+ - 都
1370
+ - 拓
1371
+ - 1
1372
+ - 亜
1373
+ - 三
1374
+ - 怒
1375
+ - 豪
1376
+ - 稀
1377
+ - 是
1378
+ - 聖
1379
+ - 壊
1380
+ - ゾ
1381
+ - 墟
1382
+ - 塞
1383
+ - 仏
1384
+ - 寺
1385
+ - 網
1386
+ - 算
1387
+ - 唸
1388
+ - 士
1389
+ - 整
1390
+ - ひ
1391
+ - 孫
1392
+ - 馳
1393
+ - 診
1394
+ - 円
1395
+ - 搬
1396
+ - 里
1397
+ - 需
1398
+ - 福
1399
+ - 祉
1400
+ - 阪
1401
+ - 塊
1402
+ - 唱
1403
+ - 聴
1404
+ - 迅
1405
+ - 疑
1406
+ - 依
1407
+ - 謝
1408
+ - 財
1409
+ - 臣
1410
+ - 就
1411
+ - 籍
1412
+ - –
1413
+ - ¿
1414
+ - º
1415
+ - ¡
1416
+ - <sos/eos>
1417
+ token_type: char
1418
+ train_dtype: float32
1419
+ unused_parameters: true
1420
+ use_adapter: false
1421
+ use_amp: false
1422
+ use_lang_prompt: false
1423
+ use_matplotlib: true
1424
+ use_nlp_prompt: false
1425
+ use_preprocessor: true
1426
+ use_tensorboard: true
1427
+ val_scheduler_criterion:
1428
+ - valid
1429
+ - loss
1430
+ valid_batch_bins: null
1431
+ valid_batch_size: null
1432
+ valid_batch_type: null
1433
+ valid_iterator_type: null
1434
+ valid_max_cache_size: null
1435
+ version: '202402'
1436
+ write_collected_feats: false
hyp.trn ADDED
The diff for this file is too large to render. See raw diff
 
ref.trn ADDED
The diff for this file is too large to render. See raw diff
 
valid.loss.best.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:c018284952f7ac1704449840b377a037649b2debdd31fe53f2f732f3a9a90639
3
+ size 1281974028