Bartelds commited on
Commit
63ffb05
·
1 Parent(s): 146281a

Upload checkpoint, sanitized config, and transcripts for group-dro_mms_set_2

Browse files
Files changed (5) hide show
  1. README.md +41 -0
  2. config.yaml +1666 -0
  3. hyp.trn +0 -0
  4. ref.trn +0 -0
  5. valid.loss.best.pth +3 -0
README.md ADDED
@@ -0,0 +1,41 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ title: "Group-DRO MMS-based ASR model - set 2"
3
+ language: multilingual
4
+ tags:
5
+ - asr
6
+ - group-dro
7
+ - MMS
8
+ license: cc-by-nc-4.0
9
+ ---
10
+
11
+ # Group-DRO MMS-based ASR model - set 2
12
+
13
+ This repository contains a Group-DRO MMS-based automatic speech recognition (ASR) model trained with ESPnet.
14
+ The model was trained on balanced training data from set 2.
15
+
16
+ ## Intended Use
17
+
18
+ This model is intended for ASR. Users can run inference using the provided checkpoint (`valid.loss.best.pth`) and configuration file (`config.yaml`):
19
+ ```bash
20
+ import soundfile as sf
21
+ from espnet2.bin.asr_inference import Speech2Text
22
+
23
+ asr_train_config = "group-dro_mms_set_2/config.yaml"
24
+ asr_model_file = "group-dro_mms_set_2/valid.loss.best.pth"
25
+
26
+ model = Speech2Text.from_pretrained(
27
+ asr_train_config=asr_train_config,
28
+ asr_model_file=asr_model_file
29
+ )
30
+
31
+ speech, _ = sf.read("input.wav")
32
+ text, *_ = model(speech)[0]
33
+
34
+ print("Recognized text:", text)
35
+ ```
36
+
37
+ ## How to Use
38
+
39
+ 1. Clone this repository.
40
+ 2. Use ESPnet’s inference scripts with the provided `config.yaml` and checkpoint file.
41
+ 3. Ensure any external resources referenced in `config.yaml` are available at the indicated relative paths.
config.yaml ADDED
@@ -0,0 +1,1666 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ accum_grad: 16
2
+ adapter: lora
3
+ adapter_conf: {}
4
+ allow_multi_rates: false
5
+ allow_variable_data_keys: false
6
+ aux_ctc_tasks: []
7
+ batch_bins: 1000000
8
+ batch_size: 4
9
+ batch_type: sorted
10
+ best_model_criterion:
11
+ - - valid
12
+ - loss
13
+ - min
14
+ bpemodel: null
15
+ chunk_default_fs: null
16
+ chunk_excluded_key_prefixes: []
17
+ chunk_length: 500
18
+ chunk_shift_ratio: 0.5
19
+ cleaner: null
20
+ collect_stats: false
21
+ create_graph_in_tensorboard: false
22
+ ctc_conf:
23
+ accumulation: false
24
+ agg: mean
25
+ ctc_type: droctc
26
+ dro_group_count: 6
27
+ dro_q_epsilon: 1.0e-10
28
+ dro_step_size: 0.0001
29
+ final_step_size: 0.001
30
+ init_strategy: uniform
31
+ initial_step_size: 0.0001
32
+ laplace_smoothing: 0.0
33
+ max_epoch: 40
34
+ normalize_grad: false
35
+ num_iters_per_epoch: 1200
36
+ running_mean_window: -1
37
+ scheduling: false
38
+ use_running_mean: false
39
+ warmup_steps: 0
40
+ cudnn_benchmark: false
41
+ cudnn_deterministic: true
42
+ cudnn_enabled: true
43
+ decoder: null
44
+ decoder_conf: {}
45
+ detect_anomaly: false
46
+ distributed: false
47
+ drop_last_iter: false
48
+ dry_run: false
49
+ duration_batch_length: -1
50
+ early_stopping_criterion:
51
+ - valid
52
+ - loss
53
+ - min
54
+ encoder: transformer
55
+ encoder_conf:
56
+ attention_dropout_rate: 0.1
57
+ attention_heads: 8
58
+ dropout_rate: 0.1
59
+ input_layer: conv2d2
60
+ linear_units: 1024
61
+ normalize_before: true
62
+ num_blocks: 2
63
+ output_size: 256
64
+ positional_dropout_rate: 0.1
65
+ exclude_weight_decay: false
66
+ exclude_weight_decay_conf: {}
67
+ fold_length:
68
+ - 80000
69
+ - 150
70
+ freeze_param: []
71
+ frontend: s3prl
72
+ frontend_conf:
73
+ download_dir: ./hub
74
+ frontend_conf:
75
+ path_or_url: facebook/mms-300m
76
+ upstream: hf_wav2vec2_custom
77
+ fs: 16k
78
+ multilayer_feature: true
79
+ g2p: null
80
+ grad_clip: 5.0
81
+ grad_clip_type: 2.0
82
+ grad_noise: false
83
+ ignore_init_mismatch: false
84
+ init: xavier_uniform
85
+ init_param: []
86
+ input_size: null
87
+ iterator_type: sequence
88
+ joint_net_conf: null
89
+ keep_nbest_models: 2
90
+ log_interval: null
91
+ log_level: INFO
92
+ max_cache_fd: 32
93
+ max_cache_size: 0.0
94
+ max_epoch: 40
95
+ model: espnet
96
+ model_conf:
97
+ ctc_weight: 1.0
98
+ multiple_iterator: false
99
+ multiprocessing_distributed: false
100
+ nbest_averaging_interval: 0
101
+ ngpu: 1
102
+ no_forward_run: false
103
+ noise_apply_prob: 1.0
104
+ noise_db_range: '13_15'
105
+ noise_scp: null
106
+ non_linguistic_symbols: ./nlsyms.txt
107
+ normalize: utterance_mvn
108
+ normalize_conf: {}
109
+ num_att_plot: 3
110
+ num_cache_chunks: 1024
111
+ num_iters_per_epoch: 1200
112
+ num_workers: 4
113
+ optim: adam
114
+ optim_conf:
115
+ lr: 0.0001
116
+ weight_decay: 1.0e-06
117
+ output_dir: ./inference_results
118
+ patience: null
119
+ postencoder: null
120
+ postencoder_conf: {}
121
+ preencoder: linear
122
+ preencoder_conf:
123
+ input_size: 1024
124
+ output_size: 80
125
+ preprocessor: default
126
+ preprocessor_conf: {}
127
+ pretrain_path: null
128
+ print_config: false
129
+ required:
130
+ - output_dir
131
+ - token_list
132
+ resume: true
133
+ rir_apply_prob: 1.0
134
+ rir_scp: null
135
+ save_strategy: all
136
+ scheduler: null
137
+ scheduler_conf: {}
138
+ seed: 0
139
+ sharded_ddp: false
140
+ short_noise_thres: 0.5
141
+ shuffle_within_batch: false
142
+ sort_batch: descending
143
+ sort_in_batch: descending
144
+ specaug: specaug
145
+ specaug_conf:
146
+ apply_freq_mask: true
147
+ apply_time_mask: true
148
+ apply_time_warp: true
149
+ freq_mask_width_range:
150
+ - 0
151
+ - 27
152
+ num_freq_mask: 2
153
+ num_time_mask: 10
154
+ time_mask_width_ratio_range:
155
+ - 0.0
156
+ - 0.05
157
+ time_warp_mode: bicubic
158
+ time_warp_window: 5
159
+ speech_volume_normalize: null
160
+ token_list:
161
+ - <blank>
162
+ - <unk>
163
+ - <space>
164
+ - E
165
+ - A
166
+ - O
167
+ - I
168
+ - N
169
+ - T
170
+ - R
171
+ - S
172
+ - L
173
+ - D
174
+ - U
175
+ - C
176
+ - P
177
+ - M
178
+ - V
179
+ - H
180
+ - ا
181
+ - K
182
+ - J
183
+ - G
184
+ - ی
185
+ - B
186
+ - Z
187
+ - ر
188
+ - ن
189
+ - م
190
+ - F
191
+ - د
192
+ - ه
193
+ - Y
194
+ - و
195
+ - ت
196
+ - ب
197
+ - W
198
+ - '[fas]'
199
+ - '[eng]'
200
+ - Č
201
+ - ک
202
+ - س
203
+ - Á
204
+ - ش
205
+ - Ž
206
+ - Š
207
+ - ل
208
+ - ز
209
+ - Í
210
+ - Ý
211
+ - '[slk]'
212
+ - '[ita]'
213
+ - خ
214
+ - 的
215
+ - Ú
216
+ - '[hrv]'
217
+ - É
218
+ - '0'
219
+ - گ
220
+ - '[yue]'
221
+ - Ť
222
+ - ف
223
+ - ق
224
+ - Q
225
+ - ج
226
+ - '1'
227
+ - ع
228
+ - پ
229
+ - چ
230
+ - Ć
231
+ - ح
232
+ - Ľ
233
+ - '2'
234
+ - آ
235
+ - È
236
+ - X
237
+ - 在
238
+ - ،
239
+ - ؟
240
+ - Ô
241
+ - '9'
242
+ - À
243
+ - 有
244
+ - ص
245
+ - 一
246
+ - 是
247
+ - '3'
248
+ - 人
249
+ - Đ
250
+ - '5'
251
+ - ط
252
+ - '6'
253
+ - '4'
254
+ - Ó
255
+ - '8'
256
+ - Ä
257
+ - Ù
258
+ - 他
259
+ - 大
260
+ - 為
261
+ - Ď
262
+ - 國
263
+ - 不
264
+ - 中
265
+ - 時
266
+ - Ň
267
+ - 這
268
+ - 和
269
+ - 們
270
+ - 以
271
+ - 能
272
+ - 多
273
+ - 上
274
+ - 會
275
+ - 了
276
+ - 要
277
+ - 到
278
+ - '7'
279
+ - 個
280
+ - 於
281
+ - 可
282
+ - 行
283
+ - 年
284
+ - غ
285
+ - 成
286
+ - ذ
287
+ - ض
288
+ - 地
289
+ - 來
290
+ - 「
291
+ - 」
292
+ - 方
293
+ - 得
294
+ - 之
295
+ - 常
296
+ - 亞
297
+ - 我
298
+ - ظ
299
+ - 生
300
+ - 對
301
+ - 也
302
+ - 並
303
+ - 分
304
+ - 公
305
+ - 用
306
+ - 過
307
+ - 些
308
+ - 子
309
+ - 後
310
+ - 部
311
+ - 其
312
+ - 日
313
+ - 所
314
+ - 發
315
+ - 車
316
+ - 但
317
+ - 、
318
+ - 此
319
+ - 美
320
+ - 加
321
+ - Ò
322
+ - 同
323
+ - 就
324
+ - 比
325
+ - 長
326
+ - 表
327
+ - ك
328
+ - 更
329
+ - 重
330
+ - 度
331
+ - 斯
332
+ - 家
333
+ - 空
334
+ - 經
335
+ - 作
336
+ - 間
337
+ - 您
338
+ - ى
339
+ - 現
340
+ - 自
341
+ - 與
342
+ - 獲
343
+ - 或
344
+ - 數
345
+ - 出
346
+ - 動
347
+ - 第
348
+ - 月
349
+ - 英
350
+ - 教
351
+ - 馬
352
+ - 種
353
+ - 力
354
+ - 西
355
+ - 特
356
+ - 必
357
+ - 通
358
+ - ئ
359
+ - ث
360
+ - 提
361
+ - 體
362
+ - 事
363
+ - 至
364
+ - 該
365
+ - 前
366
+ - 類
367
+ - 最
368
+ - 外
369
+ - 本
370
+ - 將
371
+ - 示
372
+ - 當
373
+ - 認
374
+ - 水
375
+ - ي
376
+ - 知
377
+ - 學
378
+ - 位
379
+ - 球
380
+ - 聯
381
+ - 被
382
+ - 從
383
+ - 開
384
+ - 目
385
+ - 變
386
+ - 拉
387
+ - 任
388
+ - 期
389
+ - 下
390
+ - 明
391
+ - 非
392
+ - 少
393
+ - 已
394
+ - 沒
395
+ - 起
396
+ - 員
397
+ - 電
398
+ - 小
399
+ - 都
400
+ - 法
401
+ - 理
402
+ - 入
403
+ - 式
404
+ - 正
405
+ - 著
406
+ - 造
407
+ - 說
408
+ - 及
409
+ - 稱
410
+ - 名
411
+ - 結
412
+ - 受
413
+ - 你
414
+ - 許
415
+ - 隊
416
+ - 達
417
+ - 而
418
+ - 擊
419
+ - 道
420
+ - 定
421
+ - 型
422
+ - 因
423
+ - 文
424
+ - 今
425
+ - 軍
426
+ - 進
427
+ - 路
428
+ - 太
429
+ - 解
430
+ - 量
431
+ - 航
432
+ - 三
433
+ - 者
434
+ - 確
435
+ - 手
436
+ - 主
437
+ - 關
438
+ - 未
439
+ - 心
440
+ - 語
441
+ - 曾
442
+ - 世
443
+ - 使
444
+ - 相
445
+ - 節
446
+ - 季
447
+ - 性
448
+ - 院
449
+ - 感
450
+ - 程
451
+ - 爾
452
+ - 須
453
+ - 口
454
+ - 應
455
+ - 較
456
+ - 歷
457
+ - 旅
458
+ - 己
459
+ - ژ
460
+ - Ĺ
461
+ - 代
462
+ - 印
463
+ - 基
464
+ - 里
465
+ - 王
466
+ - 讓
467
+ - 賽
468
+ - 機
469
+ - 然
470
+ - 報
471
+ - 利
472
+ - 物
473
+ - 存
474
+ - 民
475
+ - 還
476
+ - 改
477
+ - 四
478
+ - 化
479
+ - 合
480
+ - 風
481
+ - 海
482
+ - 羅
483
+ - 很
484
+ - 兩
485
+ - 面
486
+ - 且
487
+ - 強
488
+ - 記
489
+ - 史
490
+ - 控
491
+ - 連
492
+ - 某
493
+ - 身
494
+ - 南
495
+ - 處
496
+ - 座
497
+ - 意
498
+ - 全
499
+ - 字
500
+ - 場
501
+ - 準
502
+ - 視
503
+ - 備
504
+ - 樣
505
+ - 供
506
+ - 服
507
+ - 產
508
+ - 工
509
+ - 選
510
+ - 客
511
+ - 它
512
+ - 才
513
+ - 德
514
+ - 新
515
+ - 天
516
+ - 看
517
+ - 器
518
+ - 像
519
+ - Ì
520
+ - 爭
521
+ - 議
522
+ - 指
523
+ - 形
524
+ - 輕
525
+ - 流
526
+ - 次
527
+ - 北
528
+ - 巴
529
+ - 阿
530
+ - 區
531
+ - 統
532
+ - 由
533
+ - 件
534
+ - 信
535
+ - 傳
536
+ - 預
537
+ - 續
538
+ - 維
539
+ - 標
540
+ - 始
541
+ - 健
542
+ - 龍
543
+ - 活
544
+ - 約
545
+ - 持
546
+ - 塔
547
+ - 務
548
+ - 單
549
+ - 運
550
+ - 保
551
+ - 戰
552
+ - 幾
553
+ - 城
554
+ - 裡
555
+ - 難
556
+ - 高
557
+ - 原
558
+ - 回
559
+ - 住
560
+ - :
561
+ - 船
562
+ - 弓
563
+ - 題
564
+ - 二
565
+ - 打
566
+ - 百
567
+ - 帶
568
+ - 如
569
+ - ِ
570
+ - °
571
+ - 充
572
+ - 育
573
+ - 管
574
+ - 仍
575
+ - 政
576
+ - 見
577
+ - 孩
578
+ - 山
579
+ - 市
580
+ - 建
581
+ - 安
582
+ - 各
583
+ - 試
584
+ - 飛
585
+ - 組
586
+ - 網
587
+ - 裝
588
+ - 置
589
+ - 班
590
+ - 義
591
+ - 何
592
+ - 居
593
+ - 需
594
+ - 交
595
+ - 令
596
+ - 給
597
+ - 證
598
+ - 每
599
+ - 克
600
+ - 否
601
+ - 內
602
+ - 伊
603
+ - 影
604
+ - 女
605
+ - 石
606
+ - 科
607
+ - 華
608
+ - 計
609
+ - 萬
610
+ - 攻
611
+ - 先
612
+ - 超
613
+ - 訂
614
+ - 遊
615
+ - 門
616
+ - 站
617
+ - 好
618
+ - 測
619
+ - 果
620
+ - 參
621
+ - 士
622
+ - Ü
623
+ - 補
624
+ - 老
625
+ - 陸
626
+ - 野
627
+ - 況
628
+ - 東
629
+ - 鬆
630
+ - 死
631
+ - 護
632
+ - 支
633
+ - 織
634
+ - 導
635
+ - 牙
636
+ - 永
637
+ - 功
638
+ - 波
639
+ - 佳
640
+ - 聲
641
+ - 司
642
+ - 拿
643
+ - 狀
644
+ - 元
645
+ - 素
646
+ - 樂
647
+ - 除
648
+ - 官
649
+ - 則
650
+ - 洲
651
+ - 抵
652
+ - 響
653
+ - 即
654
+ - 故
655
+ - 島
656
+ - 商
657
+ - 條
658
+ - 希
659
+ - 角
660
+ - 實
661
+ - 油
662
+ - 立
663
+ - 份
664
+ - 沿
665
+ - 極
666
+ - 再
667
+ - 訊
668
+ - 雨
669
+ - 越
670
+ - 制
671
+ - 洛
672
+ - 核
673
+ - 業
674
+ - 求
675
+ - 足
676
+ - 週
677
+ - 失
678
+ - 洋
679
+ - 舉
680
+ - 總
681
+ - ·
682
+ - 雲
683
+ - 修
684
+ - ً
685
+ - 眾
686
+ - 皆
687
+ - 儘
688
+ - 九
689
+ - 遭
690
+ - 監
691
+ - 母
692
+ - 情
693
+ - 養
694
+ - 接
695
+ - 富
696
+ - 汗
697
+ - 廟
698
+ - 紀
699
+ - 輸
700
+ - 摩
701
+ - 做
702
+ - 仰
703
+ - 蘭
704
+ - 績
705
+ - 幅
706
+ - 繼
707
+ - 版
708
+ - 權
709
+ - 訴
710
+ - 洞
711
+ - 般
712
+ - 群
713
+ - 哈
714
+ - 久
715
+ - 卡
716
+ - 具
717
+ - 早
718
+ - 布
719
+ - 包
720
+ - 界
721
+ - 微
722
+ - 病
723
+ - 質
724
+ - 烈
725
+ - 七
726
+ - 六
727
+ - 轉
728
+ - 音
729
+ - 放
730
+ - 團
731
+ - 歐
732
+ - 短
733
+ - 盟
734
+ - 溫
735
+ - 往
736
+ - 尼
737
+ - 尺
738
+ - 別
739
+ - 屬
740
+ - 金
741
+ - 低
742
+ - 無
743
+ - 論
744
+ - 損
745
+ - 害
746
+ - 橫
747
+ - 去
748
+ - 向
749
+ - 取
750
+ - 甚
751
+ - 熱
752
+ - 《
753
+ - 衛
754
+ - 》
755
+ - 銀
756
+ - 魚
757
+ - 騎
758
+ - 兵
759
+ - 項
760
+ - 府
761
+ - 擁
762
+ - 反
763
+ - 平
764
+ - 票
765
+ - 線
766
+ - 底
767
+ - 登
768
+ - 承
769
+ - 助
770
+ - 差
771
+ - 冰
772
+ - 查
773
+ - 樹
774
+ - 找
775
+ - 例
776
+ - 鮮
777
+ - 火
778
+ - 點
779
+ - 奧
780
+ - 圖
781
+ - 算
782
+ - 奇
783
+ - 演
784
+ - 露
785
+ - 顯
786
+ - 途
787
+ - 光
788
+ - 潛
789
+ - 社
790
+ - 酒
791
+ - 神
792
+ - ّ
793
+ - Ŕ
794
+ - 滿
795
+ - 師
796
+ - 皇
797
+ - 顛
798
+ - 緊
799
+ - 密
800
+ - 禁
801
+ - ;
802
+ - 缺
803
+ - 坦
804
+ - 靜
805
+ - 識
806
+ - 醒
807
+ - 納
808
+ - 慶
809
+ - 餘
810
+ - 她
811
+ - 殊
812
+ - 校
813
+ - 考
814
+ - 升
815
+ - 亡
816
+ - 侵
817
+ - 犯
818
+ - 束
819
+ - 徑
820
+ - 適
821
+ - 香
822
+ - 港
823
+ - 讀
824
+ - 綠
825
+ - ‧
826
+ - 宣
827
+ - 休
828
+ - 括
829
+ - 輪
830
+ - 驚
831
+ - 快
832
+ - 速
833
+ - 息
834
+ - 號
835
+ - 申
836
+ - 態
837
+ - 族
838
+ - 尿
839
+ - 晚
840
+ - 眼
841
+ - 省
842
+ - 述
843
+ - 周
844
+ - 晨
845
+ - 燈
846
+ - 彎
847
+ - 符
848
+ - 迴
849
+ - 直
850
+ - 稅
851
+ - 氣
852
+ - 列
853
+ - 頭
854
+ - 房
855
+ - 領
856
+ - 寬
857
+ - 花
858
+ - 豹
859
+ - 只
860
+ - 邊
861
+ - 首
862
+ - 設
863
+ - 專
864
+ - 案
865
+ - 近
866
+ - 降
867
+ - 救
868
+ - 局
869
+ - 資
870
+ - 壓
871
+ - 品
872
+ - 牠
873
+ - 跨
874
+ - 命
875
+ - 製
876
+ - 食
877
+ - 半
878
+ - 游
879
+ - 氏
880
+ - 投
881
+ - 想
882
+ - 根
883
+ - 白
884
+ - 等
885
+ - 康
886
+ - 問
887
+ - 望
888
+ - 消
889
+ - 夠
890
+ - 排
891
+ - 針
892
+ - 捕
893
+ - 留
894
+ - 收
895
+ - 止
896
+ - 判
897
+ - 園
898
+ - 彩
899
+ - 土
900
+ - 餐
901
+ - 暴
902
+ - 夜
903
+ - 腦
904
+ - 幫
905
+ - 帕
906
+ - 系
907
+ - 千
908
+ - 似
909
+ - 邦
910
+ - 決
911
+ - 窗
912
+ - 戶
913
+ - 朝
914
+ - 景
915
+ - 附
916
+ - 格
917
+ - 堡
918
+ - 丹
919
+ - 真
920
+ - 霄
921
+ - 清
922
+ - 增
923
+ - 色
924
+ - 賓
925
+ - 州
926
+ - 陽
927
+ - 射
928
+ - 星
929
+ - 際
930
+ - 境
931
+ - 營
932
+ - 驗
933
+ - 端
934
+ - 衣
935
+ - 遠
936
+ - 艇
937
+ - 刑
938
+ - 那
939
+ - َ
940
+ - ؛
941
+ - ـ
942
+ - ٔ
943
+ - –
944
+ - Ç
945
+ - 范
946
+ - 浩
947
+ - 揚
948
+ - 涯
949
+ - 峰
950
+ - 勝
951
+ - 童
952
+ - 父
953
+ - 智
954
+ - 嚴
955
+ - 陷
956
+ - 河
957
+ - 青
958
+ - 圍
959
+ - 蓋
960
+ - 寺
961
+ - 粒
962
+ - 治
963
+ - 卻
964
+ - 完
965
+ - 督
966
+ - 徒
967
+ - 席
968
+ - 榮
969
+ - 駐
970
+ - 推
971
+ - 恐
972
+ - 紐
973
+ - 佛
974
+ - 構
975
+ - 敏
976
+ - 效
977
+ - 率
978
+ - 察
979
+ - 莎
980
+ - 簡
981
+ - 患
982
+ - 限
983
+ - 請
984
+ - 移
985
+ - 另
986
+ - 研
987
+ - 究
988
+ - 貓
989
+ - 聚
990
+ - 氰
991
+ - 觀
992
+ - 莫
993
+ - 颱
994
+ - 距
995
+ - 離
996
+ - 福
997
+ - 十
998
+ - 據
999
+ - 敲
1000
+ - 盡
1001
+ - 巡
1002
+ - 探
1003
+ - 險
1004
+ - 諾
1005
+ - 征
1006
+ - 削
1007
+ - 減
1008
+ - 宇
1009
+ - 細
1010
+ - 菌
1011
+ - 殖
1012
+ - 俄
1013
+ - 蘇
1014
+ - 討
1015
+ - 煮
1016
+ - 店
1017
+ - 屋
1018
+ - 歧
1019
+ - 架
1020
+ - 毀
1021
+ - 罹
1022
+ - 切
1023
+ - 虎
1024
+ - 臘
1025
+ - 畢
1026
+ - 哥
1027
+ - 係
1028
+ - 盛
1029
+ - 頓
1030
+ - .
1031
+ - 契
1032
+ - 互
1033
+ - 獨
1034
+ - 桶
1035
+ - 順
1036
+ - 牛
1037
+ - 鹿
1038
+ - 乎
1039
+ - 醫
1040
+ - 刻
1041
+ - 急
1042
+ - 送
1043
+ - 梭
1044
+ - 略
1045
+ - 典
1046
+ - 序
1047
+ - 貫
1048
+ - 憶
1049
+ - 寄
1050
+ - 庭
1051
+ - 畫
1052
+ - 致
1053
+ - 旦
1054
+ - 濟
1055
+ - 澳
1056
+ - 瓜
1057
+ - 鯊
1058
+ - 尚
1059
+ - 彼
1060
+ - 努
1061
+ - 尋
1062
+ - 睡
1063
+ - 覺
1064
+ - 夏
1065
+ - 眠
1066
+ - 跑
1067
+ - 步
1068
+ - 絕
1069
+ - 困
1070
+ - 曼
1071
+ - 林
1072
+ - 審
1073
+ - 張
1074
+ - 呈
1075
+ - 啟
1076
+ - 賣
1077
+ - 勒
1078
+ - 雷
1079
+ - 疫
1080
+ - 森
1081
+ - 屈
1082
+ - 佐
1083
+ - 館
1084
+ - 伯
1085
+ - 退
1086
+ - 鞋
1087
+ - 滑
1088
+ - 款
1089
+ - 調
1090
+ - 依
1091
+ - 僅
1092
+ - 堅
1093
+ - 硬
1094
+ - 警
1095
+ - 筆
1096
+ - 五
1097
+ - 劃
1098
+ - 競
1099
+ - 破
1100
+ - 擇
1101
+ - 料
1102
+ - 價
1103
+ - 廳
1104
+ - 濃
1105
+ - 毒
1106
+ - 歲
1107
+ - 傷
1108
+ - 模
1109
+ - 守
1110
+ - 莉
1111
+ - 共
1112
+ - 麥
1113
+ - 牌
1114
+ - 深
1115
+ - 斷
1116
+ - 混
1117
+ - 淆
1118
+ - 爆
1119
+ - 繪
1120
+ - 書
1121
+ - 錄
1122
+ - 獎
1123
+ - 攜
1124
+ - 儀
1125
+ - 什
1126
+ - 麼
1127
+ - 骨
1128
+ - 艾
1129
+ - 遺
1130
+ - 疲
1131
+ - 彈
1132
+ - 鋼
1133
+ - 琴
1134
+ - 泰
1135
+ - 舞
1136
+ - 台
1137
+ - 鄰
1138
+ - 段
1139
+ - 估
1140
+ - 閒
1141
+ - 肯
1142
+ - 告
1143
+ - 索
1144
+ - 念
1145
+ - 防
1146
+ - 避
1147
+ - 咖
1148
+ - 碼
1149
+ - 親
1150
+ - 隻
1151
+ - 猛
1152
+ - 黑
1153
+ - 厄
1154
+ - 址
1155
+ - 樓
1156
+ - 殿
1157
+ - 帝
1158
+ - 簽
1159
+ - 釀
1160
+ - 租
1161
+ - 磅
1162
+ - 斤
1163
+ - ��
1164
+ - 穿
1165
+ - 捲
1166
+ - 習
1167
+ - 廣
1168
+ - 刀
1169
+ - 言
1170
+ - 片
1171
+ - 飲
1172
+ - 糖
1173
+ - 換
1174
+ - 泡
1175
+ - …
1176
+ - »
1177
+ - «
1178
+ - ُ
1179
+ - ؤ
1180
+ - ”
1181
+ - Ö
1182
+ - ²
1183
+ - º
1184
+ - ’
1185
+ - ̇
1186
+ - 倡
1187
+ - 易
1188
+ - 兒
1189
+ - 棄
1190
+ - 域
1191
+ - 銅
1192
+ - 範
1193
+ - 涵
1194
+ - 豬
1195
+ - 暹
1196
+ - 頂
1197
+ - 末
1198
+ - 值
1199
+ - 耶
1200
+ - 跋
1201
+ - 藉
1202
+ - 鬧
1203
+ - 鐘
1204
+ - 採
1205
+ - 薩
1206
+ - 剩
1207
+ - 援
1208
+ - 韓
1209
+ - 享
1210
+ - 古
1211
+ - 鳥
1212
+ - 銳
1213
+ - 檢
1214
+ - 恩
1215
+ - 普
1216
+ - 萊
1217
+ - 漢
1218
+ - 捷
1219
+ - 貢
1220
+ - 獻
1221
+ - 擔
1222
+ - 憂
1223
+ - 症
1224
+ - 染
1225
+ - 峽
1226
+ - 谷
1227
+ - 貴
1228
+ - 奪
1229
+ - 激
1230
+ - 胺
1231
+ - 酸
1232
+ - 晶
1233
+ - 截
1234
+ - 凌
1235
+ - 汽
1236
+ - 搖
1237
+ - 滾
1238
+ - 寓
1239
+ - 哪
1240
+ - 謹
1241
+ - 慎
1242
+ - 慮
1243
+ - 宙
1244
+ - 膨
1245
+ - 脹
1246
+ - 暖
1247
+ - 候
1248
+ - 繁
1249
+ - 婦
1250
+ - 飯
1251
+ - 街
1252
+ - 櫃
1253
+ - 檯
1254
+ - 朗
1255
+ - 慘
1256
+ - 墜
1257
+ - 又
1258
+ - 獅
1259
+ - 吼
1260
+ - 嘯
1261
+ - 駝
1262
+ - 麋
1263
+ - 熊
1264
+ - 逝
1265
+ - 貌
1266
+ - 吾
1267
+ - 思
1268
+ - 靈
1269
+ - 脈
1270
+ - 繞
1271
+ - 串
1272
+ - 注
1273
+ - 仗
1274
+ - 左
1275
+ - 右
1276
+ - 疾
1277
+ - 悅
1278
+ - 爐
1279
+ - 紙
1280
+ - 暗
1281
+ - 殼
1282
+ - 志
1283
+ - 圭
1284
+ - 獵
1285
+ - 農
1286
+ - 怕
1287
+ - 走
1288
+ - 悉
1289
+ - 鞍
1290
+ - 毫
1291
+ - 背
1292
+ - 姓
1293
+ - 職
1294
+ - 呼
1295
+ - 拖
1296
+ - 鏢
1297
+ - 擲
1298
+ - 技
1299
+ - 尖
1300
+ - 握
1301
+ - 漫
1302
+ - 晝
1303
+ - 耐
1304
+ - 返
1305
+ - 崗
1306
+ - 紓
1307
+ - 岩
1308
+ - 皮
1309
+ - 善
1310
+ - 葛
1311
+ - 獄
1312
+ - 臨
1313
+ - 釋
1314
+ - 拘
1315
+ - 敗
1316
+ - 拍
1317
+ - 券
1318
+ - 窯
1319
+ - 烹
1320
+ - 烘
1321
+ - 烤
1322
+ - 錫
1323
+ - 炎
1324
+ - 苗
1325
+ - 亨
1326
+ - 抽
1327
+ - 精
1328
+ - 污
1329
+ - 執
1330
+ - 銜
1331
+ - 遙
1332
+ - 旁
1333
+ - 雪
1334
+ - 冬
1335
+ - 靴
1336
+ - 威
1337
+ - 脅
1338
+ - 勸
1339
+ - 閉
1340
+ - 齒
1341
+ - 咬
1342
+ - 碎
1343
+ - 葉
1344
+ - 枝
1345
+ - 搞
1346
+ - 央
1347
+ - 竊
1348
+ - 象
1349
+ - 徵
1350
+ - 假
1351
+ - 偷
1352
+ - 陌
1353
+ - 終
1354
+ - 椅
1355
+ - 砸
1356
+ - 玻
1357
+ - 璃
1358
+ - 憲
1359
+ - 彙
1360
+ - 集
1361
+ - 搜
1362
+ - 宗
1363
+ - 惠
1364
+ - 隨
1365
+ - 雅
1366
+ - 軟
1367
+ - 匹
1368
+ - 敵
1369
+ - 禍
1370
+ - 葬
1371
+ - 禮
1372
+ - 擬
1373
+ - 材
1374
+ - 瞭
1375
+ - 壘
1376
+ - 倖
1377
+ - 嘆
1378
+ - 茱
1379
+ - 吉
1380
+ - 卸
1381
+ - 枚
1382
+ - 幣
1383
+ - 聽
1384
+ - 默
1385
+ - 米
1386
+ - 鬥
1387
+ - 駕
1388
+ - 駛
1389
+ - 茲
1390
+ - 拒
1391
+ - 墮
1392
+ - 胎
1393
+ - 倫
1394
+ - 評
1395
+ - 弗
1396
+ - /
1397
+ - 床
1398
+ - 沉
1399
+ - 匈
1400
+ - 蘋
1401
+ - 話
1402
+ - 創
1403
+ - 復
1404
+ - 賞
1405
+ - 旗
1406
+ - 操
1407
+ - 頻
1408
+ - 誕
1409
+ - ?
1410
+ - 勞
1411
+ - 鍵
1412
+ - 唱
1413
+ - 蒂
1414
+ - 芬
1415
+ - 跌
1416
+ - 落
1417
+ - 便
1418
+ - 擅
1419
+ - 壁
1420
+ - 潦
1421
+ - 草
1422
+ - 跡
1423
+ - 塗
1424
+ - 鴉
1425
+ - 妮
1426
+ - 颶
1427
+ - 村
1428
+ - 八
1429
+ - 堂
1430
+ - 埃
1431
+ - 疑
1432
+ - 層
1433
+ - 贏
1434
+ - 紅
1435
+ - 穴
1436
+ - 浮
1437
+ - 卷
1438
+ - 竄
1439
+ - 霍
1440
+ - 胡
1441
+ - 寸
1442
+ - 灘
1443
+ - 訪
1444
+ - 誘
1445
+ - 夢
1446
+ - 倦
1447
+ - 碩
1448
+ - 頒
1449
+ - 灣
1450
+ - 費
1451
+ - 劇
1452
+ - 奈
1453
+ - 殺
1454
+ - 炸
1455
+ - 辦
1456
+ - 環
1457
+ - 艙
1458
+ - 柯
1459
+ - 巨
1460
+ - 哩
1461
+ - 優
1462
+ - 椰
1463
+ - 奶
1464
+ - 術
1465
+ - 尾
1466
+ - 耳
1467
+ - 蹈
1468
+ - 托
1469
+ - 戲
1470
+ - 旺
1471
+ - 弱
1472
+ - 懼
1473
+ - 願
1474
+ - 衡
1475
+ - 夫
1476
+ - 妻
1477
+ - 婚
1478
+ - 友
1479
+ - 祝
1480
+ - 燒
1481
+ - 喉
1482
+ - 嚨
1483
+ - 痛
1484
+ - 良
1485
+ - 待
1486
+ - 乘
1487
+ - 委
1488
+ - 瑞
1489
+ - 淨
1490
+ - 延
1491
+ - 停
1492
+ - 舒
1493
+ - 把
1494
+ - 爪
1495
+ - 馳
1496
+ - 迅
1497
+ - 盒
1498
+ - 批
1499
+ - 准
1500
+ - 柔
1501
+ - 屆
1502
+ - 齊
1503
+ - 藤
1504
+ - 仁
1505
+ - 歡
1506
+ - 吧
1507
+ - 蕾
1508
+ - 秀
1509
+ - 興
1510
+ - 汀
1511
+ - 億
1512
+ - 財
1513
+ - 豪
1514
+ - 榜
1515
+ - 瑟
1516
+ - 署
1517
+ - 愛
1518
+ - 柏
1519
+ - 聖
1520
+ - 詹
1521
+ - 姆
1522
+ - 廠
1523
+ - 旱
1524
+ - 均
1525
+ - 配
1526
+ - 引
1527
+ - 裹
1528
+ - 巾
1529
+ - 豔
1530
+ - 笑
1531
+ - 借
1532
+ - 庫
1533
+ - 洗
1534
+ - 裙
1535
+ - 稍
1536
+ - 男
1537
+ - !
1538
+ - 誌
1539
+ - 壞
1540
+ - 飾
1541
+ - 寫
1542
+ - 味
1543
+ - 渴
1544
+ - 盈
1545
+ - 郁
1546
+ - 啡
1547
+ - 甘
1548
+ - 菊
1549
+ - 茶
1550
+ - 柬
1551
+ - 埔
1552
+ - 寨
1553
+ - 夾
1554
+ - 拔
1555
+ - 築
1556
+ - 板
1557
+ - 扯
1558
+ - 掉
1559
+ - 輛
1560
+ - 拋
1561
+ - 謊
1562
+ - 授
1563
+ - 刊
1564
+ - 魯
1565
+ - 摘
1566
+ - 冠
1567
+ - 沙
1568
+ - 恆
1569
+ - 跟
1570
+ - 漿
1571
+ - 刪
1572
+ - 殘
1573
+ - 嶼
1574
+ - 陣
1575
+ - 迄
1576
+ - 災
1577
+ - 洪
1578
+ - 弧
1579
+ - 側
1580
+ - 傾
1581
+ - 斜
1582
+ - 觸
1583
+ - 緣
1584
+ - 亦
1585
+ - 曲
1586
+ - 遇
1587
+ - 麻
1588
+ - 煩
1589
+ - 播
1590
+ - 棍
1591
+ - 扔
1592
+ - 瓶
1593
+ - 剝
1594
+ - 菲
1595
+ - 律
1596
+ - 潤
1597
+ - 穫
1598
+ - 喬
1599
+ - 坡
1600
+ - 鑽
1601
+ - 躲
1602
+ - 腳
1603
+ - 閱
1604
+ - 泛
1605
+ - 藻
1606
+ - 癱
1607
+ - 瘓
1608
+ - 艘
1609
+ - 派
1610
+ - 艦
1611
+ - 崎
1612
+ - 俚
1613
+ - 鄉
1614
+ - 逗
1615
+ - 李
1616
+ - 副
1617
+ - 郵
1618
+ - 儲
1619
+ - 肝
1620
+ - 臟
1621
+ - 危
1622
+ - 訝
1623
+ - 裔
1624
+ - 初
1625
+ - 罰
1626
+ - 含
1627
+ - 午
1628
+ - 整
1629
+ - 寂
1630
+ - 噴
1631
+ - 撞
1632
+ - 迫
1633
+ - 后
1634
+ - 敞
1635
+ - 鑰
1636
+ - 匙
1637
+ - 伏
1638
+ - 俘
1639
+ - 虜
1640
+ - 規
1641
+ - 俱
1642
+ - 註
1643
+ - 冊
1644
+ - 宿
1645
+ - 鼠
1646
+ - <sos/eos>
1647
+ token_type: char
1648
+ train_dtype: float32
1649
+ unused_parameters: true
1650
+ use_adapter: false
1651
+ use_amp: false
1652
+ use_lang_prompt: false
1653
+ use_matplotlib: true
1654
+ use_nlp_prompt: false
1655
+ use_preprocessor: true
1656
+ use_tensorboard: true
1657
+ val_scheduler_criterion:
1658
+ - valid
1659
+ - loss
1660
+ valid_batch_bins: null
1661
+ valid_batch_size: null
1662
+ valid_batch_type: null
1663
+ valid_iterator_type: null
1664
+ valid_max_cache_size: null
1665
+ version: '202402'
1666
+ write_collected_feats: false
hyp.trn ADDED
The diff for this file is too large to render. See raw diff
 
ref.trn ADDED
The diff for this file is too large to render. See raw diff
 
valid.loss.best.pth ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:5c94e26d9ee044aacfce862bbe856bc3f80af770d6e2f348d434379a72da55ef
3
+ size 1282210444