Macropodus's picture
Upload 8 files
cbbf1e1 verified
|
raw
history blame
992 Bytes

bert4sl_punct_zh_public

时间(time)

2024.6

训练数据构成(dataset)

使用高质量语料过滤而成, 收集高质量语料, 并使用PPL过滤等;

训练说明

每种标点的最大句子数为10万, 总计500万训练句子, 训练3epoch;