|
--- |
|
inference: false |
|
license: mit |
|
language: |
|
- ja |
|
--- |
|
|
|
**Description** |
|
|
|
A Japanese-specialized SentencePiece tokenizer trained for AI Novelist's SuperTrin and Damsel 20B models. |
|
|
|
Vocab size: 52000 (padded to 52224) |
|
|
|
**概要** |
|
|
|
AIのべりすとの「スーパーとりんさま」「やみおとめ20B」向けに訓練・使用されている、日本語のクリエイティブライティングに特化したSentencePieceトークナイザです。 |
|
|
|
ボキャブラリサイズ: 52000 (52224にパディング) |
|
|
|
**Wiki** |
|
|
|
AIのべりすとユーザーWikiにABC/あいうえお順のトークン一覧が掲載されています。 |
|
|
|
https://wikiwiki.jp/ainove_wiki/%E3%83%88%E3%83%BC%E3%82%AF%E3%83%B3%E4%B8%80%E8%A6%A7%28%E3%82%84%E3%81%BF%E3%81%8A%E3%81%A8%E3%82%81%29/1 |
|
|
|
#### Credits |
|
- Sta, AI Novelist Dev (https://ai-novel.com/) @ Bit192, Inc. |
|
|
|
#### License |
|
MIT License |