File size: 657 Bytes
9c7c98d
 
 
 
 
 
 
 
 
 
 
 
 
 
 
380f2db
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
---
license: apache-2.0
language:
- ja
tags:
- luke
- named entity recognition
---

[studio-ousia/luke-japanese-base](https://huggingface.co/studio-ousia/luke-japanese-base)に対して次の変更を加えたモデルです。

- ベースのモデルをRoBERTaから日本語BERTに切り替え、それに伴ってトークナイザがSentencepieceからWordPieceになりました
- 2023年7月1日時点の日本語Wikipediaのデータで事前学習をおこないました
- `[UNK]` (unknown) エンティティを扱えるようにしました

詳細は[ブログ記事](https://tech.uzabase.com/entry/2023/09/07/172958)をご参照ください。