--- license: apache-2.0 language: - ja tags: - luke - named entity recognition --- [studio-ousia/luke-japanese-base](https://huggingface.co/studio-ousia/luke-japanese-base)に対して次の変更を加えたモデルです。 - ベースのモデルをRoBERTaから日本語BERTに切り替え、それに伴ってトークナイザがSentencepieceからWordPieceになりました - 2023年7月1日時点の日本語Wikipediaのデータで事前学習をおこないました - `[UNK]` (unknown) エンティティを扱えるようにしました 詳細は[ブログ記事](https://tech.uzabase.com/entry/2023/09/07/172958)をご参照ください。