edvakf's picture
Update README.md
380f2db
|
raw
history blame
657 Bytes
metadata
license: apache-2.0
language:
  - ja
tags:
  - luke
  - named entity recognition

studio-ousia/luke-japanese-baseに対して次の変更を加えたモデルです。

  • ベースのモデルをRoBERTaから日本語BERTに切り替え、それに伴ってトークナイザがSentencepieceからWordPieceになりました
  • 2023年7月1日時点の日本語Wikipediaのデータで事前学習をおこないました
  • [UNK] (unknown) エンティティを扱えるようにしました

詳細はブログ記事をご参照ください。