Japanese Risk Classifier / 日本語リスク分類モデル

This is a Japanese BERT-based binary classification model fine-tuned to detect "risk" in medical-related texts.

これは、医療関連の日本語テキストに対して「リスクあり」または「リスクなし」を分類するBERTベースの分類モデルです。


📌 Model Overview / モデル概要

  • Base model / ベースモデル: tohoku-nlp/bert-base-japanese-v3
  • Task / タスク: Sequence classification(文分類)
  • Labels / ラベル:
    • 0: リスクなし(No Risk)
    • 1: リスクあり(Risk Present)
  • Training data / 学習データ: 医療現場での訪問看護記録などの文章(808文)
  • Evaluation:
    • Accuracy: 約86%
    • F1 Score: 約85%
  • Tokenizer: SentencePieceベース(保存済み)

📦 How to Use / 使い方(Python)

from transformers import AutoTokenizer, AutoModelForSequenceClassification

model = AutoModelForSequenceClassification.from_pretrained("あなたのユーザー名/モデル名")
tokenizer = AutoTokenizer.from_pretrained("あなたのユーザー名/モデル名")

text = "夜中に震えがあり、トイレに行けず困ったそうです。"
inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True)
outputs = model(**inputs)
pred = outputs.logits.argmax(dim=1).item()

label_map = {0: "リスクなし", 1: "リスクあり"}
print(label_map[pred])

📄 License / ライセンス

This model is released under the MIT License.
本モデルは MITライセンス のもとで公開されています。


🙋 Author / 作者

  • Hugging Face Username: tetsuo3003(例)
  • Please contact me for inquiries or suggestions.

✨ Notes / 備考

  • 本モデルは医療補助ツールとして設計されており、診断や治療判断の代替にはなりません。
  • This model is intended for research or educational use only. Not for clinical diagnosis.
Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support