metadata

license: llama3
base_model: elyza/Llama-3-ELYZA-JP-8B
tags:
  - japanese
  - legal
  - judicial-exam
  - 司法試験
  - fine-tuned
  - llama
  - peft
  - lora
language:
  - ja
datasets:
  - custom-judicial-exam-dataset

司法試験特化日本語LLM

モデル概要

このモデルはelyza/Llama-3-ELYZA-JP-8Bをベースに、日本の司法試験問題でファインチューニングした特化モデルです。

特徴

ベースモデル: elyza/Llama-3-ELYZA-JP-8B
特化分野: 日本の司法試験（憲法、民法、刑法等）
言語: 日本語
ファインチューニング手法: QLoRA (Quantized Low-Rank Adaptation)

学習情報

学習データ数: 317件
エポック数: 2
学習時間: 0:05:11.834189
LoRA ランク: 8
学習率: 5e-05

使用方法

LoRAアダプター版（eyepyon/judicial-exam-llama3-jpv3-lora-v2）

from transformers import AutoTokenizer, AutoModelForCausalLM
from peft import PeftModel

base_model = AutoModelForCausalLM.from_pretrained("elyza/Llama-3-ELYZA-JP-8B")
tokenizer = AutoTokenizer.from_pretrained("elyza/Llama-3-ELYZA-JP-8B")
model = PeftModel.from_pretrained(base_model, "eyepyon/judicial-exam-llama3-jpv3-lora-v2")

inputs = tokenizer("司法試験問題:", return_tensors="pt")
outputs = model.generate(**inputs, max_length=512)
response = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(response)

マージ済みモデル版（eyepyon/judicial-exam-llama3-jpv3-merged-v2）

from transformers import AutoTokenizer, AutoModelForCausalLM

model = AutoModelForCausalLM.from_pretrained("eyepyon/judicial-exam-llama3-jpv3-merged-v2")
tokenizer = AutoTokenizer.from_pretrained("eyepyon/judicial-exam-llama3-jpv3-merged-v2")

inputs = tokenizer("司法試験問題:", return_tensors="pt")
outputs = model.generate(**inputs, max_length=512)
response = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(response)

注意事項

このモデルは教育・研究目的で作成されています
実際の司法試験や法的判断には使用しないでください
出力結果は参考程度に留めてください

ライセンス

ベースモデルのLlama 3ライセンスに準拠します。