star-kira-instruct-250426

sarashina2.2-3b-insturuct-v0.1に、まんがタイムきらら作品についての合成対話データセットを追加学習させたモデルです。 きらら作品についての知識量が増加しています。 GGUF版はこちら

Datasets

まんがタイムきらら作品の解説記事を用いて、Deepseek-V3-0324を用いて2万件の対話データを合成しました。 wikipedia記事によって合成したデータセットの一部はこちらで公開しています。

その他、こちらのデータセットを利用させていただきました。

  • Kendamarron/jimba-wiki-instruction-calm3
  • kanhatakeyama/ramdom-to-fixed-multiturn-Calm3
  • Aratako/Synthetic-JP-EN-Coding-Dataset-801k
  • SousiOmine/TagInstruct-JP

How to Use

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline, set_seed

# モデルのロード
model_name = "SousiOmine/star-kira-instruct-250426"
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.bfloat16, device_map="auto")
tokenizer = AutoTokenizer.from_pretrained(model_name)
chat_pipeline = pipeline("text-generation", model=model, tokenizer=tokenizer)
set_seed(123)

# ユーザーの入力
user_input = [{"role": "user", "content": "藤川紡がタイムスリップした要因を説明してください"}]

# モデルによる応答生成
responses = chat_pipeline(
    user_input,
    max_length=500,
    do_sample=True,
    num_return_sequences=3,
)

# 応答を表示
for i, response in enumerate(responses, 1):
    print(f"Response {i}: {response['generated_text']}")
Downloads last month
7
Safetensors
Model size
3.36B params
Tensor type
BF16
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for SousiOmine/star-kira-instruct-250426

Finetuned
(14)
this model
Quantizations
1 model

Datasets used to train SousiOmine/star-kira-instruct-250426