Spaces:

YUGOROU
/

TeenEmo-Reasoning-v2-Demo

Paused

YUGOROU commited on Jun 28

Commit

87d0e9d

verified ·

1 Parent(s): ee04def

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -30,13 +30,6 @@ def load_model():
         # モデルの読み込み（GPU使用時は量子化を使用）
         if DEVICE == "cuda":
-            # 量子化設定（メモリ使用量を削減）
-            quantization_config = BitsAndBytesConfig(
-                load_in_4bit=True,
-                bnb_4bit_quant_type="nf4",
-                bnb_4bit_compute_dtype=torch.float16,
-                bnb_4bit_use_double_quant=True,
-            )
             model = AutoModelForCausalLM.from_pretrained(
                 MODEL_NAME,

         # モデルの読み込み（GPU使用時は量子化を使用）
         if DEVICE == "cuda":
             model = AutoModelForCausalLM.from_pretrained(
                 MODEL_NAME,