Spaces:

memorease
/

flan-fine-docker

Runtime error

memorease commited on May 10

Commit

4b4c108

verified ·

1 Parent(s): fe06969

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,25 +1,42 @@
 from flask import Flask, request, jsonify
-from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
 app = Flask(__name__)
-model_id = "memorease/base-t5-v2"
-tokenizer = AutoTokenizer.from_pretrained(model_id, use_fast=False)
-model = AutoModelForSeq2SeqLM.from_pretrained(model_id)
 @app.route("/ask", methods=["POST"])
 def ask_question():
-    data = request.json
-    memory = data["text"]
-    instruction = "Generate a question based on the given memory."
-    prompt = instruction + " " + memory
-    inputs = tokenizer(prompt, return_tensors="pt", truncation=True, padding=True)
-    outputs = model.generate(**inputs, max_new_tokens=64)
-    result = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    return jsonify(question=result)
 if __name__ == "__main__":
     app.run(host="0.0.0.0", port=7860)

+import os
+os.environ["TRANSFORMERS_CACHE"] = "/tmp/hf_cache"
 from flask import Flask, request, jsonify
+from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
+import torch
 app = Flask(__name__)
+# 🔁 Yeni model ismi burada
+model_name = "memorease/base-t5-v2"
+print("[Startup] Loading model...")
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
+print("[Startup] Model loaded.")
 @app.route("/ask", methods=["POST"])
 def ask_question():
+    try:
+        input_text = request.json.get("text")
+        if not input_text:
+            return jsonify({"error": "Missing 'text'"}), 400
+        prompt = f"Only generate a factual and relevant question about this memory: {input_text}"
+        inputs = tokenizer(prompt, return_tensors="pt", padding=True, truncation=True)
+        with torch.no_grad():
+            outputs = model.generate(**inputs, max_new_tokens=64)
+        question = tokenizer.decode(outputs[0], skip_special_tokens=True)
+        return jsonify({"question": question})
+    except Exception as e:
+        return jsonify({"error": str(e)}), 500
+@app.route("/", methods=["GET"])
+def healthcheck():
+    return jsonify({"status": "running"})
 if __name__ == "__main__":
     app.run(host="0.0.0.0", port=7860)