Spaces:

bagaseptian
/

smartcv-backend

Runtime error

App Files Files Community

bagaseptian commited on May 24

Commit

23d4b72

1 Parent(s): 1aefa24

upload files to huggingface

Browse files

Files changed (7) hide show

Dockerfile +22 -0
README.md +26 -8
app/__init__.py +0 -0
app/ai_processor.py +90 -0
app/main.py +125 -0
app/models.py +5 -0
requirements.txt +10 -0

Dockerfile ADDED Viewed

	@@ -0,0 +1,22 @@

+FROM python:3.10-slim
+#variabel
+ENV PYTHONUNBUFFERED 1
+#local char
+ENV LANG C.UTF-8
+#directory
+WORKDIR /app
+#copyfile requirements
+COPY ./requirements.txt /app/requirements.txt
+#install depedensi
+RUN pip install --no-cache-dir --upgrade pip \
+    && pip install --no-cache-dir --prefer-binary -r /app/requirements.txt
+ #copy aplikasi ke folder
+ COPY ./app /app/app
+ #port
+ EXPOSE 8000
+ #running
+ CMD ["uvicorn", "app.main:app", "--host", "0.0.0.0", "--port", "8000", "--workers", "1"]

README.md CHANGED Viewed

@@ -1,12 +1,30 @@
 ---
-title: Smartcv Backend
-emoji: 🌍
-colorFrom: red
-colorTo: yellow
 sdk: docker
 pinned: false
-license: mit
-short_description: AI summarize
----
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 ---
+title: SmartCV Backend API
+emoji: बुद्धि
+colorFrom: blue
+colorTo: green
 sdk: docker
+app_port: 8000
 pinned: false
+# SmartCV Backend API
+Backend API untuk aplikasi SmartCV.
+Dibangun dengan Python, FastAPI, dan menggunakan model AI dari Hugging Face Transformers untuk meringkas teks pengalaman kerja menjadi format CV yang profesional.
+**Endpoint Utama:**
+- `POST /summarize`: Menerima JSON dengan field `text` dan mengembalikan JSON dengan field `summary`.
+**Teknologi:**
+- Python 3.10
+- FastAPI
+- Uvicorn
+- Pydantic
+- Hugging Face Transformers (Model: [NAMA_MODEL_ANDA, misal google/flan-t5-small])
+## Cara Menjalankan Lokal (Untuk Pengembangan)
+1. `pip install -r requirements.txt`
+2. `uvicorn app.main:app --reload --port 8000`
+## Deployment
+Dideploy ke Hugging Face Spaces menggunakan Docker.

app/__init__.py ADDED Viewed

File without changes

app/ai_processor.py ADDED Viewed

	@@ -0,0 +1,90 @@

+# backend/app/ai_processor.py
+import torch
+from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
+import os
+import traceback # Untuk logging error
+# --- MODEL_NAME tetap sama seperti yang sudah Anda pilih dan uji ---
+MODEL_NAME = "google/flan-t5-small"
+# MODEL_NAME = "facebook/bart-large-cnn"
+# MODEL_NAME = "sshleifer/distilbart-cnn-6-6"
+model = None
+tokenizer = None
+device = None
+def initialize_model():
+    global model, tokenizer, device
+    if model is not None and tokenizer is not None:
+        # print("INFO: AI Processor - Model dan tokenizer sudah dimuat.") # Bisa di-uncomment jika perlu
+        return True
+    try:
+        print(f"INFO: AI Processor - Memulai proses pemuatan model: {MODEL_NAME}...")
+        if torch.cuda.is_available():
+            device = torch.device("cuda")
+            print("INFO: AI Processor - GPU (CUDA) terdeteksi.")
+        else:
+            device = torch.device("cpu")
+            print("INFO: AI Processor - GPU tidak terdeteksi, menggunakan CPU.")
+        print(f"INFO: AI Processor - Memuat tokenizer untuk {MODEL_NAME}...")
+        tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
+        print("INFO: AI Processor - Tokenizer berhasil dimuat.")
+        print(f"INFO: AI Processor - Memuat model {MODEL_NAME} ke device {device}...")
+        model = AutoModelForSeq2SeqLM.from_pretrained(MODEL_NAME)
+        model.to(device)
+        model.eval()
+        print(f"INFO: AI Processor - Model {MODEL_NAME} berhasil dimuat ke {device}.")
+        return True
+    except Exception as e:
+        print(f"ERROR: AI Processor - Gagal memuat model {MODEL_NAME}: {str(e)}")
+        traceback.print_exc()
+        model = None
+        tokenizer = None
+        return False
+def generate_cv_summary(input_text: str) -> str:
+    global model, tokenizer, device
+    if model is None or tokenizer is None:
+        error_msg = "ERROR: AI Processor - Model atau tokenizer belum berhasil diinisialisasi. Coba panggil initialize_model() lagi."
+        print(error_msg)
+        if not initialize_model(): # Coba inisialisasi ulang
+            return error_msg + " Inisialisasi ulang juga gagal."
+        if model is None or tokenizer is None: # Cek lagi setelah coba inisialisasi ulang
+             return "ERROR: AI Processor - Model tetap tidak tersedia setelah mencoba inisialisasi ulang."
+    # Log ini bisa dipertahankan untuk melihat apa yang diproses
+    # print(f"INFO: AI Processor - Menerima teks untuk diringkas (panjang: {len(input_text)} char).")
+    try:
+        # --- PROMPT ANDA YANG SUDAH DISESUAIKAN ---
+        prompt_prefix = "Summarize the following work experience for a professional, ATS-friendly CV. Focus on quantifiable achievements, key responsibilities, and relevant skills. Use concise bullet points if appropriate: "
+        # Atau prompt lain yang sudah Anda temukan bekerja dengan baik.
+        # -----------------------------------------
+        text_to_summarize = prompt_prefix + input_text
+        # print(f"DEBUG: AI Processor - Teks input ke tokenizer: '{text_to_summarize[:100]}...'") # Hapus jika terlalu verbose
+        inputs = tokenizer(text_to_summarize, return_tensors="pt", max_length=1024, truncation=True, padding="longest")
+        input_ids = inputs.input_ids.to(device)
+        attention_mask = inputs.attention_mask.to(device)
+        # print(f"DEBUG: AI Processor - Melakukan inferensi pada device {device}...") # Hapus jika terlalu verbose
+        with torch.no_grad():
+            summary_ids = model.generate(
+                input_ids,
+                attention_mask=attention_mask,
+                max_length=250,
+                min_length=50,
+                num_beams=4,
+                early_stopping=True,
+                no_repeat_ngram_size=3,
+            )
+        summary_text = tokenizer.decode(summary_ids[0], skip_special_tokens=True)
+        # print(f"INFO: AI Processor - Ringkasan digenerate: '{summary_text[:100]}...'") # Bisa dipertahankan
+        return summary_text.strip()
+    except Exception as e:
+        print(f"ERROR: AI Processor - Error saat proses generasi ringkasan: {str(e)}")
+        traceback.print_exc()
+        return "Error: Terjadi masalah internal pada AI saat mencoba membuat ringkasan. Silakan coba lagi."
+# initialize_model() akan dipanggil dari startup event di main.py

app/main.py ADDED Viewed

	@@ -0,0 +1,125 @@

+# backend/app/main.py
+from fastapi import FastAPI, HTTPException
+from fastapi.middleware.cors import CORSMiddleware
+import os
+import traceback # Untuk logging traceback error yang lebih detail
+# Pastikan import dari modul lokal Anda benar
+from .models import TextInput, SummaryOutput
+from .ai_processor import generate_cv_summary, initialize_model as initialize_ai_model
+# python-dotenv hanya berguna untuk pengembangan lokal jika ada .env file.
+# Di produksi (HF Spaces), variabel lingkungan diset melalui secrets.
+# from dotenv import load_dotenv
+# load_dotenv()
+app = FastAPI(
+    title="SmartCV API - Production", # Ganti title jika mau
+    description="API untuk menghasilkan ringkasan CV profesional menggunakan AI.",
+    version="1.0.0" # Ganti versi jika mau
+)
+# --- Konfigurasi CORS untuk Produksi dan Pengembangan ---
+# Daftar origins default yang selalu diizinkan (untuk dev lokal)
+allowed_origins_core = [
+    "http://localhost:3000",
+    "http://localhost:3001", # Jika Anda kadang menggunakan port lain untuk frontend dev
+]
+# Ambil URL frontend dari environment variables (diset di HF Spaces atau Vercel)
+# Untuk HF Spaces, kita akan set VERCEL_FRONTEND_URL sebagai secret
+vercel_url_from_env = os.getenv("VERCEL_FRONTEND_URL")
+if vercel_url_from_env:
+    # Pastikan tidak ada spasi dan hapus trailing slash jika ada
+    cleaned_vercel_url = vercel_url_from_env.strip().rstrip('/')
+    if cleaned_vercel_url: # Pastikan tidak kosong setelah strip
+        allowed_origins_core.append(cleaned_vercel_url)
+        print(f"INFO: Backend - Vercel frontend URL '{cleaned_vercel_url}' ditambahkan ke CORS.")
+    else:
+        print("WARN: Backend - VERCEL_FRONTEND_URL diset tapi kosong setelah dibersihkan.")
+# Ambil URL Gitpod untuk pengembangan (jika berjalan di Gitpod)
+gitpod_workspace_url_from_env = os.getenv("GITPOD_WORKSPACE_URL")
+if gitpod_workspace_url_from_env:
+    frontend_port_gitpod = 3000 # Asumsi port frontend React di Gitpod
+    # Hapus "https://" sebelum membangun URL port
+    gitpod_domain_part = gitpod_workspace_url_from_env.replace('https://', '', 1)
+    gitpod_frontend_origin = f"https://{frontend_port_gitpod}-{gitpod_domain_part}"
+    allowed_origins_core.append(gitpod_frontend_origin)
+    print(f"INFO: Backend - Gitpod frontend URL '{gitpod_frontend_origin}' ditambahkan ke CORS.")
+# Jika tidak ada URL produksi (Vercel) atau Gitpod yang valid terdeteksi selain localhost,
+# mungkin lebih aman untuk TIDAK mengizinkan "*" di produksi.
+# Namun, untuk portofolio ini, jika VERCEL_FRONTEND_URL tidak diset,
+# mungkin kita perlu fallback ke "*" agar tidak error saat pertama kali deploy sebelum set secret.
+# Ini adalah trade-off keamanan vs kemudahan setup awal.
+# Hapus duplikat jika ada
+final_allowed_origins = sorted(list(set(allowed_origins_core)))
+if not any(origin.startswith("https://") for origin in final_allowed_origins if origin not in ["http://localhost:3000", "http://localhost:3001"]):
+    # Jika tidak ada origin HTTPS (Vercel/Gitpod) yang valid, cetak peringatan.
+    # Untuk produksi, idealnya ini tidak terjadi.
+    print("WARN: Backend - Tidak ada origin HTTPS (Vercel/Gitpod) yang dikonfigurasi untuk CORS selain localhost. Ini mungkin tidak aman untuk produksi.")
+    # Jika Anda ingin lebih ketat di produksi dan VERCEL_FRONTEND_URL WAJIB ada:
+    # if not vercel_url_from_env:
+    #     print("CRITICAL: VERCEL_FRONTEND_URL tidak diset! CORS mungkin tidak berfungsi untuk frontend produksi.")
+    #     # Anda bisa memilih untuk raise error di sini atau biarkan (akan fallback ke localhost saja)
+print(f"INFO: Backend - CORS akan mengizinkan origins: {final_allowed_origins}")
+app.add_middleware(
+    CORSMiddleware,
+    allow_origins=final_allowed_origins if final_allowed_origins else ["http://localhost:3000"], # Fallback minimal jika daftar kosong
+    allow_credentials=True,
+    allow_methods=["GET", "POST", "OPTIONS"],
+    allow_headers=["*"], # Untuk kesederhanaan, izinkan semua header. Bisa diperketat.
+)
+# --- Akhir Konfigurasi CORS ---
+@app.on_event("startup")
+async def startup_event():
+    print("INFO: Backend - Aplikasi FastAPI memulai proses startup...")
+    if initialize_ai_model():
+        print("INFO: Backend - Model AI berhasil diinisialisasi atau sudah siap.")
+    else:
+        # Ini adalah log error penting untuk produksi
+        print("ERROR: Backend - Model AI GAGAL diinisialisasi saat startup! Endpoint AI tidak akan berfungsi.")
+@app.get("/", include_in_schema=False) # Sembunyikan dari docs API jika mau
+async def read_root():
+    # Log ini bisa berguna untuk health check sederhana
+    # print("INFO: Backend - Root endpoint '/' diakses.")
+    return {"message": "Selamat datang di SmartCV API! API aktif."}
+@app.post("/summarize", response_model=SummaryOutput)
+async def summarize_text_endpoint(input_data: TextInput):
+    # Log ini penting untuk melihat traffic
+    print(f"INFO: Backend - Menerima permintaan ke /summarize. Panjang input: {len(input_data.text)} char.")
+    if not input_data.text or not input_data.text.strip() or len(input_data.text) < 10 : # Tambahkan min_length di sini juga
+        print(f"WARN: Backend - Input teks tidak valid atau terlalu pendek. Input: '{input_data.text[:30]}...'")
+        raise HTTPException(status_code=400, detail="Input teks tidak boleh kosong dan minimal 10 karakter.")
+    try:
+        # print("DEBUG: Backend - Memanggil generate_cv_summary...") # Bisa dihapus
+        summary = generate_cv_summary(input_data.text)
+        # print(f"DEBUG: Backend - Hasil dari generate_cv_summary: '{summary[:50]}...'") # Bisa dihapus
+        if summary.startswith("Error:"): # Cek jika fungsi AI mengembalikan pesan error internal
+            print(f"ERROR: Backend - Error dari ai_processor: {summary}")
+            # Untuk error dari AI processor, mungkin 500 lebih cocok daripada 503 jika itu error pemrosesan
+            raise HTTPException(status_code=500, detail=summary)
+        # print("INFO: Backend - Ringkasan berhasil dibuat, mengirim respons.") # Bisa dihapus jika terlalu verbose
+        return SummaryOutput(summary=summary)
+    except HTTPException:
+        # Re-raise HTTPException agar FastAPI menanganinya dengan benar (misal, 400 atau 503 dari atas)
+        raise
+    except Exception as e:
+        # Ini menangkap error tak terduga lainnya dari dalam endpoint
+        print(f"CRITICAL: Backend - Error tidak terduga di endpoint /summarize: {str(e)}")
+        # Cetak traceback lengkap ke log server untuk debugging mendalam
+        traceback.print_exc()
+        raise HTTPException(status_code=500, detail=f"Terjadi kesalahan internal server saat memproses permintaan Anda.")

app/models.py ADDED Viewed

	@@ -0,0 +1,5 @@

+from pydantic import BaseModel, Field
+class TextInput(BaseModel):
+    text: str = Field(..., min_length=10, description="Teks input dari pengguna yang akan diringkas.")
+class SummaryOutput(BaseModel):
+    summary: str = Field(..., description="Hasil ringkasan teks yang dihasilkan oleh AI.")

requirements.txt ADDED Viewed

	@@ -0,0 +1,10 @@

+fastapi
+uvicorn[standard] #dukungan websockets dan lain-lain
+pydantic
+python-dotenv #.env lokal
+#depedensi AI
+transformers[torch]
+# torch
+sentencepiece
+accelerate