😎 Thai Scam Detector v1
โมเดลนี้ถูกฝึกเพื่อจำแนกข้อความภาษาไทยว่าเป็น หลอกลวง (scam) หรือ ไม่หลอกลวง (not scam) โดยใช้ฐานข้อมูลที่สร้างขึ้นเองซึ่งประกอบด้วยข้อความที่เกี่ยวข้องกับ OTP, การโอนเงิน, ของรางวัล, และข้อความทั่วไปที่ไม่เป็นอันตราย
☠️ โมเดลที่ใช้
airesearch/wangchanberta-base-att-spm-uncased
: BERT ภาษาไทยจาก AIResearch- Fine-tuned สำหรับ binary classification:
scam
(1) และnot scam
(0)
🤫 Performance
ประเมินบนชุดข้อมูลทดสอบ 500 ตัวอย่าง (scam 50%, not scam 50%):
Metric | Score |
---|---|
Accuracy | 86% |
Precision | 91% (not scam), 82% (scam) |
Recall | 80% (not scam), 92% (scam) |
F1-score | 85% (not scam), 87% (scam) |
😭 การใช้งานเบื้องต้น
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
model = AutoModelForSequenceClassification.from_pretrained("your_username/thai-scam-detector-v1")
tokenizer = AutoTokenizer.from_pretrained("your_username/thai-scam-detector-v1")
text = "คุณได้รับรางวัลมูลค่า 1 ล้านบาท กรุณาโอนค่าธรรมเนียมเพื่อยืนยันรับรางวัล"
inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True)
with torch.no_grad():
logits = model(**inputs).logits
prediction = torch.argmax(logits, dim=1).item()
print("Scam" if prediction == 1 else "Not Scam")
- Downloads last month
- 51
Inference Providers
NEW
This model isn't deployed by any Inference Provider.
🙋
Ask for provider support