Spaces:

AvocadoMuffin
/

eval_model

Running

AvocadoMuffin commited on 4 days ago

Commit

8663fbd

verified ·

1 Parent(s): 02af374

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -168,7 +168,7 @@ def run_evaluation(num_samples, progress=gr.Progress()):
 # 📊 CUAD Model Evaluation Results
 ## 🎯 Overall Performance
-- **Model**: AvocadoMuffin/roberta-cuad-qa-v2
 - **Dataset**: CUAD (Contract Understanding Atticus Dataset)
 - **Samples Evaluated**: {len(exact_matches)}
 - **Evaluation Date**: {datetime.now().strftime("%Y-%m-%d %H:%M:%S")}
@@ -191,7 +191,7 @@ def run_evaluation(num_samples, progress=gr.Progress()):
     results_file = f"cuad_evaluation_results_{timestamp}.json"
     detailed_results = {
-        "model_name": "AvocadoMuffin/roberta-cuad-qa-v2",
         "dataset": "cuad",
         "num_samples": len(exact_matches),
         "exact_match_score": avg_exact_match,

 # 📊 CUAD Model Evaluation Results
 ## 🎯 Overall Performance
+- **Model**: AvocadoMuffin/roberta-cuad-qa-v3
 - **Dataset**: CUAD (Contract Understanding Atticus Dataset)
 - **Samples Evaluated**: {len(exact_matches)}
 - **Evaluation Date**: {datetime.now().strftime("%Y-%m-%d %H:%M:%S")}
     results_file = f"cuad_evaluation_results_{timestamp}.json"
     detailed_results = {
+        "model_name": "AvocadoMuffin/roberta-cuad-qa-v3",
         "dataset": "cuad",
         "num_samples": len(exact_matches),
         "exact_match_score": avg_exact_match,