Spaces:

maysonma
/

lingo_judge_metric

Runtime error

maysonma commited on May 6, 2024

Commit

3df3994

1 Parent(s): 6f69903

fix module type = 'metric'

Files changed (1) hide show

lingo_judge_metric.py CHANGED Viewed

@@ -39,9 +39,12 @@ Returns:
 class LingoJudgeMetric(evaluate.Metric):
     def _info(self):
         return evaluate.MetricInfo(
             description=_DESCRIPTION,
             citation=_CITATION,
             inputs_description=_KWARGS_DESCRIPTION,
             features=datasets.Features(
                 {
                     "questions": datasets.Value("string"),
@@ -49,6 +52,7 @@ class LingoJudgeMetric(evaluate.Metric):
                     "references": datasets.Sequence(datasets.Value("string")),
                 }
             ),
         )
     def _download_and_prepare(self, dl_manager):
@@ -56,4 +60,5 @@ class LingoJudgeMetric(evaluate.Metric):
         self.scorer = LingoJudge().eval().to(self.device)
     def _compute(self, questions, predictions, references):
         return self.scorer.compute(questions, references, predictions)

 class LingoJudgeMetric(evaluate.Metric):
     def _info(self):
         return evaluate.MetricInfo(
+            # This is the description that will appear on the modules page.
+            module_type="metric",
             description=_DESCRIPTION,
             citation=_CITATION,
             inputs_description=_KWARGS_DESCRIPTION,
+            # This defines the format of each question, prediction, and reference.
             features=datasets.Features(
                 {
                     "questions": datasets.Value("string"),
                     "references": datasets.Sequence(datasets.Value("string")),
                 }
             ),
+            reference_urls=["https://github.com/wayveai/LingoQA"],
         )
     def _download_and_prepare(self, dl_manager):
         self.scorer = LingoJudge().eval().to(self.device)
     def _compute(self, questions, predictions, references):
+        """Returns the scores"""
         return self.scorer.compute(questions, references, predictions)