Add evaluation results on the default config and test split of billsum

Beep boop, I am a bot from Hugging Face's automatic model evaluator 👋!\
Your model has been evaluated on the default config and test split of the [billsum](https://huggingface.co/datasets/billsum) dataset by

@pszemraj

, using the predictions stored [here](https://huggingface.co/datasets/autoevaluate/autoeval-staging-eval-billsum-default-6d3727-15406134).\
Accept this pull request to see the results displayed on the [Hub leaderboard](https://huggingface.co/spaces/autoevaluate/leaderboards?dataset=billsum).\
Evaluate your model on more datasets [here](https://huggingface.co/spaces/autoevaluate/model-evaluator?dataset=billsum).

Files changed (1) hide show

README.md +33 -0

README.md CHANGED Viewed

@@ -243,6 +243,39 @@ model-index:
       type: gen_len
       value: 65.4005
       verified: true
 ---
 # Longformer Encoder-Decoder (LED) fine-tuned on Booksum

       type: gen_len
       value: 65.4005
       verified: true
+  - task:
+      type: summarization
+      name: Summarization
+    dataset:
+      name: billsum
+      type: billsum
+      config: default
+      split: test
+    metrics:
+    - name: ROUGE-1
+      type: rouge
+      value: 40.5843
+      verified: true
+    - name: ROUGE-2
+      type: rouge
+      value: 17.3401
+      verified: true
+    - name: ROUGE-L
+      type: rouge
+      value: 25.1256
+      verified: true
+    - name: ROUGE-LSUM
+      type: rouge
+      value: 34.6619
+      verified: true
+    - name: loss
+      type: loss
+      value: 4.792657375335693
+      verified: true
+    - name: gen_len
+      type: gen_len
+      value: 163.9394
+      verified: true
 ---
 # Longformer Encoder-Decoder (LED) fine-tuned on Booksum