Upload folder using huggingface_hub

Browse files

Files changed (11) hide show

checkpoint-1170/trainer_state.json +22 -22
checkpoint-1170/training_args.bin +1 -1
checkpoint-1560/trainer_state.json +29 -29
checkpoint-1560/training_args.bin +1 -1
checkpoint-1950/trainer_state.json +36 -36
checkpoint-1950/training_args.bin +1 -1
checkpoint-390/trainer_state.json +8 -8
checkpoint-390/training_args.bin +1 -1
checkpoint-780/trainer_state.json +15 -15
checkpoint-780/training_args.bin +1 -1
training_args.bin +1 -1

checkpoint-1170/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.37302049291469286,
   "best_model_checkpoint": "./flan-t5-dialogsum/checkpoint-1170",
   "epoch": 3.0,
   "eval_steps": 500,
@@ -11,13 +11,13 @@
     {
       "epoch": 1.0,
       "eval_loss": 0.31267526745796204,
-      "eval_rouge1": 0.44390533529516707,
-      "eval_rouge2": 0.17816004659159018,
-      "eval_rougeL": 0.3549576722879668,
-      "eval_rougeLsum": 0.35441826265370524,
-      "eval_runtime": 80.6959,
-      "eval_samples_per_second": 6.196,
-      "eval_steps_per_second": 0.198,
       "step": 390
     },
     {
@@ -30,13 +30,13 @@
     {
       "epoch": 2.0,
       "eval_loss": 0.3003218472003937,
-      "eval_rouge1": 0.4482698780932518,
-      "eval_rouge2": 0.18739096580891712,
-      "eval_rougeL": 0.36483112986239974,
-      "eval_rougeLsum": 0.36534174634073446,
-      "eval_runtime": 71.8805,
-      "eval_samples_per_second": 6.956,
-      "eval_steps_per_second": 0.223,
       "step": 780
     },
     {
@@ -49,13 +49,13 @@
     {
       "epoch": 3.0,
       "eval_loss": 0.2967517375946045,
-      "eval_rouge1": 0.4552365012882353,
-      "eval_rouge2": 0.19360204012821247,
-      "eval_rougeL": 0.37302049291469286,
-      "eval_rougeLsum": 0.37299575058153295,
-      "eval_runtime": 73.9699,
-      "eval_samples_per_second": 6.76,
-      "eval_steps_per_second": 0.216,
       "step": 1170
     }
   ],

 {
+  "best_metric": 0.37278811615341145,
   "best_model_checkpoint": "./flan-t5-dialogsum/checkpoint-1170",
   "epoch": 3.0,
   "eval_steps": 500,
     {
       "epoch": 1.0,
       "eval_loss": 0.31267526745796204,
+      "eval_rouge1": 0.44388160380951946,
+      "eval_rouge2": 0.17811053634418733,
+      "eval_rougeL": 0.35470174491389483,
+      "eval_rougeLsum": 0.35400351619004,
+      "eval_runtime": 73.2026,
+      "eval_samples_per_second": 6.83,
+      "eval_steps_per_second": 0.219,
       "step": 390
     },
     {
     {
       "epoch": 2.0,
       "eval_loss": 0.3003218472003937,
+      "eval_rouge1": 0.4481724027358116,
+      "eval_rouge2": 0.18706683962522586,
+      "eval_rougeL": 0.36502676602307105,
+      "eval_rougeLsum": 0.3646421437489298,
+      "eval_runtime": 65.5308,
+      "eval_samples_per_second": 7.63,
+      "eval_steps_per_second": 0.244,
       "step": 780
     },
     {
     {
       "epoch": 3.0,
       "eval_loss": 0.2967517375946045,
+      "eval_rouge1": 0.45487076866137466,
+      "eval_rouge2": 0.19364689560301196,
+      "eval_rougeL": 0.37278811615341145,
+      "eval_rougeLsum": 0.3724689402967539,
+      "eval_runtime": 67.4046,
+      "eval_samples_per_second": 7.418,
+      "eval_steps_per_second": 0.237,
       "step": 1170
     }
   ],

checkpoint-1170/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d95d01320e9d3e2d7907a228c0efc910d6964b9c2efade9b7b4d1685ffc83243
 size 5496

 version https://git-lfs.github.com/spec/v1
+oid sha256:773f767b9a9562339691703bbfc85f7986c2526c05a733b43b1a20013d33ad8e
 size 5496

checkpoint-1560/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.37354020516399644,
   "best_model_checkpoint": "./flan-t5-dialogsum/checkpoint-1560",
   "epoch": 4.0,
   "eval_steps": 500,
@@ -11,13 +11,13 @@
     {
       "epoch": 1.0,
       "eval_loss": 0.31267526745796204,
-      "eval_rouge1": 0.44390533529516707,
-      "eval_rouge2": 0.17816004659159018,
-      "eval_rougeL": 0.3549576722879668,
-      "eval_rougeLsum": 0.35441826265370524,
-      "eval_runtime": 80.6959,
-      "eval_samples_per_second": 6.196,
-      "eval_steps_per_second": 0.198,
       "step": 390
     },
     {
@@ -30,13 +30,13 @@
     {
       "epoch": 2.0,
       "eval_loss": 0.3003218472003937,
-      "eval_rouge1": 0.4482698780932518,
-      "eval_rouge2": 0.18739096580891712,
-      "eval_rougeL": 0.36483112986239974,
-      "eval_rougeLsum": 0.36534174634073446,
-      "eval_runtime": 71.8805,
-      "eval_samples_per_second": 6.956,
-      "eval_steps_per_second": 0.223,
       "step": 780
     },
     {
@@ -49,13 +49,13 @@
     {
       "epoch": 3.0,
       "eval_loss": 0.2967517375946045,
-      "eval_rouge1": 0.4552365012882353,
-      "eval_rouge2": 0.19360204012821247,
-      "eval_rougeL": 0.37302049291469286,
-      "eval_rougeLsum": 0.37299575058153295,
-      "eval_runtime": 73.9699,
-      "eval_samples_per_second": 6.76,
-      "eval_steps_per_second": 0.216,
       "step": 1170
     },
     {
@@ -68,13 +68,13 @@
     {
       "epoch": 4.0,
       "eval_loss": 0.29470932483673096,
-      "eval_rouge1": 0.45601516547866866,
-      "eval_rouge2": 0.19372580419992047,
-      "eval_rougeL": 0.37354020516399644,
-      "eval_rougeLsum": 0.3735440879776317,
-      "eval_runtime": 70.929,
-      "eval_samples_per_second": 7.049,
-      "eval_steps_per_second": 0.226,
       "step": 1560
     }
   ],

 {
+  "best_metric": 0.3732990631191409,
   "best_model_checkpoint": "./flan-t5-dialogsum/checkpoint-1560",
   "epoch": 4.0,
   "eval_steps": 500,
     {
       "epoch": 1.0,
       "eval_loss": 0.31267526745796204,
+      "eval_rouge1": 0.44388160380951946,
+      "eval_rouge2": 0.17811053634418733,
+      "eval_rougeL": 0.35470174491389483,
+      "eval_rougeLsum": 0.35400351619004,
+      "eval_runtime": 73.2026,
+      "eval_samples_per_second": 6.83,
+      "eval_steps_per_second": 0.219,
       "step": 390
     },
     {
     {
       "epoch": 2.0,
       "eval_loss": 0.3003218472003937,
+      "eval_rouge1": 0.4481724027358116,
+      "eval_rouge2": 0.18706683962522586,
+      "eval_rougeL": 0.36502676602307105,
+      "eval_rougeLsum": 0.3646421437489298,
+      "eval_runtime": 65.5308,
+      "eval_samples_per_second": 7.63,
+      "eval_steps_per_second": 0.244,
       "step": 780
     },
     {
     {
       "epoch": 3.0,
       "eval_loss": 0.2967517375946045,
+      "eval_rouge1": 0.45487076866137466,
+      "eval_rouge2": 0.19364689560301196,
+      "eval_rougeL": 0.37278811615341145,
+      "eval_rougeLsum": 0.3724689402967539,
+      "eval_runtime": 67.4046,
+      "eval_samples_per_second": 7.418,
+      "eval_steps_per_second": 0.237,
       "step": 1170
     },
     {
     {
       "epoch": 4.0,
       "eval_loss": 0.29470932483673096,
+      "eval_rouge1": 0.45634329846140587,
+      "eval_rouge2": 0.1935668856761302,
+      "eval_rougeL": 0.3732990631191409,
+      "eval_rougeLsum": 0.3728926972461234,
+      "eval_runtime": 64.629,
+      "eval_samples_per_second": 7.736,
+      "eval_steps_per_second": 0.248,
       "step": 1560
     }
   ],

checkpoint-1560/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d95d01320e9d3e2d7907a228c0efc910d6964b9c2efade9b7b4d1685ffc83243
 size 5496

 version https://git-lfs.github.com/spec/v1
+oid sha256:773f767b9a9562339691703bbfc85f7986c2526c05a733b43b1a20013d33ad8e
 size 5496

checkpoint-1950/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.37354020516399644,
   "best_model_checkpoint": "./flan-t5-dialogsum/checkpoint-1560",
   "epoch": 5.0,
   "eval_steps": 500,
@@ -11,13 +11,13 @@
     {
       "epoch": 1.0,
       "eval_loss": 0.31267526745796204,
-      "eval_rouge1": 0.44390533529516707,
-      "eval_rouge2": 0.17816004659159018,
-      "eval_rougeL": 0.3549576722879668,
-      "eval_rougeLsum": 0.35441826265370524,
-      "eval_runtime": 80.6959,
-      "eval_samples_per_second": 6.196,
-      "eval_steps_per_second": 0.198,
       "step": 390
     },
     {
@@ -30,13 +30,13 @@
     {
       "epoch": 2.0,
       "eval_loss": 0.3003218472003937,
-      "eval_rouge1": 0.4482698780932518,
-      "eval_rouge2": 0.18739096580891712,
-      "eval_rougeL": 0.36483112986239974,
-      "eval_rougeLsum": 0.36534174634073446,
-      "eval_runtime": 71.8805,
-      "eval_samples_per_second": 6.956,
-      "eval_steps_per_second": 0.223,
       "step": 780
     },
     {
@@ -49,13 +49,13 @@
     {
       "epoch": 3.0,
       "eval_loss": 0.2967517375946045,
-      "eval_rouge1": 0.4552365012882353,
-      "eval_rouge2": 0.19360204012821247,
-      "eval_rougeL": 0.37302049291469286,
-      "eval_rougeLsum": 0.37299575058153295,
-      "eval_runtime": 73.9699,
-      "eval_samples_per_second": 6.76,
-      "eval_steps_per_second": 0.216,
       "step": 1170
     },
     {
@@ -68,25 +68,25 @@
     {
       "epoch": 4.0,
       "eval_loss": 0.29470932483673096,
-      "eval_rouge1": 0.45601516547866866,
-      "eval_rouge2": 0.19372580419992047,
-      "eval_rougeL": 0.37354020516399644,
-      "eval_rougeLsum": 0.3735440879776317,
-      "eval_runtime": 70.929,
-      "eval_samples_per_second": 7.049,
-      "eval_steps_per_second": 0.226,
       "step": 1560
     },
     {
       "epoch": 5.0,
       "eval_loss": 0.29482799768447876,
-      "eval_rouge1": 0.4548074338758987,
-      "eval_rouge2": 0.1892886198010884,
-      "eval_rougeL": 0.3673308042257807,
-      "eval_rougeLsum": 0.367167688006684,
-      "eval_runtime": 71.2424,
-      "eval_samples_per_second": 7.018,
-      "eval_steps_per_second": 0.225,
       "step": 1950
     }
   ],

 {
+  "best_metric": 0.3732990631191409,
   "best_model_checkpoint": "./flan-t5-dialogsum/checkpoint-1560",
   "epoch": 5.0,
   "eval_steps": 500,
     {
       "epoch": 1.0,
       "eval_loss": 0.31267526745796204,
+      "eval_rouge1": 0.44388160380951946,
+      "eval_rouge2": 0.17811053634418733,
+      "eval_rougeL": 0.35470174491389483,
+      "eval_rougeLsum": 0.35400351619004,
+      "eval_runtime": 73.2026,
+      "eval_samples_per_second": 6.83,
+      "eval_steps_per_second": 0.219,
       "step": 390
     },
     {
     {
       "epoch": 2.0,
       "eval_loss": 0.3003218472003937,
+      "eval_rouge1": 0.4481724027358116,
+      "eval_rouge2": 0.18706683962522586,
+      "eval_rougeL": 0.36502676602307105,
+      "eval_rougeLsum": 0.3646421437489298,
+      "eval_runtime": 65.5308,
+      "eval_samples_per_second": 7.63,
+      "eval_steps_per_second": 0.244,
       "step": 780
     },
     {
     {
       "epoch": 3.0,
       "eval_loss": 0.2967517375946045,
+      "eval_rouge1": 0.45487076866137466,
+      "eval_rouge2": 0.19364689560301196,
+      "eval_rougeL": 0.37278811615341145,
+      "eval_rougeLsum": 0.3724689402967539,
+      "eval_runtime": 67.4046,
+      "eval_samples_per_second": 7.418,
+      "eval_steps_per_second": 0.237,
       "step": 1170
     },
     {
     {
       "epoch": 4.0,
       "eval_loss": 0.29470932483673096,
+      "eval_rouge1": 0.45634329846140587,
+      "eval_rouge2": 0.1935668856761302,
+      "eval_rougeL": 0.3732990631191409,
+      "eval_rougeLsum": 0.3728926972461234,
+      "eval_runtime": 64.629,
+      "eval_samples_per_second": 7.736,
+      "eval_steps_per_second": 0.248,
       "step": 1560
     },
     {
       "epoch": 5.0,
       "eval_loss": 0.29482799768447876,
+      "eval_rouge1": 0.4547042383346209,
+      "eval_rouge2": 0.18917345073480046,
+      "eval_rougeL": 0.3670910829591487,
+      "eval_rougeLsum": 0.3666732624155983,
+      "eval_runtime": 65.3537,
+      "eval_samples_per_second": 7.651,
+      "eval_steps_per_second": 0.245,
       "step": 1950
     }
   ],

checkpoint-1950/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d95d01320e9d3e2d7907a228c0efc910d6964b9c2efade9b7b4d1685ffc83243
 size 5496

 version https://git-lfs.github.com/spec/v1
+oid sha256:773f767b9a9562339691703bbfc85f7986c2526c05a733b43b1a20013d33ad8e
 size 5496

checkpoint-390/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.3549576722879668,
   "best_model_checkpoint": "./flan-t5-dialogsum/checkpoint-390",
   "epoch": 1.0,
   "eval_steps": 500,
@@ -11,13 +11,13 @@
     {
       "epoch": 1.0,
       "eval_loss": 0.31267526745796204,
-      "eval_rouge1": 0.44390533529516707,
-      "eval_rouge2": 0.17816004659159018,
-      "eval_rougeL": 0.3549576722879668,
-      "eval_rougeLsum": 0.35441826265370524,
-      "eval_runtime": 80.6959,
-      "eval_samples_per_second": 6.196,
-      "eval_steps_per_second": 0.198,
       "step": 390
     }
   ],

 {
+  "best_metric": 0.35470174491389483,
   "best_model_checkpoint": "./flan-t5-dialogsum/checkpoint-390",
   "epoch": 1.0,
   "eval_steps": 500,
     {
       "epoch": 1.0,
       "eval_loss": 0.31267526745796204,
+      "eval_rouge1": 0.44388160380951946,
+      "eval_rouge2": 0.17811053634418733,
+      "eval_rougeL": 0.35470174491389483,
+      "eval_rougeLsum": 0.35400351619004,
+      "eval_runtime": 73.2026,
+      "eval_samples_per_second": 6.83,
+      "eval_steps_per_second": 0.219,
       "step": 390
     }
   ],

checkpoint-390/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d95d01320e9d3e2d7907a228c0efc910d6964b9c2efade9b7b4d1685ffc83243
 size 5496

 version https://git-lfs.github.com/spec/v1
+oid sha256:773f767b9a9562339691703bbfc85f7986c2526c05a733b43b1a20013d33ad8e
 size 5496

checkpoint-780/trainer_state.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "best_metric": 0.36483112986239974,
   "best_model_checkpoint": "./flan-t5-dialogsum/checkpoint-780",
   "epoch": 2.0,
   "eval_steps": 500,
@@ -11,13 +11,13 @@
     {
       "epoch": 1.0,
       "eval_loss": 0.31267526745796204,
-      "eval_rouge1": 0.44390533529516707,
-      "eval_rouge2": 0.17816004659159018,
-      "eval_rougeL": 0.3549576722879668,
-      "eval_rougeLsum": 0.35441826265370524,
-      "eval_runtime": 80.6959,
-      "eval_samples_per_second": 6.196,
-      "eval_steps_per_second": 0.198,
       "step": 390
     },
     {
@@ -30,13 +30,13 @@
     {
       "epoch": 2.0,
       "eval_loss": 0.3003218472003937,
-      "eval_rouge1": 0.4482698780932518,
-      "eval_rouge2": 0.18739096580891712,
-      "eval_rougeL": 0.36483112986239974,
-      "eval_rougeLsum": 0.36534174634073446,
-      "eval_runtime": 71.8805,
-      "eval_samples_per_second": 6.956,
-      "eval_steps_per_second": 0.223,
       "step": 780
     }
   ],

 {
+  "best_metric": 0.36502676602307105,
   "best_model_checkpoint": "./flan-t5-dialogsum/checkpoint-780",
   "epoch": 2.0,
   "eval_steps": 500,
     {
       "epoch": 1.0,
       "eval_loss": 0.31267526745796204,
+      "eval_rouge1": 0.44388160380951946,
+      "eval_rouge2": 0.17811053634418733,
+      "eval_rougeL": 0.35470174491389483,
+      "eval_rougeLsum": 0.35400351619004,
+      "eval_runtime": 73.2026,
+      "eval_samples_per_second": 6.83,
+      "eval_steps_per_second": 0.219,
       "step": 390
     },
     {
     {
       "epoch": 2.0,
       "eval_loss": 0.3003218472003937,
+      "eval_rouge1": 0.4481724027358116,
+      "eval_rouge2": 0.18706683962522586,
+      "eval_rougeL": 0.36502676602307105,
+      "eval_rougeLsum": 0.3646421437489298,
+      "eval_runtime": 65.5308,
+      "eval_samples_per_second": 7.63,
+      "eval_steps_per_second": 0.244,
       "step": 780
     }
   ],

checkpoint-780/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d95d01320e9d3e2d7907a228c0efc910d6964b9c2efade9b7b4d1685ffc83243
 size 5496

 version https://git-lfs.github.com/spec/v1
+oid sha256:773f767b9a9562339691703bbfc85f7986c2526c05a733b43b1a20013d33ad8e
 size 5496

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d95d01320e9d3e2d7907a228c0efc910d6964b9c2efade9b7b4d1685ffc83243
 size 5496

 version https://git-lfs.github.com/spec/v1
+oid sha256:773f767b9a9562339691703bbfc85f7986c2526c05a733b43b1a20013d33ad8e
 size 5496