bart-base-finetuned-steel-news-general

This model is a fine-tuned version of facebook/bart-base on an unknown dataset. It achieves the following results on the evaluation set:

Model description

More information needed

More information needed

More information needed

The following hyperparameters were used during training:

learning_rate: 3e-05
train_batch_size: 2
eval_batch_size: 2
seed: 42
gradient_accumulation_steps: 8
total_train_batch_size: 16
optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
lr_scheduler_type: linear
lr_scheduler_warmup_steps: 500
num_epochs: 5
mixed_precision_training: Native AMP

Training Loss	Epoch	Step	Validation Loss	Rouge1	Rouge2	Rougel	Rougelsum
2.7516	0.9956	168	1.5173	46.2162	27.6554	43.4029	43.4370
1.63	1.9956	336	1.3968	47.1703	28.1491	44.5244	44.5442
1.4297	2.9956	504	1.3366	49.3461	31.7697	47.2344	47.2144
1.2575	3.9956	672	1.2632	50.3310	32.2038	47.7099	47.8190
1.0901	4.9956	840	1.2518	50.6934	32.5824	48.2610	48.3281