metadata

license: apache-2.0
language:
  - ko
  - en
base_model:
  - lcw99/t5-base-korean-text-summary
pipeline_tag: summarization

Model Description

lcw99님이 만드신 lcw99/t5-base-korean-text-summary을 기반으로 Finetuning하여 만든 '뉴스 기사 요약 모델'입니다.

학습 데이터는 AIHub에서 제공하는 '문서요약 텍스트 (https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=97)'의 신문기사들을 사용하였습니다.

지속적으로 더 성능을 개선하여 좋은 모델로 고도화 하도록 하겠습니다.

Training Arguments

training_args = Seq2SeqTrainingArguments(
    evaluation_strategy="epoch",                    
    save_strategy="epoch",                          
    save_total_limit=2,                             
    warmup_steps=1000,                             
    learning_rate=5e-5,                             
    per_device_train_batch_size=16,                
    per_device_eval_batch_size=16,               
    num_train_epochs=3,                           
    weight_decay=0.01,                             
    predict_with_generate=True,                    
    fp16=True                               
)

Training Progress

Epoch	Training Loss	Validation Loss
1	0.604000	0.566043
2	0.577400	0.559071
3	0.553500	0.555571

실행환경

Window 10

NVIDIA GeForce RTX 3070, 8192 MiB

Framework Versions

Python: 3.10.14

PyTorch: 1.12.1

Transformers: 4.46.2

Datasets: 3.2.0

Tokenizers: 0.20.3