--- license: apache-2.0 language: - ko - en base_model: - lcw99/t5-base-korean-text-summary pipeline_tag: summarization --- # Model Description lcw99님이 만드신 lcw99/t5-base-korean-text-summary을 기반으로 Finetuning하여 만든 '뉴스 기사 요약 모델'입니다. 학습 데이터는 AIHub에서 제공하는 '문서요약 텍스트 (https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&aihubDataSe=realm&dataSetSn=97)'의 신문기사들을 사용하였습니다. 지속적으로 더 성능을 개선하여 좋은 모델로 고도화 하도록 하겠습니다. # Training Arguments ```python training_args = Seq2SeqTrainingArguments( evaluation_strategy="epoch", save_strategy="epoch", save_total_limit=2, warmup_steps=1000, learning_rate=5e-5, per_device_train_batch_size=16, per_device_eval_batch_size=16, num_train_epochs=3, weight_decay=0.01, predict_with_generate=True, fp16=True ) ``` # Training Progress | Epoch | Training Loss | Validation Loss | |:-----:|:-------------:|:---------------:| | 1 | 0.604000 | 0.566043 | | 2 | 0.577400 | 0.559071 | | 3 | 0.553500 | 0.555571 | # 실행환경 Window 10 NVIDIA GeForce RTX 3070, 8192 MiB # Framework Versions Python: 3.10.14 PyTorch: 1.12.1 Transformers: 4.46.2 Datasets: 3.2.0 Tokenizers: 0.20.3