Add README for FinCreditLlama-3.2-3B

fe7adc5 verified 1 day ago

3.95 kB

	---
	language: ko
	license: apache-2.0
	base_model: unsloth/Llama-3.2-3B-Instruct
	tags:
	- financial
	- credit-rating
	- korean
	- llama
	- unsloth
	- fine-tuned
	model_name: FinCreditLlama-3.2-3B
	pipeline_tag: text-generation
	---

	# FinCreditLlama-3.2-3B

	## 모델 개요
	FinCreditLlama-3.2-3B는 금융 신용 평가를 위해 특별히 설계된 한국어 언어 모델입니다.

	베이스 모델: unsloth/Llama-3.2-3B-Instruct
	데이터셋: himedia/financial_dummy_data_v4
	학습 방법: LoRA (Low-Rank Adaptation) - 병합된 전체 모델
	학습 일시: 20250702_181705

	## 📊 학습 결과
	- Final Training Loss: 0.8515
	- Final Validation Loss: 0.7593
	- Best Validation Loss: 0.7593 (step 10)
	- Overall Improvement: 62.7%
	- Training Time: 0.64 minutes

	## 하이퍼파라미터
	- Learning Rate: 0.0002
	- Max Steps: 10
	- Batch Size: 2
	- Gradient Accumulation: 8
	- LoRA r: 64
	- LoRA alpha: 64
	- Max Sequence Length: 2048
	- Warmup Steps: 5

	## 🔧 메모리 사용량
	- GPU: NVIDIA A100-SXM4-40GB
	- Peak Memory: 6.674 GB
	- Memory Usage: 16.9%

	## 사용 방법

	### 일반적인 사용 (Transformers)
	```python
	from transformers import AutoTokenizer, AutoModelForCausalLM

	# 모델과 토크나이저 로드
	tokenizer = AutoTokenizer.from_pretrained("himedia/fincredit-lamma-3.2-3b-lr2e04-bs16-r64-steps10-20250702_181705")
	model = AutoModelForCausalLM.from_pretrained("himedia/fincredit-lamma-3.2-3b-lr2e04-bs16-r64-steps10-20250702_181705")

	# 간단한 추론 예제
	prompt = "고객의 신용등급을 평가해주세요:"
	inputs = tokenizer(prompt, return_tensors="pt")
	outputs = model.generate(**inputs, max_length=200)
	result = tokenizer.decode(outputs[0], skip_special_tokens=True)
	print(result)
	```

	### vLLM 사용 (고성능 추론)
	```python
	from vllm import LLM, SamplingParams

	# vLLM 로드 (병합된 모델이므로 바로 사용 가능)
	llm = LLM(
	model="himedia/fincredit-lamma-3.2-3b-lr2e04-bs16-r64-steps10-20250702_181705",
	max_model_len=2048,
	gpu_memory_utilization=0.85
	)

	# 샘플링 파라미터 설정
	sampling_params = SamplingParams(
	temperature=0.7,
	top_p=0.9,
	max_tokens=200
	)

	# 추론
	prompts = ["고객의 신용등급을 평가해주세요:"]
	outputs = llm.generate(prompts, sampling_params)

	for output in outputs:
	prompt = output.prompt
	generated_text = output.outputs[0].text
	print(f"Prompt: {prompt!r}")
	print(f"Generated text: {generated_text!r}")
	```

	### Unsloth 테스트 환경에서 사용
	```python
	from unsloth import FastLanguageModel

	# 원본 LoRA 어댑터로 테스트
	model, tokenizer = FastLanguageModel.from_pretrained(
	model_name = "himedia/fincredit-Llama-3.2-3B-lr2e04-bs16-r64-steps1000-20250623_060351", # LoRA 어댑터
	max_seq_length = 2048,
	dtype = None,
	load_in_4bit = True,
	)
	```

	## 📊 학습 데이터 파일
	이 레포지토리에는 다음 학습 관련 파일들이 포함되어 있습니다:
	- `training_log.json`: 전체 학습 로그 (JSON 형식)
	- `FinCreditLlama-3.2-3B_20250702_181705_training_curves.png`: 학습 곡선 시각화 이미지

	## 레포지토리명 구성
	```
	fincredit-lamma-3.2-3b-lr2e04-bs16-r64-steps10-20250702_181705 = fincredit-lamma3-4b-lr2e04-bs2-r64-steps10-20250702_181705
	```
	- `fincredit-lamma3-4b`: 모델 기본명
	- `lr2e04`: Learning Rate
	- `bs2`: Batch Size
	- `r64`: LoRA rank
	- `steps10`: 학습 스텝
	- `20250702_181705`: 학습 시각

	## 배포 정보
	- 모델 타입: 병합된 전체 모델 (LoRA 어댑터가 베이스 모델에 병합됨)
	- vLLM 호환: ✅ 완전 호환
	- RunPod 배포: ✅ 지원
	- 원본 LoRA 어댑터: `himedia/fincredit-Llama-3.2-3B-lr2e04-bs16-r64-steps1000-20250623_060351`

	## 성능
	이 모델은 한국어 금융 텍스트에 대해 파인튜닝되어 신용 평가 관련 질의응답에 특화되어 있습니다.

	## 라이선스
	Apache 2.0