llama-duo
/

llama3-3b-summarize-gpt4o-128k

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

llama3-3b-summarize-gpt4o-128k / all_results.json

chansung's picture

End of training

b25af9f verified 4 months ago

history blame contribute delete

415 Bytes

	{
	"epoch": 9.956521739130435,
	"eval_loss": 2.5189335346221924,
	"eval_runtime": 0.1768,
	"eval_samples": 25,
	"eval_samples_per_second": 56.575,
	"eval_steps_per_second": 5.658,
	"total_flos": 2.4191218891641324e+18,
	"train_loss": 1.418152675716155,
	"train_runtime": 3547.1741,
	"train_samples": 129221,
	"train_samples_per_second": 39.395,
	"train_steps_per_second": 0.615
	}