llama-duo
/

llama3-1b-summarize-gpt4o-128k

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

llama3-1b-summarize-gpt4o-128k / all_results.json

chansung's picture

End of training

1305251 verified 4 months ago

history blame contribute delete

414 Bytes

	{
	"epoch": 9.654545454545454,
	"eval_loss": 2.725593328475952,
	"eval_runtime": 0.814,
	"eval_samples": 25,
	"eval_samples_per_second": 12.285,
	"eval_steps_per_second": 1.228,
	"total_flos": 8.156088875152835e+17,
	"train_loss": 1.7710220513520418,
	"train_runtime": 1245.0854,
	"train_samples": 129221,
	"train_samples_per_second": 112.233,
	"train_steps_per_second": 0.217
	}