Spaces:

MCG-NJU
/

DDT

Running on Zero

DDT / src /diffusion /flow_matching /training_cos.py

wangshuai6

init space

9e426da 7 months ago

1.84 kB

	import torch
	from typing import Callable
	from src.diffusion.base.training import *
	from src.diffusion.base.scheduling import BaseScheduler

	def inverse_sigma(alpha, sigma):
	return 1/sigma**2
	def snr(alpha, sigma):
	return alpha/sigma
	def minsnr(alpha, sigma, threshold=5):
	return torch.clip(alpha/sigma, min=threshold)
	def maxsnr(alpha, sigma, threshold=5):
	return torch.clip(alpha/sigma, max=threshold)
	def constant(alpha, sigma):
	return 1

	class COSTrainer(BaseTrainer):
	def __init__(
	self,
	scheduler: BaseScheduler,
	loss_weight_fn:Callable=constant,
	lognorm_t=False,
	*args,
	**kwargs
	):
	super().__init__(args, *kwargs)
	self.lognorm_t = lognorm_t
	self.scheduler = scheduler
	self.loss_weight_fn = loss_weight_fn

	def _impl_trainstep(self, net, ema_net, raw_images, x, y):
	batch_size = x.shape[0]
	if self.lognorm_t:
	t = torch.randn(batch_size).to(x.device, x.dtype).sigmoid()
	else:
	t = torch.rand(batch_size).to(x.device, x.dtype)
	noise = torch.randn_like(x)
	alpha = self.scheduler.alpha(t)
	dalpha = self.scheduler.dalpha(t)
	sigma = self.scheduler.sigma(t)
	dsigma = self.scheduler.dsigma(t)
	w = self.scheduler.w(t)

	x_t = alpha * x + noise * sigma
	v_t = dalpha * x + dsigma * noise
	out = net(x_t, t, y)

	weight = self.loss_weight_fn(alpha, sigma)

	fm_loss = weight(out - v_t)*2
	cos_sim = torch.nn.functional.cosine_similarity(out, v_t, dim=1)
	cos_loss = 1 - cos_sim

	out = dict(
	fm_loss=fm_loss.mean(),
	cos_loss=cos_loss.mean(),
	loss=fm_loss.mean() + cos_loss.mean(),
	)
	return out