NoorNizar
/

Phi-4-mini-instruct-WINT4

Text Generation

text-generation-inference

8-bit precision

compressed-tensors

Model card Files Files and versions Community

Phi-4-mini-instruct-WINT4 / recipe.yaml

NoorNizar's picture

Upload 4-bit int quantized model via script

22ccf76 verified 21 days ago

history blame contribute delete

244 Bytes

	quant_stage:
	quant_modifiers:
	QuantizationModifier:
	ignore: [lm_head]
	config_groups:
	group_0:
	weights: {num_bits: 4, type: int, symmetric: true, strategy: channel, dynamic: false}
	targets: [Linear]