warshanks
/

Josiefied-Qwen3-4B-Instruct-2507-gabliterated-v2-AWQ

Text Generation

compressed-tensors

Model card Files Files and versions

Josiefied-Qwen3-4B-Instruct-2507-gabliterated-v2-AWQ / recipe.yaml

warshanks's picture

Upload recipe.yaml with huggingface_hub

67a5415 verified 29 days ago

history blame contribute delete

616 Bytes

	default_stage:
	default_modifiers:
	AWQModifier:
	targets: [Linear]
	ignore: [lm_head, 're:.mlp.gate$', 're:.mlp.shared_expert_gate$', 'whisper']
	scheme: W4A16_ASYM
	mappings:
	- smooth_layer: re:.*input_layernorm$
	balance_layers: ['re:.q_proj$', 're:.k_proj$', 're:.*v_proj$']
	- smooth_layer: re:.*v_proj$
	balance_layers: ['re:.*o_proj$']
	- smooth_layer: re:.*post_attention_layernorm$
	balance_layers: ['re:.gate_proj$', 're:.up_proj$']
	- smooth_layer: re:.*up_proj$
	balance_layers: ['re:.*down_proj$']
	duo_scaling: true