llmat
/

Apertus-8B-Instruct-2509-NVFP4

Text Generation

8-bit precision

compressed-tensors

Model card Files Files and versions

Apertus-8B-Instruct-2509-NVFP4

NVFP4-quantized version of swiss-ai/Apertus-8B-Instruct-2509 produced with llmcompressor.

Notes

Quantization scheme: NVFP4 (linear layers, lm_head excluded)
Calibration samples: 512
Max sequence length during calibration: 2048

Downloads last month: 186

Safetensors

Model size

5B params

Tensor type

BF16

·

F8_E4M3

·

F32

·

U8

·

Model tree for llmat/Apertus-8B-Instruct-2509-NVFP4

Base model

swiss-ai/Apertus-8B-2509

Finetuned

swiss-ai/Apertus-8B-Instruct-2509

Quantized

(14)

this model