README.md · inferencerlabs/openai-gpt-oss-120b-MLX-6.5bit at 3f5234a7c26d2ad244149da8a2bc439ae67d415e

metadata

license: apache-2.0
pipeline_tag: text-generation
library_name: mlx
tags:
  - vllm
  - mlx
base_model: openai/gpt-oss-120b

See gpt-oss-120b 6.5bit MLX in action - demonstration video

q6.5bit quant typically achieves 1.128 perplexity in our testing which is equivalent to q8 perplexity (1.128).

Usage Notes