clowman
/

QwQ-32B-GPTQ-Int4

Text Generation

text-generation-inference

4-bit precision

Model card Files Files and versions

clowman commited on Apr 2

Commit

a23e770

·

verified ·

1 Parent(s): 9951afc

Update README.md

Files changed (1) hide show

README.md +15 -11

README.md CHANGED Viewed

@@ -1,3 +1,14 @@
 # Quantization
 Created with [lambda-quant](https://github.com/LambdaLabsML/lambda-quant/tree/f97108fe4a9ee061a7b969b23a9605a6d561863d) on `Python 3.10.12 (main, Nov  6 2024, 20:22:13) [GCC 11.4.0]`
@@ -9,22 +20,15 @@ Steps to create:
 1. `git clone https://github.com/LambdaLabsML/lambda-quant`
 2. `git checkout f97108fe4a9ee061a7b969b23a9605a6d561863d`
 3. `python quantize.py -m Qwen/QwQ-32B -q GPTQ-Int4`
 ## Evaluation
 TODO
 ## Benchmarks
 TODO
 # Base Model README.md
----
-license: apache-2.0
-license_link: https://huggingface.co/Qwen/QWQ-32B/blob/main/LICENSE
-language:
-- en
-pipeline_tag: text-generation
-base_model: Qwen/Qwen2.5-32B
-tags:
-- chat
-library_name: transformers
----
 # QwQ-32B

+---
+license: apache-2.0
+license_link: https://huggingface.co/Qwen/QWQ-32B/blob/main/LICENSE
+language:
+- en
+pipeline_tag: text-generation
+base_model: Qwen/Qwen2.5-32B
+tags:
+- chat
+library_name: transformers
+---
 # Quantization
 Created with [lambda-quant](https://github.com/LambdaLabsML/lambda-quant/tree/f97108fe4a9ee061a7b969b23a9605a6d561863d) on `Python 3.10.12 (main, Nov  6 2024, 20:22:13) [GCC 11.4.0]`
 1. `git clone https://github.com/LambdaLabsML/lambda-quant`
 2. `git checkout f97108fe4a9ee061a7b969b23a9605a6d561863d`
 3. `python quantize.py -m Qwen/QwQ-32B -q GPTQ-Int4`
 ## Evaluation
 TODO
 ## Benchmarks
 TODO
 # Base Model README.md
 # QwQ-32B