UnifiedReward 1.0 Qwen Models GGUF - a CodeGoat24 Collection

CodeGoat24 's Collections

Pref-GRPO & UniGenBench

UnifiedReward 2.0 Models

UnifiedReward 1.0 Qwen Models

UnifiedReward 1.0 Qwen Models GGUF

UnifiedReward 1.0 LLaVA Model

UnifiedReward 1.0 Training Data

UnifiedReward 1.0 Qwen Models GGUF

updated 5 days ago

Unified Reward Model for Multimodal Understanding and Generation

Paper • 2503.05236 • Published Mar 7 • 124
Unified Multimodal Chain-of-Thought Reward Model through Reinforcement Fine-Tuning

Paper • 2505.03318 • Published May 6 • 94
mradermacher/UnifiedReward-qwen-32b-i1-GGUF

33B • Updated Jul 10 • 5 • 1
mradermacher/UnifiedReward-Think-qwen-7b-i1-GGUF

8B • Updated Jul 10 • 385
mradermacher/UnifiedReward-Think-qwen-7b-GGUF

8B • Updated Jul 31 • 171
mradermacher/UnifiedReward-qwen-7b-i1-GGUF

8B • Updated Jul 10 • 98 • 1
mradermacher/UnifiedReward-qwen-7b-GGUF

8B • Updated Jul 31 • 83 • 1
mradermacher/UnifiedReward-qwen-3b-GGUF

3B • Updated Jul 31 • 64
mradermacher/UnifiedReward-qwen-32b-GGUF

33B • Updated Jul 31 • 109