Edit Models filters

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

1,072

Full-text search

Active filters: vllm

mistralai/Mistral-7B-v0.3

7B • Updated 27 days ago • 92k • 516

mistralai/Codestral-22B-v0.1

22B • Updated 27 days ago • 47.3k • 1.29k

mistralai/Mistral-Large-Instruct-2407

123B • Updated 23 days ago • 10.4k • 838

mistralai/Mistral-Small-3.2-24B-Instruct-2506

24B • Updated 23 days ago • 361k • 404

unsloth/Devstral-Small-2507-GGUF

Text Generation • 24B • Updated Jul 10 • 27.2k • 53

mistralai/Magistral-Small-2507

24B • Updated 23 days ago • 10k • 86

unsloth/Magistral-Small-2507-GGUF

24B • Updated 26 days ago • 14.9k • 14

Jinx-org/Jinx-Qwen3-8B

Text Generation • 8B • Updated 8 days ago • 21 • 2

RedHatAI/gpt-oss-120b-FP8-Dynamic

Text Generation • 117B • Updated 6 days ago • 5 • 2

mradermacher/MedGemma-GRPO-i1-GGUF

4B • Updated 2 days ago • 2

mistralai/Pixtral-12B-2409

Updated 23 days ago • 2.99k • 659

mistralai/Mistral-Large-Instruct-2411

123B • Updated 23 days ago • 5.42k • 228

RedHatAI/DeepSeek-R1-Distill-Qwen-32B-FP8-dynamic

Text Generation • 33B • Updated Feb 27 • 1.16k • 8

mlx-community/DeepHermes-3-Llama-3-8B-Preview-4Bit

Text Generation • 1B • Updated Feb 13 • 22 • 2

NousResearch/DeepHermes-3-Llama-3-3B-Preview

Text Generation • 3B • Updated Mar 13 • 1.13k • 35

RedHatAI/QwQ-32B-FP8-dynamic

Text Generation • 33B • Updated Mar 6 • 1.76k • 9

mlx-community/DeepHermes-3-Mistral-24B-Preview-8bit

Text Generation • 7B • Updated Mar 14 • 36 • 3

ISTA-DASLab/gemma-3-27b-it-GPTQ-4b-128g

Image-Text-to-Text • 5B • Updated Mar 20 • 9.03k • 39

mistralai/Mistral-Small-3.1-24B-Base-2503

24B • Updated 23 days ago • 6.99k • 247

erax-ai/EraX-Translator-V1.0-GGUF

Translation • 4B • Updated May 6 • 237 • 8

mistralai/Devstral-Small-2505

24B • Updated 2 days ago • 10.7k • 841

RedHatAI/gemma-3-27b-it-quantized.w4a16

Image-Text-to-Text • 7B • Updated Jun 9 • 3.74k • 5

MiniMaxAI/MiniMax-M1-40k

Text Generation • 456B • Updated Jul 7 • 20k • 175

gabriellarson/Mistral-Small-3.2-24B-Instruct-2506-GGUF

Image-Text-to-Text • 24B • Updated Jun 20 • 756 • 6

unsloth/Mistral-Small-3.2-24B-Instruct-2506-FP8

Image-Text-to-Text • Updated Jun 21 • 59 • 3

Jinx-org/Jinx-Qwen3-0.6B

Text Generation • 0.8B • Updated 8 days ago • 8 • 1

Jinx-org/Jinx-Qwen3-4B

Text Generation • 4B • Updated 8 days ago • 14 • 1

unsloth/gpt-oss-20b-BF16

Text Generation • 21B • Updated 15 days ago • 22.6k • 16

mlx-community/gpt-oss-120b-4bit

Text Generation • 117B • Updated 14 days ago • 355 • 2

lastmass/MedGemma-GRPO

Image-Text-to-Text • 5B • Updated 2 days ago • 1.33k • 1