Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

1,277

Full-text search

Active filters: nvidia

nvidia/Qwen3.5-397B-A17B-NVFP4

Text Generation • Updated 12 days ago • 69.4k • 57

nvidia/Nemotron-Terminal-32B

Text Generation • 33B • Updated 3 days ago • 273 • 26

nvidia/NVIDIA-Nemotron-Nano-9B-v2-Japanese

Text Generation • 9B • Updated 11 days ago • 16.1k • 121

nvidia/Nemotron-Terminal-8B

Text Generation • 8B • Updated 3 days ago • 225 • 14

embedl/Cosmos-Reason2-2B-W4A16-Edge2

Image-Text-to-Text • 2B • Updated about 17 hours ago • 9.57k • 9

nvidia/Cosmos-Predict2.5-2B

Updated about 6 hours ago • 29.9k • 88

nvidia/NVIDIA-Nemotron-Parse-v1.1

Image-Text-to-Text • Updated Jan 28 • 450k • 157

nvidia/Cosmos-Reason2-8B

Image-Text-to-Text • Updated Jan 30 • 217k • 135

mmnga-o/NVIDIA-Nemotron-Nano-9B-v2-Japanese-gguf

Text Generation • 9B • Updated 13 days ago • 12.7k • 48

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8

Text Generation • 32B • Updated 10 days ago • 1.35M • • 290

nvidia/Cosmos-Reason2-2B

Image-Text-to-Text • Updated Jan 30 • 84.1k • 47

nvidia/Kimi-K2.5-NVFP4

Text Generation • Updated 26 days ago • 100k • 55

nvidia/Nemotron-Terminal-14B

Text Generation • 15B • Updated 3 days ago • 66 • 6

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-NVFP4

Text Generation • 18B • Updated 10 days ago • 497k • 104

nvidia/Nemotron-Research-GooseReason-4B-Instruct

Text Generation • 4B • Updated 1 day ago • 14 • 5

nvidia/gliner-PII

Token Classification • Updated Dec 7, 2025 • 6.05k • 78

nvidia/Cosmos-Predict2-2B-Video2World

Image-to-Video • Updated Jul 23, 2025 • 12.9k • 45

nvidia/Cosmos-Transfer2.5-2B

Updated 18 days ago • 48.3k • 45

nvidia/Qwen3-235B-A22B-Eagle3

Text Generation • 0.3B • Updated Jan 26 • 3.56k • 12

nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B-BF16

Text Generation • 32B • Updated 10 days ago • 970k • 645

nvidia/Qwen3-Next-80B-A3B-Instruct-NVFP4

Text Generation • Updated 22 days ago • 40.2k • 32

unsloth/Nemotron-3-Nano-30B-A3B-GGUF

Text Generation • 32B • Updated Dec 31, 2025 • 121k • 271

nvidia/Cosmos-Reason1-7B

Image-Text-to-Text • Updated Dec 10, 2025 • 75.2k • 234

nvidia/Cosmos-Predict2-2B-Text2Image

Text-to-Image • Updated Jun 17, 2025 • 196 • 70

nvidia/NVIDIA-Nemotron-Nano-9B-v2

Text Generation • Updated Jan 8 • 173k • 479

nvidia/gpt-oss-120b-Eagle3-long-context

Text Generation • 0.2B • Updated Jan 26 • 19.8k • 62

nvidia/Qwen3-32B-NVFP4

Text Generation • 17B • Updated Sep 9, 2025 • 23.6k • 10

nvidia/Nemotron-Cascade-8B

Text Generation • Updated Jan 1 • 31.2k • 63

brianmatzelle/personaplex-7b-v1-bnb-4bit

Updated 7 days ago • 8

vincentzed-hf/Qwen3.5-397B-A17B-NVFP4

Image-Text-to-Text • Updated 14 days ago • 21.3k • 11