Edit Models filters

Inference Providers

Nebius AI Studio

HF Inference API

Misc

arxiv: 2408.11796

Inference Endpoints

AutoTrain Compatible

text-generation-inference

4-bit precision

Misc with no match

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

10

Full-text search

Active filters: 2408.11796

nvidia/Llama-3.1-Minitron-4B-Width-Base

Text Generation • Updated 10 days ago • 3.33k • 188

nvidia/Llama-3.1-Minitron-4B-Depth-Base

Text Generation • Updated 9 days ago • 2.26k • 21

nvidia/Mistral-NeMo-Minitron-8B-Base

Text Generation • Updated Aug 22, 2024 • 10.2k • 170

RichardErkhov/nvidia_-_Mistral-NeMo-Minitron-8B-Base-gguf

Updated Aug 23, 2024 • 7.27k • 1

denkijin/Llama-3.1-Minitron-4B-Width-Base

Updated Aug 23, 2024

QuantFactory/Llama-3.1-Minitron-4B-Width-Base-GGUF

Updated Aug 24, 2024 • 51 • 1

TitanML/Mistral-NeMo-Minitron-8B-Base

Text Generation • Updated Sep 9, 2024 • 5

mylesgoose/Llama-3.1-Minitron-4B-Width-Base

Updated Sep 26, 2024 • 24 • 1

mav23/Mistral-NeMo-Minitron-8B-Base-GGUF

Updated Nov 5, 2024 • 25

da-fr/Mistral-NeMo-Minitron-8B-ARChitects-Full-bnb-4bit

Updated Dec 3, 2024 • 5.11k • 2