Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

255

Base only

Active filters: cuda

prism-ml/Bonsai-8B-gguf

Text Generation • 8B • Updated Apr 18 • 15.4k • 732

ussoewwin/Flash-Attention-2_for_Windows

Updated 41 minutes ago • 116

Multilingual-Multimodal-NLP/IndustrialCoder

Text Generation • 32B • Updated 3 days ago • 195 • 67

prism-ml/Bonsai-4B-gguf

Text Generation • 4B • Updated Apr 18 • 9.13k • 51

prism-ml/bonsai-image-ternary-4B-gemlite-2bit

Text-to-Image • Updated Jun 1 • 2.7k • 122

thad0ctor/torch2.12-cu133-cp312-wheels

Updated 19 days ago • 3

groxaxo/s2-pro-BnB-4Bits

Text-to-Speech • Updated Mar 25 • 279 • 6

Sumitc13/flash-attn-windows-wheels

Updated May 7 • 1

prism-ml/bonsai-image-binary-4B-gemlite-1bit

Text-to-Image • Updated Jun 1 • 221 • 42

koreallmdev/qwen2-5-14b-korean-coding-assistant-lora

Text Generation • Updated 5 days ago • 1 • 1

koreallmdev/qwen2-5-14b-korean-coding-assistant-gguf

15B • Updated 1 day ago • 1

elinas/chronos-13b-4bit

Text Generation • Updated Jun 23, 2023 • 30 • 23

CalderaAI/13B-Ouroboros-GPTQ4bit-128g-CUDA

Text Generation • Updated Jul 20, 2023 • 15

marcorez8/llama-cpp-python-windows-blackwell-cuda

Updated Jun 2, 2025 • 4

Prince-1/sarvam-m-onnx

Updated Jun 14, 2025 • 1

ValiantLabs/Qwen3-8B-ShiningValiant3

Text Generation • 8B • Updated Dec 9, 2025 • 17 • 3

mradermacher/Qwen3-8B-ShiningValiant3-GGUF

8B • Updated Jul 8, 2025 • 682 • 2

mradermacher/Qwen3-8B-ShiningValiant3-i1-GGUF

8B • Updated Jul 11, 2025 • 222 • 2

ValiantLabs/Qwen3-1.7B-ShiningValiant3

Text Generation • 2B • Updated Dec 9, 2025 • 22 • • 5

mradermacher/Qwen3-1.7B-ShiningValiant3-GGUF

2B • Updated Jul 11, 2025 • 74

mradermacher/Qwen3-1.7B-ShiningValiant3-i1-GGUF

2B • Updated Jul 11, 2025 • 233

ValiantLabs/Qwen3-4B-ShiningValiant3

Text Generation • 4B • Updated Dec 9, 2025 • 54 • • 7

sequelbox/Qwen3-8B-PlumEsper

Text Generation • 8B • Updated Jul 14, 2025 • 2

sequelbox/Qwen3-4B-PlumEsper

Text Generation • 4B • Updated Jul 15, 2025 • 6

mradermacher/Qwen3-Shining-Lucy-CODER-3.5B-Brainstorm20x-e32-GGUF

3B • Updated Jul 27, 2025 • 168 • 1

mradermacher/Qwen3-Shining-Lucy-CODER-2.4B-mix2-GGUF

2B • Updated Jul 27, 2025 • 107

mradermacher/Qwen3-Shining-Lucy-CODER-2.4B-GGUF

2B • Updated Jul 27, 2025 • 63

mradermacher/Qwen3-Shining-Lucy-CODER-2.4B-mix2-i1-GGUF

2B • Updated Dec 18, 2025 • 142

mradermacher/Qwen3-Shining-Lucy-CODER-2.4B-i1-GGUF

2B • Updated Dec 18, 2025 • 69

mradermacher/Qwen3-Shining-Lucy-CODER-3.5B-Brainstorm20x-e32-i1-GGUF

3B • Updated Dec 18, 2025 • 114 • 1