Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

ChibuUkachi updated a model about 11 hours ago

inference-optimization/Qwen3-235B-A22B-Thinking-2507.w8a8

ChibuUkachi updated a model about 11 hours ago

inference-optimization/Qwen3-235B-A22B-Thinking-2507.w4a16

ChibuUkachi updated a model 2 days ago

inference-optimization/final-ctest-Qwen3-8B-speculator.dflash

View all activity

inference-optimization 's models 336

inference-optimization/Qwen3-30B-A3B-7-bits-mode-hybrid-per-tensor

27B • Updated 23 days ago • 54

inference-optimization/Qwen3-30B-A3B-7-bits-mode-heuristic-per-tensor

27B • Updated 23 days ago • 63

inference-optimization/Qwen3-30B-A3B-6.5-bits-mode-noise-per-tensor

25B • Updated 23 days ago • 51

inference-optimization/Qwen3-30B-A3B-6.5-bits-mode-hybrid-per-tensor

25B • Updated 23 days ago • 48

inference-optimization/Qwen3-30B-A3B-6.5-bits-mode-heuristic-per-tensor

25B • Updated 23 days ago • 51

inference-optimization/Qwen3-30B-A3B-6-bits-mode-noise-per-tensor

23B • Updated 23 days ago • 46

inference-optimization/Qwen3-30B-A3B-6-bits-mode-hybrid-per-tensor

23B • Updated 23 days ago • 54

inference-optimization/Qwen3-30B-A3B-6-bits-mode-heuristic-per-tensor

23B • Updated 23 days ago • 68

inference-optimization/Qwen3-30B-A3B-5.5-bits-mode-noise-per-tensor

21B • Updated 23 days ago • 49

inference-optimization/Qwen3-30B-A3B-5.5-bits-mode-hybrid-per-tensor

21B • Updated 23 days ago • 47

inference-optimization/Qwen3-30B-A3B-5.5-bits-mode-heuristic-per-tensor

21B • Updated 23 days ago • 43

inference-optimization/Qwen3-30B-A3B-5-bits-mode-noise-per-tensor

19B • Updated 23 days ago • 47

inference-optimization/Qwen3-30B-A3B-5-bits-mode-hybrid-per-tensor

19B • Updated 23 days ago • 49

inference-optimization/Qwen3-30B-A3B-5-bits-mode-heuristic-per-tensor

19B • Updated 23 days ago • 63

inference-optimization/Qwen3-8B-7-bits-mode-noise-per-tensor

6B • Updated 23 days ago • 77

inference-optimization/Qwen3-8B-7-bits-mode-hybrid-per-tensor

7B • Updated 23 days ago • 88

inference-optimization/Qwen3-8B-7-bits-mode-heuristic-per-tensor

7B • Updated 23 days ago • 94

inference-optimization/Qwen3-8B-6.5-bits-mode-noise-per-tensor

6B • Updated 23 days ago • 68

inference-optimization/Qwen3-8B-6.5-bits-mode-hybrid-per-tensor

7B • Updated 23 days ago • 63

inference-optimization/Qwen3-8B-6.5-bits-mode-heuristic-per-tensor

7B • Updated 23 days ago • 74

inference-optimization/Qwen3-8B-6-bits-mode-noise-per-tensor

6B • Updated 23 days ago • 65

inference-optimization/Qwen3-8B-6-bits-mode-hybrid-per-tensor

6B • Updated 23 days ago • 64

inference-optimization/Qwen3-8B-6-bits-mode-heuristic-per-tensor

6B • Updated 23 days ago • 68

inference-optimization/Qwen3-8B-5.5-bits-mode-noise-per-tensor

6B • Updated 23 days ago • 66

inference-optimization/Qwen3-8B-5.5-bits-mode-hybrid-per-tensor

6B • Updated 23 days ago • 66

inference-optimization/Qwen3-8B-5.5-bits-mode-heuristic-per-tensor

6B • Updated 23 days ago • 68

inference-optimization/Qwen3-8B-5-bits-mode-noise-per-tensor

6B • Updated 23 days ago • 64

inference-optimization/Qwen3-8B-5-bits-mode-hybrid-per-tensor

6B • Updated 23 days ago • 71

inference-optimization/Qwen3-8B-5-bits-mode-heuristic-per-tensor

6B • Updated 23 days ago • 67

inference-optimization/Llama-3.1-8B-Instruct-7-bits-mode-noise-per-tensor

7B • Updated 23 days ago • 55