Krishna Teja Chitty-Venkata's picture

Building on HF

Krishna Teja Chitty-Venkata

krishnateja95

RedHatAI

·

https://krishnateja95.github.io/

AI & ML interests

LLM Optimization, Neural Architecture Search, Quantization, Pruning

Recent Activity

updated a model 6 days ago

RedHatAI/NVIDIA-Nemotron-3-Ultra-550B-A55B-FP8-dynamic

updated a model 6 days ago

RedHatAI/NVIDIA-Nemotron-3-Ultra-550B-A55B-FP8-block

updated a model 6 days ago

RedHatAI/NVIDIA-Nemotron-3-Ultra-550B-A55B-quantized.w4a16

View all activity

Organizations

updated 3 models 6 days ago

RedHatAI/NVIDIA-Nemotron-3-Ultra-550B-A55B-FP8-dynamic

Text Generation • 561B • Updated 2 days ago • 458 • 1

RedHatAI/NVIDIA-Nemotron-3-Ultra-550B-A55B-FP8-block

Text Generation • 561B • Updated 3 days ago • 33

RedHatAI/NVIDIA-Nemotron-3-Ultra-550B-A55B-quantized.w4a16

Text Generation • 565B • Updated 3 days ago • 746 • 3

published 3 models 6 days ago

RedHatAI/NVIDIA-Nemotron-3-Ultra-550B-A55B-quantized.w4a16

Text Generation • 565B • Updated 3 days ago • 746 • 3

RedHatAI/NVIDIA-Nemotron-3-Ultra-550B-A55B-FP8-block

Text Generation • 561B • Updated 3 days ago • 33

RedHatAI/NVIDIA-Nemotron-3-Ultra-550B-A55B-FP8-dynamic

Text Generation • 561B • Updated 2 days ago • 458 • 1

updated a bucket 8 days ago

krishnateja95/Mellum2-12B-A2.5B-Thinking

published a bucket 8 days ago

krishnateja95/Mellum2-12B-A2.5B-Thinking

updated a model 14 days ago

RedHatAI/NVIDIA-Nemotron-3-Super-120B-A12B-BF16

Text Generation • 124B • Updated 14 days ago • 3.33k

updated 11 models 22 days ago

inference-optimization/Qwen3.6-35B-A3B-7.0-bits-mode-noise

Image-Text-to-Text • 32B • Updated 22 days ago • 65

inference-optimization/Qwen3.6-35B-A3B-7.0-bits-mode-hybrid

Image-Text-to-Text • 32B • Updated 22 days ago • 65

inference-optimization/Qwen3.6-35B-A3B-7.0-bits-mode-heuristic

Image-Text-to-Text • 32B • Updated 22 days ago • 117

inference-optimization/Qwen3.6-35B-A3B-6.5-bits-mode-noise

Image-Text-to-Text • 30B • Updated 22 days ago • 79

inference-optimization/Qwen3.6-35B-A3B-6.5-bits-mode-hybrid

Image-Text-to-Text • 30B • Updated 22 days ago • 63

inference-optimization/Qwen3.6-35B-A3B-6.5-bits-mode-heuristic

Image-Text-to-Text • 30B • Updated 22 days ago • 84

inference-optimization/Qwen3.6-35B-A3B-6.0-bits-mode-noise

Image-Text-to-Text • 28B • Updated 22 days ago • 48

inference-optimization/Qwen3.6-35B-A3B-6.0-bits-mode-hybrid

Image-Text-to-Text • 28B • Updated 22 days ago • 131

inference-optimization/Qwen3.6-35B-A3B-6.0-bits-mode-heuristic

Image-Text-to-Text • 28B • Updated 22 days ago • 70

inference-optimization/Qwen3.6-35B-A3B-5.5-bits-mode-noise

Image-Text-to-Text • 26B • Updated 22 days ago • 46

inference-optimization/Qwen3.6-35B-A3B-5.5-bits-mode-hybrid

Image-Text-to-Text • 26B • Updated 22 days ago • 74