Quantized LLMs with GPTQ - a iproskurina Collection

iproskurina 's Collections

French Bias & Ethics Benchmarking Suite

Quantized LLMs with GPTQ

LMs + Topological Data Analysis🌌

LMs for French 🥐

Quantized LLMs with GPTQ

updated Jun 29, 2025

LLMs quantized with GPTQ

iproskurina/Mistral-7B-v0.3-GPTQ-4bit-g128

Text Generation • 7B • Updated Oct 29, 2025 • 32
iproskurina/bloom-7b1-GPTQ-4bit-g128

Text Generation • 3B • Updated Mar 29, 2025 • 1 • 2
iproskurina/bloom-1b7-GPTQ-4bit-g128

Text Generation • 1B • Updated Mar 29, 2025 • 1
iproskurina/bloom-3b-GPTQ-4bit-g128

Text Generation • 2B • Updated Mar 29, 2025 • 1
iproskurina/bloom-560m-GPTQ-4bit-g128

Text Generation • 0.6B • Updated Mar 29, 2025 • 3
iproskurina/bloom-1b1-GPTQ-4bit-g128

Text Generation • 0.9B • Updated Mar 29, 2025 • 8
iproskurina/opt-2.7b-GPTQ-4bit-g128

Text Generation • 0.6B • Updated Mar 29, 2025 • 3
iproskurina/opt-13b-GPTQ-4bit-g128

Text Generation • 2B • Updated Mar 29, 2025 • 3
iproskurina/opt-6.7b-GPTQ-4bit-g128

Text Generation • 1B • Updated Mar 29, 2025 • 1
iproskurina/opt-125m-GPTQ-4bit-g128

Text Generation • Updated Mar 29, 2025 • 9
iproskurina/opt-350m-GPTQ-4bit-g128

Text Generation • 95.6M • Updated Mar 29, 2025 • 4
iproskurina/opt-1.3b-GPTQ-4bit-g128

Text Generation • 0.4B • Updated Mar 29, 2025 • 1
iproskurina/Mistral-7B-v0.1-GPTQ-8bit-g128

Text Generation • 2B • Updated Mar 29, 2025 • 2
iproskurina/Mistral-7B-v0.3-GPTQ-8bit-g128

Text Generation • 7B • Updated Mar 29, 2025 • 12
iproskurina/Mistral-7B-v0.1-GPTQ-3bit-g64

Text Generation • 1B • Updated Mar 29, 2025 • 2
iproskurina/Mistral-7B-v0.1-GPTQ-8bit-g64

Text Generation • 2B • Updated Mar 29, 2025 • 1
iproskurina/Mistral-7B-v0.1-GPTQ-4bit-g128

Text Generation • 1B • Updated Mar 29, 2025 • 2
iproskurina/Mistral-7B-v0.1-GPTQ-3bit-g128

Text Generation • 1.0B • Updated Mar 29, 2025 • 2
TheBloke/Mistral-7B-Instruct-v0.1-GPTQ

Text Generation • 7B • Updated Sep 29, 2023 • 408 • 84
TheBloke/Mistral-7B-Instruct-v0.2-GPTQ

Text Generation • 7B • Updated Dec 11, 2023 • 13.6k • 55
TheBloke/bloomz-176B-GPTQ

Text Generation • Updated Jul 7, 2023 • 5 • 19
TheBloke/BLOOMChat-176B-v1-GPTQ

Text Generation • Updated Jul 7, 2023 • 3 • 31
TheBloke/Llama-2-13B-chat-GPTQ

Text Generation • 13B • Updated Sep 27, 2023 • 614 • 363
When Quantization Affects Confidence of Large Language Models?

Paper • 2405.00632 • Published May 1, 2024