🤗Transformers

Topic	Replies	Views	Activity
Chatbot Start Prompt for GPT-J 🤗Transformers	5	1378	May 21, 2026
Automatic -100 masking of the questions in Labels 🤗Transformers	1	10	May 21, 2026
Date format for tine-tuning AI models 🤗Transformers	3	28	May 21, 2026
PTQ INT8 via TFLiteConverter — encoder-decoder seq2seq model loses encoder context entirely after conversion 🤗Transformers	3	87	May 16, 2026
Fucking hugging face changed the zerogpu 🤗Transformers	0	26	May 14, 2026
Train a fully open SmolLM4-750M model 🤗Transformers	0	73	May 11, 2026
The BPE pre-tokenizer was not recognized! 🤗Transformers	6	172	May 7, 2026
Custom batches in sentence-transformers for MultipleNegativesRankingLoss 🤗Transformers	4	81	May 1, 2026
I developed an experimental Graph-Native Artificial Brain engine 🤗Transformers	4	71	May 1, 2026
When i use tool its pause and restart space not working why DeepSpeed	0	16	April 30, 2026
CPU offloading error scenario 🤗Transformers	11	232	April 27, 2026
Gemma 3 12B: 4-bit Quantization failing/ignored in Transformers v5.1.0 (Gemma3ForConditionalGeneration) 🤗Transformers	11	350	April 24, 2026
Why am I facing this Error while running this code 🤗Transformers	1	60	April 23, 2026
What are the best tutorials to learn Transformers step by step? 🤗Transformers	2	119	April 20, 2026
LLM Course code errors 🤗Transformers	8	273	April 17, 2026
Independent researcher looking for technical feedback on a paper about a revision-capable language model 🤗Transformers	0	35	April 17, 2026
Why this BERTScore has a high precision? 🤗Transformers	1	57	April 16, 2026
Fine-tuning Gemma-4-E2B on MacBook M3 🤗Transformers	4	634	April 14, 2026
Current State and Future of "Integer-Only" LLM Inference (Non-Floating Point) 🤗Transformers	1	143	April 14, 2026
Continous increase in Memory usage 🤗Transformers	17	2285	April 14, 2026
Peft 0.18.1 crashing when fine-tuning - Part 2 🤗Transformers	2	38	April 14, 2026
Peft 0.18.1 crashing when fine-tuning 🤗Transformers	4	164	April 13, 2026
[Guide] How I debugged T5 fine-tuning for a medical diagnosis task 🤗Transformers	1	44	April 11, 2026
Runtime Layer on modeling_utils.py (No Source Changes) 🤗Transformers	0	68	April 11, 2026
What happened to DeepSite 2.0 🤗Transformers	3	59	April 9, 2026
Deprecation of assistant_only_loss 🤗Transformers	3	142	April 8, 2026
Semantic matching in graph space without matrix computation and hallucinations and no GPU 🤗Transformers	0	32	April 6, 2026
How to decode CSM tokens into audio tensors for streaming 🤗Transformers	2	85	April 5, 2026
How to get list of downloaded models names? 🤗Transformers	7	6013	April 5, 2026
Webhook usecase 🤗Transformers	1	27	April 2, 2026