shopifyinterngrinder/sidekick-autocomplete-1.7b

Fine-tuned from Qwen/Qwen3-1.7B using TRL SFT.

Training Details

Parameter	Value
Base Model	Qwen/Qwen3-1.7B
Dataset	shopifyinterngrinder/sidekick-autocomplete-data @ `main`
Training Examples	900
Validation Examples	101
Epochs	3
Learning Rate	2e-05
Batch Size (per device)	1
Gradient Accumulation	2
Max Sequence Length	512
Precision	bf16
Optimizer	adamw_torch_fused
Warmup Steps	50
Weight Decay	0.01
LR Scheduler	cosine
Packing	Enabled
Dataset Format	chat

Safetensors

Model size

2B params

Tensor type

BF16

Base model

Finetuned

Finetuned

(535)

this model