Spaces:

tjhalanigrid
/

text2sql-demo

Sleeping

tjhalanigrid commited on Mar 27

Commit

d11ee9a

1 Parent(s): 862cf68

rlhf is added

Files changed (2) hide show

.gitignore CHANGED Viewed

@@ -2,8 +2,8 @@ __pycache__/
 *.pyc
 .DS_Store
 # checkpoints/milestone_before_more_dbs
-checkpoints/best_rlhf_codet5_soft
-checkpoints/best_rlhf_model
 results/
 *.png

 *.pyc
 .DS_Store
 # checkpoints/milestone_before_more_dbs
+# checkpoints/best_rlhf_codet5_soft
+# checkpoints/best_rlhf_model
 results/
 *.png

src/text2sql_engine.py CHANGED Viewed

@@ -56,7 +56,11 @@ class Text2SQLEngine:
         self.dml_keywords = r'\b(delete|update|insert|drop|alter|truncate)\b'
         print("Loading base model...")
-        base = AutoModelForSeq2SeqLM.from_pretrained(base_model_name)
         if not use_lora:
             self.tokenizer = AutoTokenizer.from_pretrained(base_model_name)
@@ -71,7 +75,11 @@ class Text2SQLEngine:
         adapter_path = adapter_path.resolve()
-        print("Loading tokenizer and LoRA adapter...")
         try:
             self.tokenizer = AutoTokenizer.from_pretrained(
@@ -81,7 +89,12 @@ class Text2SQLEngine:
         except Exception:
             self.tokenizer = AutoTokenizer.from_pretrained(base_model_name)
-        self.model = PeftModel.from_pretrained(base, str(adapter_path)).to(self.device)
         self.model.eval()
         print("✅ RLHF model ready\n")
@@ -214,4 +227,4 @@ def get_engine():
     if _engine is None:
         _engine = Text2SQLEngine()
-    return _engine

         self.dml_keywords = r'\b(delete|update|insert|drop|alter|truncate)\b'
         print("Loading base model...")
+        # Added tie_word_embeddings=False to silence the warning
+        base = AutoModelForSeq2SeqLM.from_pretrained(
+            base_model_name,
+            tie_word_embeddings=False
+        )
         if not use_lora:
             self.tokenizer = AutoTokenizer.from_pretrained(base_model_name)
         adapter_path = adapter_path.resolve()
+        # Sanity check to prevent confusing Hugging Face hub errors
+        if not adapter_path.exists():
+            raise FileNotFoundError(f"CRITICAL ERROR: Cannot find the model folder at {adapter_path}. It likely did not upload to Hugging Face correctly.")
+        print(f"Loading tokenizer and LoRA adapter from {adapter_path}...")
         try:
             self.tokenizer = AutoTokenizer.from_pretrained(
         except Exception:
             self.tokenizer = AutoTokenizer.from_pretrained(base_model_name)
+        # Added local_files_only=True to force local loading
+        self.model = PeftModel.from_pretrained(
+            base,
+            str(adapter_path),
+            local_files_only=True
+        ).to(self.device)
         self.model.eval()
         print("✅ RLHF model ready\n")
     if _engine is None:
         _engine = Text2SQLEngine()
+    return _engine