fixes

BBC-Esq · web-flow · commit 2433fdc41d70 · 2025-05-04T11:24:08.000-04:00
diff --git a/src/database_interactions.py b/src/database_interactions.py
@@ -29,7 +29,7 @@
 from utilities import my_cprint, get_model_native_precision, get_appropriate_dtype, supports_flash_attention
 from constants import VECTOR_MODELS
 
-logging.basicConfig(level=logging.CRITICAL, force=True)
+logging.basicConfig(level=logging.INFO, force=True)
 # logging.basicConfig(level=logging.DEBUG, force=True)
 logger = logging.getLogger(__name__)
 
@@ -51,6 +51,7 @@ def prepare_encode_kwargs(self):
     def create(self):
         prepared_kwargs = self.prepare_kwargs()
         prepared_encode_kwargs = self.prepare_encode_kwargs()
+
         return HuggingFaceEmbeddings(
             model_name=self.model_name,
             show_progress=not self.is_query,
@@ -143,12 +144,42 @@ def prepare_kwargs(self):
         return stella_kwargs
 
 
+# class AlibabaEmbedding(BaseEmbeddingModel):
+    # def prepare_kwargs(self):
+        # ali_kwargs = deepcopy(self.model_kwargs)
+        # compute_device = ali_kwargs.get("device", "").lower()
+        # is_cuda = compute_device == "cuda"
+        # use_xformers = is_cuda and supports_flash_attention()
+        # ali_kwargs["tokenizer_kwargs"] = {
+            # "padding": "longest",
+            # "truncation": True,
+            # "max_length": 8192
+        # }
+        # ali_kwargs["config_kwargs"] = {
+            # "use_memory_efficient_attention": use_xformers,
+            # "unpad_inputs": use_xformers,
+            # "attn_implementation": "eager" if use_xformers else "sdpa"
+        # }
+        # return ali_kwargs
+
+    # def prepare_encode_kwargs(self):
+        # encode_kwargs = super().prepare_encode_kwargs()
+        # encode_kwargs.update({
+            # "padding": True,
+            # "truncation": True,
+            # "max_length": 8192
+        # })
+        # return encode_kwargs
+
+
 class AlibabaEmbedding(BaseEmbeddingModel):
     def prepare_kwargs(self):
         ali_kwargs = deepcopy(self.model_kwargs)
+
         compute_device = ali_kwargs.get("device", "").lower()
         is_cuda = compute_device == "cuda"
         use_xformers = is_cuda and supports_flash_attention()
+
         ali_kwargs["tokenizer_kwargs"] = {
             "padding": "longest",
             "truncation": True,
@@ -171,6 +202,7 @@ def prepare_encode_kwargs(self):
         return encode_kwargs
 
 
+
 def create_vector_db_in_process(database_name):
     create_vector_db = CreateVectorDB(database_name=database_name)
     create_vector_db.run()