make compilation optional, return None for empty attention graph

sfluegel05 · sfluegel05 · commit 75ade76b867b · 2026-02-24T12:15:03.000+01:00
diff --git a/chebifier/prediction_models/electra_predictor.py b/chebifier/prediction_models/electra_predictor.py
@@ -1,3 +1,5 @@
+from typing import Optional
+
 import numpy as np
 
 from .nn_predictor import NNPredictor
@@ -40,7 +42,7 @@ def __init__(self, model_name: str, ckpt_path: str, **kwargs):
             f"Initialised Electra model {self.model_name} (device: {self.predictor.device})"
         )
 
-    def explain_smiles(self, smiles) -> dict:
+    def explain_smiles(self, smiles) -> Optional[dict]:
         from chebai.preprocessing.reader import EMBEDDING_OFFSET
 
         # Add dummy labels because the collate function requires them.
@@ -69,4 +71,6 @@ def explain_smiles(self, smiles) -> dict:
             ]
             for a in result["attentions"]
         ]
+        if len(graphs) == 0:
+            return None
         return {"graphs": graphs}
diff --git a/chebifier/prediction_models/nn_predictor.py b/chebifier/prediction_models/nn_predictor.py
@@ -20,8 +20,13 @@ def __init__(
     ):
         super().__init__(model_name, **kwargs)
         self.batch_size = kwargs.get("batch_size", None)
+        # compile_model will run the model in eager mode, which gives better performance, but does not return intermediate states
+        # such as attention weights. Therfore, ELECTRA attention graphs will only work with compile_model=False.
+        compile_model = kwargs.get("compile_model", True)
         # If batch_size is not provided, it will be set to default batch size used during training in Predictor
-        self.predictor: Predictor = Predictor(ckpt_path, self.batch_size)
+        self.predictor: Predictor = Predictor(
+            ckpt_path, self.batch_size, compile_model=compile_model
+        )
 
     @modelwise_smiles_lru_cache.batch_decorator
     def predict_smiles_list(self, smiles_list: list[str]) -> list:
@@ -51,4 +56,5 @@ def calculate_results(self, batch):
         dat = self.predictor._model._process_batch(
             collator(batch).to(self.predictor.device), 0
         )
+
         return self.predictor._model(dat, **dat["model_kwargs"])

Original file line number	Diff line number	Diff line change
`@@ -1,3 +1,5 @@`
	`1`	`+from typing import Optional`
	`2`	`+`
`1`	`3`	`import numpy as np`
`2`	`4`
`3`	`5`	`from .nn_predictor import NNPredictor`
`@@ -40,7 +42,7 @@ def __init__(self, model_name: str, ckpt_path: str, **kwargs):`
`40`	`42`	`f"Initialised Electra model {self.model_name} (device: {self.predictor.device})"`
`41`	`43`	`)`
`42`	`44`
`43`		`- def explain_smiles(self, smiles) -> dict:`
	`45`	`+ def explain_smiles(self, smiles) -> Optional[dict]:`
`44`	`46`	`from chebai.preprocessing.reader import EMBEDDING_OFFSET`
`45`	`47`
`46`	`48`	`# Add dummy labels because the collate function requires them.`
`@@ -69,4 +71,6 @@ def explain_smiles(self, smiles) -> dict:`
`69`	`71`	`]`
`70`	`72`	`for a in result["attentions"]`
`71`	`73`	`]`
	`74`	`+ if len(graphs) == 0:`
	`75`	`+ return None`
`72`	`76`	`return {"graphs": graphs}`