local eval queue fixes

alanzhang25 · alanzhang25 · commit 412b9f7ab870 · 2025-08-18T16:03:48.000-07:00
diff --git a/src/judgeval/tracer/__init__.py b/src/judgeval/tracer/__init__.py
@@ -192,6 +192,9 @@ def __init__(
         )
         self.local_eval_queue = LocalEvaluationQueue()
 
+        if self.enable_evaluation and self.enable_monitoring:
+            self.local_eval_queue.start_workers()
+
         Tracer._active_tracers[self.project_name] = self
 
     def get_current_span(self):
diff --git a/src/judgeval/tracer/local_eval_queue.py b/src/judgeval/tracer/local_eval_queue.py
@@ -16,6 +16,8 @@
 from judgeval.data.evaluation_run import EvaluationRun
 from judgeval.utils.async_utils import safe_run_async
 from judgeval.scorers.score import a_execute_scoring
+from judgeval.api import JudgmentSyncClient
+from judgeval.env import JUDGMENT_API_KEY, JUDGMENT_ORG_ID
 
 
 class LocalEvaluationQueue:
@@ -37,6 +39,10 @@ def __init__(
         self._num_workers = num_workers  # Number of worker threads
         self._worker_threads: List[threading.Thread] = []
         self._shutdown_event = threading.Event()
+        self._api_client = JudgmentSyncClient(
+            api_key=JUDGMENT_API_KEY,
+            organization_id=JUDGMENT_ORG_ID,
+        )
 
     def enqueue(self, evaluation_run: EvaluationRun) -> None:
         """Add evaluation run to the queue."""
@@ -83,13 +89,8 @@ def run_all(
 
     def start_workers(
         self,
-        callback: Optional[Callable[[EvaluationRun, List[ScoringResult]], None]] = None,
     ) -> List[threading.Thread]:
         """Start multiple background threads to process runs in parallel.
-
-        Args:
-            callback: Optional function called after each run with (run, results).
-
         Returns:
             List of started worker threads.
         """
@@ -107,8 +108,10 @@ def _worker(worker_id: int) -> None:
 
                     try:
                         results = self._process_run(run)
-                        if callback:
-                            callback(run, results)
+                        results_dict = [result.model_dump() for result in results]
+                        self._api_client.log_eval_results(
+                            payload={"results": results_dict, "run": run.model_dump()}
+                        )
                     except Exception as exc:
                         judgeval_logger.error(
                             f"Worker {worker_id} error processing {run.eval_name}: {exc}"

Original file line number	Diff line number	Diff line change
`@@ -192,6 +192,9 @@ def __init__(`
`192`	`192`	`)`
`193`	`193`	`self.local_eval_queue = LocalEvaluationQueue()`
`194`	`194`
	`195`	`+ if self.enable_evaluation and self.enable_monitoring:`
	`196`	`+ self.local_eval_queue.start_workers()`
	`197`	`+`
`195`	`198`	`Tracer._active_tracers[self.project_name] = self`
`196`	`199`
`197`	`200`	`def get_current_span(self):`