NovaSky-AI · SumanthRH · May 18, 2026 · gemini-code-assist · May 18, 2026
diff --git a/skyrl/backends/skyrl_train/inference_servers/vllm_worker.py b/skyrl/backends/skyrl_train/inference_servers/vllm_worker.py
@@ -82,6 +82,8 @@ def load_weights(self, request: bytes) -> None:
         """
         import pickle
 
+        from vllm.config import set_current_vllm_config
+
         # Unpickle request to restore the original object type
         assert isinstance(request, bytes), f"Expected bytes, got {type(request).__name__}"
         request = pickle.loads(request)
@@ -90,7 +92,8 @@ def load_weights(self, request: bytes) -> None:
         for name, tensor in self._weight_receiver.receive_weights(request):
             weight_list.append((name, tensor))
 
-        self.model_runner.model.load_weights(weights=weight_list)
+        with torch.device(self.device), set_current_vllm_config(self.vllm_config):
+            self.model_runner.reload_weights(weights_iterator=iter(weight_list))
-        for name, tensor in self._weight_receiver.receive_weights(request):
-            weight_list.append((name, tensor))
-
-        self.model_runner.model.load_weights(weights=weight_list)
-        with torch.device(self.device), set_current_vllm_config(self.vllm_config):
-            self.model_runner.reload_weights(weights_iterator=iter(weight_list))
+        with torch.device(self.device), set_current_vllm_config(self.vllm_config):
+            self.model_runner.reload_weights(
+                weights_iterator=self._weight_receiver.receive_weights(request))
-        for name, tensor in self._weight_receiver.receive_weights(request):
-            weight_list.append((name, tensor))
-
-        self.model_runner.model.load_weights(weights=weight_list)
-        with torch.device(self.device), set_current_vllm_config(self.vllm_config):
-            self.model_runner.reload_weights(weights_iterator=iter(weight_list))
+        with torch.device(self.device), set_current_vllm_config(self.vllm_config):
+            self.model_runner.reload_weights(
+                weights_iterator=self._weight_receiver.receive_weights(request))
 
         for weight in weight_list:
             del weight