Change tests to use FakeAcceleratorManager, add _resolve_resources, and move record hardware usage to node.py

ryanaoleary · ryanaoleary · commit 8bb604b3cc0f · 2025-07-29T04:29:03.000Z
Signed-off-by: Ryan O'Leary &lt;ryanaoleary@google.com&gt;
diff --git a/python/ray/_private/node.py b/python/ray/_private/node.py
@@ -1403,6 +1403,16 @@ def start_ray_processes(self):
         # Make sure we don't call `determine_plasma_store_config` multiple
         # times to avoid printing multiple warnings.
         resource_and_label_spec = self.get_resource_and_label_spec()
+        if resource_and_label_spec.labels.get(
+            ray._raylet.RAY_NODE_ACCELERATOR_TYPE_KEY
+        ):
+            from ray._private.usage import usage_lib
+
+            usage_lib.record_hardware_usage(
+                resource_and_label_spec.labels.get(
+                    ray._raylet.RAY_NODE_ACCELERATOR_TYPE_KEY
+                )
+            )
 
         (
             plasma_directory,
diff --git a/python/ray/_private/resource_and_label_spec.py b/python/ray/_private/resource_and_label_spec.py
@@ -136,47 +136,9 @@ def resolve(
             ResourceAndLabelSpec: This instance with all fields resolved.
         """
 
-        # Load environment override resources and merge with resources passed
-        # in from Ray Params. Separates special case params if found in env.
-        env_resources = ResourceAndLabelSpec._load_env_resources()
-        (
-            num_cpus,
-            num_gpus,
-            memory,
-            object_store_memory,
-            merged_resources,
-        ) = ResourceAndLabelSpec._merge_resources(env_resources, self.resources or {})
-        self.num_cpus = self.num_cpus if num_cpus is None else num_cpus
-        self.num_gpus = self.num_gpus if num_gpus is None else num_gpus
-        self.memory = self.memory if memory is None else memory
-        self.object_store_memory = (
-            self.object_store_memory
-            if object_store_memory is None
-            else object_store_memory
-        )
-        self.resources = merged_resources
-
-        if node_ip_address is None:
-            node_ip_address = ray.util.get_node_ip_address()
+        self._resolve_resources(is_head=is_head, node_ip_address=node_ip_address)
 
-        # Automatically create a node id resource on each node. This is
-        # queryable with ray._private.state.node_ids() and
-        # ray._private.state.current_node_id().
-        self.resources[NODE_ID_PREFIX + node_ip_address] = 1.0
-
-        # Automatically create a head node resource.
-        if HEAD_NODE_RESOURCE_NAME in self.resources:
-            raise ValueError(
-                f"{HEAD_NODE_RESOURCE_NAME}"
-                " is a reserved resource name, use another name instead."
-            )
-        if is_head:
-            self.resources[HEAD_NODE_RESOURCE_NAME] = 1.0
-
-        if self.num_cpus is None:
-            self.num_cpus = ray._private.utils.get_num_cpus()
-
-        # Resolve accelerator resources
+        # Resolve accelerator-specific resources
         (
             accelerator_manager,
             num_accelerators,
@@ -196,7 +158,7 @@ def resolve(
         self._resolve_memory_resources()
 
         self._is_resolved = True
-        assert self.all_fields_set()
+        assert self._all_fields_set()
         return self
 
     @staticmethod
@@ -235,6 +197,54 @@ def _merge_resources(env_dict: Dict[str, float], params_dict: Dict[str, float]):
 
         return num_cpus, num_gpus, memory, object_store_memory, result
 
+    def _resolve_resources(
+        self, is_head: bool, node_ip_address: Optional[str] = None
+    ) -> None:
+        """Resolve CPU, GPU, and custom resources. Merges resources from environment,
+        Ray params, and defaults in that order of precedence."""
+
+        # Load environment override resources and merge with resources passed
+        # in from Ray Params. Separates special case params if found in env.
+        env_resources = ResourceAndLabelSpec._load_env_resources()
+        (
+            num_cpus,
+            num_gpus,
+            memory,
+            object_store_memory,
+            merged_resources,
+        ) = ResourceAndLabelSpec._merge_resources(env_resources, self.resources or {})
+
+        self.num_cpus = self.num_cpus if num_cpus is None else num_cpus
+        self.num_gpus = self.num_gpus if num_gpus is None else num_gpus
+        self.memory = self.memory if memory is None else memory
+        self.object_store_memory = (
+            self.object_store_memory
+            if object_store_memory is None
+            else object_store_memory
+        )
+        self.resources = merged_resources
+
+        if node_ip_address is None:
+            node_ip_address = ray.util.get_node_ip_address()
+
+        # Automatically create a node id resource on each node. This is
+        # queryable with ray._private.state.node_ids() and
+        # ray._private.state.current_node_id().
+        self.resources[NODE_ID_PREFIX + node_ip_address] = 1.0
+
+        # Automatically create a head node resource.
+        if HEAD_NODE_RESOURCE_NAME in self.resources:
+            raise ValueError(
+                f"{HEAD_NODE_RESOURCE_NAME}"
+                " is a reserved resource name, use another name instead."
+            )
+        if is_head:
+            self.resources[HEAD_NODE_RESOURCE_NAME] = 1.0
+
+        # Auto-detect CPU count if not explicitly set
+        if self.num_cpus is None:
+            self.num_cpus = ray._private.utils.get_num_cpus()
+
     @staticmethod
     def _load_env_labels() -> Dict[str, str]:
         env_override_labels = {}
@@ -347,10 +357,6 @@ def _resolve_accelerator_resources(self, accelerator_manager, num_accelerators):
         accelerator_type = accelerator_manager.get_current_node_accelerator_type()
         if accelerator_type:
             self.resources[f"{RESOURCE_CONSTRAINT_PREFIX}{accelerator_type}"] = 1
-
-            from ray._private.usage import usage_lib
-
-            usage_lib.record_hardware_usage(accelerator_type)
         additional_resources = (
             accelerator_manager.get_current_node_additional_resources()
         )
diff --git a/python/ray/tests/unit/test_resource_and_label_spec.py b/python/ray/tests/unit/test_resource_and_label_spec.py