Rename mem_footprint to mem_footprint_compression_ratio (#66)

FindHao · facebook-github-bot · commit f74fd5633a8e · 2024-11-21T12:31:56.000-08:00
Summary: Fix #44 Pull Request resolved: #66 Reviewed By: xuzhao9 Differential Revision: D66312472 Pulled By: FindHao fbshipit-source-id: 299a37622f5d066461f8779f5d7b15f72ae5d27a
diff --git a/tritonbench/utils/triton_op.py b/tritonbench/utils/triton_op.py
@@ -63,7 +63,7 @@ class BenchmarkOperatorBackend:
 REGISTERED_METRICS: Dict[str, List[str]] = {}
 REGISTERED_X_VALS: Dict[str, str] = {}
 BASELINE_BENCHMARKS: Dict[str, str] = {}
-BASELINE_SKIP_METRICS = {"speedup", "accuracy", "mem_footprint"}
+BASELINE_SKIP_METRICS = {"speedup", "accuracy", "mem_footprint_compression_ratio"}
 X_ONLY_METRICS = set(["hw_roofline"])
 PRECISION_DTYPE_MAPPING = {
     "fp32": torch.float32,
@@ -227,7 +227,7 @@ class BenchmarkOperatorMetrics:
     # extra metrics
     extra_metrics: Optional[Dict[str, float]] = None
     # mem footprint
-    mem_footprint: Optional[float] = None
+    mem_footprint_compression_ratio: Optional[float] = None
 
 
 BUILTIN_METRICS = {x.name for x in fields(BenchmarkOperatorMetrics)} - {"extra_metrics"}
@@ -953,29 +953,31 @@ def _init_extra_metrics() -> Dict[str, Any]:
                         if not self.tb_args.bypass_fail:
                             raise e
                         metrics.latency = None
-            if {"gpu_peak_mem", "gpu_mem_footprint", "cpu_peak_mem"} & set(
-                self.required_metrics
-            ):
+            if {
+                "gpu_peak_mem",
+                "gpu_mem_footprint_compression_ratio",
+                "cpu_peak_mem",
+            } & set(self.required_metrics):
                 metrics.cpu_peak_mem, metrics.gpu_peak_mem = self.get_peak_mem(
                     fn,
                     grad_to_none=self.get_grad_to_none(self.example_inputs),
                     required_metrics=self.required_metrics,
                     use_cuda_graphs=self.use_cuda_graphs,
                 )
             if (
-                "mem_footprint" in self.required_metrics
+                "mem_footprint_compression_ratio" in self.required_metrics
                 and "gpu_peak_mem" in self.required_metrics
                 and self.baseline_metrics
             ):
                 if (
                     self.baseline_metrics.gpu_peak_mem is not None
                     and metrics.gpu_peak_mem is not None
                 ):
-                    metrics.mem_footprint = (
+                    metrics.mem_footprint_compression_ratio = (
                         self.baseline_metrics.gpu_peak_mem / metrics.gpu_peak_mem
                     )
                 else:
-                    metrics.mem_footprint = None
+                    metrics.mem_footprint_compression_ratio = None
             if "walltime" in self.required_metrics:
                 metrics.walltime = do_bench_walltime(
                     fn,
@@ -1180,7 +1182,7 @@ def get_peak_mem(
             grad_to_none (Optional[List[torch.Tensor]], optional): List of tensors whose gradients
                 should be set to None between iterations. Defaults to None.
             required_metrics (Optional[List[str]], optional): List of metrics to measure.
-                Supported values: ["gpu_peak_mem", "mem_footprint", "cpu_peak_mem"].
+                Supported values: ["gpu_peak_mem", "mem_footprint_compression_ratio", "cpu_peak_mem"].
                 Defaults to None.
             use_cuda_graphs (bool, optional): Whether to use CUDA graphs for measurement.
                 Defaults to False.
@@ -1206,7 +1208,7 @@ def get_peak_mem(
                 fn, n_repeat=2, grad_to_none=grad_to_none, device_type=device_type
             )
         if device_type == "cuda" and (
-            {"gpu_peak_mem", "mem_footprint"} & set(required_metrics)
+            {"gpu_peak_mem", "mem_footprint_compression_ratio"} & set(required_metrics)
         ):
             gpu_peak_mem = torch.cuda.max_memory_allocated() / 10**9
         if "cpu_peak_mem" in required_metrics: