issue/664: modified profile_operation

xgqdut2016 · xgqdut2016 · commit fa6ec8f94104 · 2026-01-12T11:33:12.000+08:00
diff --git a/test/infiniop/quant_linear.py b/test/infiniop/quant_linear.py
@@ -305,7 +305,25 @@ def lib_linear():
         debug(d.actual_tensor(), ans, atol=atol, rtol=rtol)
     
     assert torch.allclose(d.actual_tensor(), ans, atol=atol, rtol=rtol)
-
+    def profile_operation(name, func, device, num_prerun, num_iterations):
+        # Warm up
+        for _ in range(num_prerun):
+            func()
+
+        torch.cuda.synchronize()
+        start = torch.cuda.Event(enable_timing=True)
+        end = torch.cuda.Event(enable_timing=True)
+
+        start.record()
+        for _ in range(num_iterations):
+            func()
+        end.record()
+
+        torch.cuda.synchronize()
+        elapsed = start.elapsed_time(end)
+        print(
+            f"{name} took {elapsed / num_iterations:.6f} ms over {num_iterations} iterations"
+        )
     # Profiling workflow
     if PROFILE:
         # fmt: off
@@ -452,6 +470,25 @@ def lib_linear():
         )
 
     lib_linear()
+    def profile_operation(name, func, device, num_prerun, num_iterations):
+        # Warm up
+        for _ in range(num_prerun):
+            func()
+
+        torch.cuda.synchronize()
+        start = torch.cuda.Event(enable_timing=True)
+        end = torch.cuda.Event(enable_timing=True)
+
+        start.record()
+        for _ in range(num_iterations):
+            func()
+        end.record()
+
+        torch.cuda.synchronize()
+        elapsed = start.elapsed_time(end)
+        print(
+            f"{name} took {elapsed / num_iterations:.6f} ms over {num_iterations} iterations"
+        )
     if PROFILE:
         # fmt: off
         profile_operation("quant_linear", lambda: lib_linear(), device, NUM_PRERUN, NUM_ITERATIONS)