Lint fixes + call_llvm_intrin nargs change

fzi-peccia · fzi-peccia · commit f9b2667a4ee2 · 2025-08-18T10:16:36.000+02:00
diff --git a/python/tvm/tir/tensor_intrin/riscv_cpu.py b/python/tvm/tir/tensor_intrin/riscv_cpu.py
@@ -177,12 +177,10 @@ def rvv_vmacc_llvm_impl(
                 T.call_llvm_intrin(
                     llvm_macc_dtype,
                     expand_llvm_intrinsic,
-                    T.uint32(3),
                     T.broadcast(broadcast_output, n_output_dtype * T.vscale()),
                     T.call_llvm_intrin(
                         llvm_input_dtype,
                         load_llvm_intrinsic,
-                        T.uint32(3),
                         T.broadcast(broadcast_input, n_input_dtype * T.vscale()),
                         A.access_ptr(access_mask=A.READ, ptr_type="handle"),
                         T.int64(vlmax),
@@ -193,7 +191,6 @@ def rvv_vmacc_llvm_impl(
                 else T.call_llvm_intrin(
                     llvm_input_dtype,
                     load_llvm_intrinsic,
-                    T.uint32(3),
                     T.broadcast(broadcast_input, n_input_dtype * T.vscale()),
                     A.access_ptr(access_mask=A.READ, ptr_type="handle"),
                     T.int64(vlmax),
@@ -204,12 +201,10 @@ def rvv_vmacc_llvm_impl(
                 T.call_llvm_intrin(
                     llvm_macc_dtype,
                     expand_llvm_intrinsic,
-                    T.uint32(3),
                     T.broadcast(broadcast_output, n_output_dtype * T.vscale()),
                     T.call_llvm_intrin(
                         llvm_input_dtype,
                         load_llvm_intrinsic,
-                        T.uint32(3),
                         T.broadcast(broadcast_input, n_input_dtype * T.vscale()),
                         B.access_ptr(access_mask=B.READ, ptr_type="handle"),
                         T.int64(vlmax),
@@ -220,7 +215,6 @@ def rvv_vmacc_llvm_impl(
                 else T.call_llvm_intrin(
                     llvm_input_dtype,
                     load_llvm_intrinsic,
-                    T.uint32(3),
                     T.broadcast(broadcast_input, n_input_dtype * T.vscale()),
                     B.access_ptr(access_mask=B.READ, ptr_type="handle"),
                     T.int64(vlmax),
@@ -230,7 +224,6 @@ def rvv_vmacc_llvm_impl(
             init = T.call_llvm_intrin(
                 llvm_macc_dtype,
                 init_llvm_intrinsic,
-                T.uint32(3),
                 T.broadcast(broadcast_output, n_output_dtype * T.vscale()),
                 C.access_ptr(access_mask=C.READ, ptr_type="handle"),
                 T.uint64(vlmax),
@@ -240,7 +233,6 @@ def rvv_vmacc_llvm_impl(
                 T.call_llvm_intrin(
                     llvm_macc_dtype,
                     macc_llvm_intrinsic,
-                    T.uint32(6),
                     init,
                     vec_A,
                     vec_B,
@@ -252,7 +244,6 @@ def rvv_vmacc_llvm_impl(
                 else T.call_llvm_intrin(
                     llvm_macc_dtype,
                     macc_llvm_intrinsic,
-                    T.uint32(5),
                     init,
                     vec_A,
                     vec_B,
@@ -264,7 +255,6 @@ def rvv_vmacc_llvm_impl(
             T.call_llvm_intrin(
                 "",
                 store_llvm_intrinsic,
-                T.uint32(3),
                 product,
                 C.access_ptr(access_mask=C.WRITE, ptr_type="handle"),
                 T.uint64(vlmax),
@@ -362,12 +352,10 @@ def rvv_multivmul_llvm_impl(
                 T.call_llvm_intrin(
                     llvm_mult_dtype,
                     expand_llvm_intrinsic,
-                    T.uint32(3),
                     T.broadcast(broadcast_intermmediate, n_intermmediate_dtype * T.vscale()),
                     T.call_llvm_intrin(
                         llvm_input_dtype,
                         load_llvm_intrinsic,
-                        T.uint32(3),
                         T.broadcast(broadcast_input, n_input_dtype * T.vscale()),
                         A.access_ptr(access_mask=A.READ, ptr_type="handle"),
                         T.int64(vlmax),
@@ -378,7 +366,6 @@ def rvv_multivmul_llvm_impl(
                 else T.call_llvm_intrin(
                     llvm_input_dtype,
                     load_llvm_intrinsic,
-                    T.uint32(3),
                     T.broadcast(broadcast_input, n_input_dtype * T.vscale()),
                     A.access_ptr(access_mask=A.READ, ptr_type="handle"),
                     T.int64(vlmax),
@@ -389,12 +376,10 @@ def rvv_multivmul_llvm_impl(
                 T.call_llvm_intrin(
                     llvm_mult_dtype,
                     expand_llvm_intrinsic,
-                    T.uint32(3),
                     T.broadcast(broadcast_intermmediate, n_intermmediate_dtype * T.vscale()),
                     T.call_llvm_intrin(
                         llvm_input_dtype,
                         load_llvm_intrinsic,
-                        T.uint32(3),
                         T.broadcast(broadcast_input, n_input_dtype * T.vscale()),
                         B.access_ptr(access_mask=B.READ, ptr_type="handle"),
                         T.int64(vlmax),
@@ -405,7 +390,6 @@ def rvv_multivmul_llvm_impl(
                 else T.call_llvm_intrin(
                     llvm_kernel_dtype,
                     load_llvm_intrinsic,
-                    T.uint32(3),
                     T.broadcast(broadcast_kernel, n_kernel_dtype * T.vscale()),
                     B.access_ptr(access_mask=B.READ, ptr_type="handle"),
                     T.int64(vlmax),
@@ -415,7 +399,6 @@ def rvv_multivmul_llvm_impl(
             redsum = T.call_llvm_intrin(
                 llvm_redsum_dtype,
                 init_llvm_intrinsic,
-                T.uint32(3),
                 T.broadcast(broadcast_output, n_redsum_dtype * T.vscale()),
                 C[0],
                 T.uint64(1),
@@ -425,7 +408,6 @@ def rvv_multivmul_llvm_impl(
                 T.call_llvm_intrin(
                     llvm_mult_dtype,
                     mult_llvm_intrinsic,
-                    T.uint32(5),
                     T.broadcast(broadcast_output, n_intermmediate_dtype * T.vscale()),
                     vec_A,
                     vec_B,
@@ -436,7 +418,6 @@ def rvv_multivmul_llvm_impl(
                 else T.call_llvm_intrin(
                     llvm_mult_dtype,
                     mult_llvm_intrinsic,
-                    T.uint32(4),
                     T.broadcast(broadcast_output, n_intermmediate_dtype * T.vscale()),
                     vec_A,
                     vec_B,
@@ -448,7 +429,6 @@ def rvv_multivmul_llvm_impl(
                 T.call_llvm_intrin(
                     llvm_redsum_dtype,
                     redsum_llvm_intrinsic,
-                    T.uint32(5),
                     T.broadcast(broadcast_output, n_redsum_dtype * T.vscale()),
                     product,
                     redsum,
@@ -459,7 +439,6 @@ def rvv_multivmul_llvm_impl(
                 else T.call_llvm_intrin(
                     llvm_redsum_dtype,
                     redsum_llvm_intrinsic,
-                    T.uint32(4),
                     T.broadcast(broadcast_output, n_redsum_dtype * T.vscale()),
                     product,
                     redsum,
@@ -470,7 +449,6 @@ def rvv_multivmul_llvm_impl(
             T.call_llvm_intrin(
                 "",
                 store_llvm_intrinsic,
-                T.uint32(3),
                 redsum_result,
                 C.access_ptr(access_mask=C.WRITE, ptr_type="handle"),
                 T.uint64(1),
@@ -560,12 +538,10 @@ def rvv_vmul_llvm_impl(
                 T.call_llvm_intrin(
                     llvm_mult_dtype,
                     expand_llvm_intrinsic,
-                    T.uint32(3),
                     T.broadcast(broadcast_intermmediate, n_intermmediate_dtype * T.vscale()),
                     T.call_llvm_intrin(
                         llvm_input_dtype,
                         load_llvm_intrinsic,
-                        T.uint32(3),
                         T.broadcast(broadcast_input, n_input_dtype * T.vscale()),
                         A.access_ptr(access_mask=A.READ, ptr_type="handle"),
                         T.int64(vlmax),
@@ -576,7 +552,6 @@ def rvv_vmul_llvm_impl(
                 else T.call_llvm_intrin(
                     llvm_input_dtype,
                     load_llvm_intrinsic,
-                    T.uint32(3),
                     T.broadcast(broadcast_input, n_input_dtype * T.vscale()),
                     A.access_ptr(access_mask=A.READ, ptr_type="handle"),
                     T.int64(vlmax),
@@ -587,12 +562,10 @@ def rvv_vmul_llvm_impl(
                 T.call_llvm_intrin(
                     llvm_mult_dtype,
                     expand_llvm_intrinsic,
-                    T.uint32(3),
                     T.broadcast(broadcast_intermmediate, n_intermmediate_dtype * T.vscale()),
                     T.call_llvm_intrin(
                         llvm_input_dtype,
                         load_llvm_intrinsic,
-                        T.uint32(3),
                         T.broadcast(broadcast_input, n_input_dtype * T.vscale()),
                         B.access_ptr(access_mask=B.READ, ptr_type="handle"),
                         T.int64(vlmax),
@@ -603,7 +576,6 @@ def rvv_vmul_llvm_impl(
                 else T.call_llvm_intrin(
                     llvm_kernel_dtype,
                     load_llvm_intrinsic,
-                    T.uint32(3),
                     T.broadcast(broadcast_kernel, n_kernel_dtype * T.vscale()),
                     B.access_ptr(access_mask=B.READ, ptr_type="handle"),
                     T.int64(vlmax),
@@ -613,7 +585,6 @@ def rvv_vmul_llvm_impl(
             redsum = T.call_llvm_intrin(
                 llvm_redsum_dtype,
                 init_llvm_intrinsic,
-                T.uint32(3),
                 T.broadcast(broadcast_output, n_redsum_dtype * T.vscale()),
                 C[0],
                 T.uint64(1),
@@ -623,7 +594,6 @@ def rvv_vmul_llvm_impl(
                 T.call_llvm_intrin(
                     llvm_mult_dtype,
                     mult_llvm_intrinsic,
-                    T.uint32(5),
                     T.broadcast(broadcast_output, n_intermmediate_dtype * T.vscale()),
                     vec_A,
                     vec_B,
@@ -634,7 +604,6 @@ def rvv_vmul_llvm_impl(
                 else T.call_llvm_intrin(
                     llvm_mult_dtype,
                     mult_llvm_intrinsic,
-                    T.uint32(4),
                     T.broadcast(broadcast_output, n_intermmediate_dtype * T.vscale()),
                     vec_A,
                     vec_B,
@@ -646,7 +615,6 @@ def rvv_vmul_llvm_impl(
                 T.call_llvm_intrin(
                     llvm_redsum_dtype,
                     redsum_llvm_intrinsic,
-                    T.uint32(5),
                     T.broadcast(broadcast_output, n_redsum_dtype * T.vscale()),
                     product,
                     redsum,
@@ -657,7 +625,6 @@ def rvv_vmul_llvm_impl(
                 else T.call_llvm_intrin(
                     llvm_redsum_dtype,
                     redsum_llvm_intrinsic,
-                    T.uint32(4),
                     T.broadcast(broadcast_output, n_redsum_dtype * T.vscale()),
                     product,
                     redsum,
@@ -668,7 +635,6 @@ def rvv_vmul_llvm_impl(
             T.call_llvm_intrin(
                 "",
                 store_llvm_intrinsic,
-                T.uint32(3),
                 redsum_result,
                 C.access_ptr(access_mask=C.WRITE, ptr_type="handle"),
                 T.uint64(1),
diff --git a/src/target/parsers/aprofile.cc b/src/target/parsers/aprofile.cc
@@ -80,7 +80,6 @@ bool CheckContains(Array<String> array, String predicate) {
   return std::any_of(array.begin(), array.end(), [&](String var) { return var == predicate; });
 }
 
-
 static TargetFeatures GetFeatures(TargetJSON target) {
 #ifdef TVM_LLVM_VERSION
   String kind = Downcast<String>(target.Get("kind").value());
diff --git a/src/target/parsers/cpu.cc b/src/target/parsers/cpu.cc
@@ -60,7 +60,6 @@ TargetJSON ParseTarget(TargetJSON target) {
   return target;
 }
 
-
 }  // namespace cpu
 }  // namespace parsers
 }  // namespace target
diff --git a/src/target/parsers/cpu.h b/src/target/parsers/cpu.h
@@ -27,7 +27,6 @@
 
 #include <tvm/target/target.h>
 
-
 namespace tvm {
 namespace target {
 namespace parsers {

Original file line number	Diff line number	Diff line change
`@@ -80,7 +80,6 @@ bool CheckContains(Array<String> array, String predicate) {`
`80`	`80`	`return std::any_of(array.begin(), array.end(), [&](String var) { return var == predicate; });`
`81`	`81`	`}`
`82`	`82`
`83`		`-`
`84`	`83`	`static TargetFeatures GetFeatures(TargetJSON target) {`
`85`	`84`	`#ifdef TVM_LLVM_VERSION`
`86`	`85`	`String kind = Downcast<String>(target.Get("kind").value());`
Original file line number	Diff line number	Diff line change
`@@ -60,7 +60,6 @@ TargetJSON ParseTarget(TargetJSON target) {`
`60`	`60`	`return target;`
`61`	`61`	`}`
`62`	`62`
`63`		`-`
`64`	`63`	`} // namespace cpu`
`65`	`64`	`} // namespace parsers`
`66`	`65`	`} // namespace target`