oneapi-src
diff --git a/‎clang/lib/DPCT/AnalysisInfo.h‎
Lines changed: 1 addition & 1 deletion b/‎clang/lib/DPCT/AnalysisInfo.h‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎clang/runtime/dpct-rt/include/util.hpp.inc‎
Lines changed: 2 additions & 2 deletions b/‎clang/runtime/dpct-rt/include/util.hpp.inc‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎clang/test/dpct/a_vcxproj_test/a_kernel.cu‎
Lines changed: 2 additions & 1 deletion b/‎clang/test/dpct/a_vcxproj_test/a_kernel.cu‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎clang/test/dpct/atomic_functions.cu‎
Lines changed: 9 additions & 5 deletions b/‎clang/test/dpct/atomic_functions.cu‎
Lines changed: 9 additions & 5 deletions
diff --git a/‎clang/test/dpct/atomic_functions_no_use_generic_space.cu‎
Lines changed: 8 additions & 4 deletions b/‎clang/test/dpct/atomic_functions_no_use_generic_space.cu‎
Lines changed: 8 additions & 4 deletions
diff --git a/‎clang/test/dpct/b_vcxproj_test/b_kernel.cu‎
Lines changed: 2 additions & 1 deletion b/‎clang/test/dpct/b_vcxproj_test/b_kernel.cu‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎clang/test/dpct/builtin_warpSize.cu‎
Lines changed: 7 additions & 7 deletions b/‎clang/test/dpct/builtin_warpSize.cu‎
Lines changed: 7 additions & 7 deletions
diff --git a/‎clang/test/dpct/c_vcxproj_test/c_kernel.cu‎
Lines changed: 2 additions & 1 deletion b/‎clang/test/dpct/c_vcxproj_test/c_kernel.cu‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎clang/test/dpct/checkFormatAll.cu‎
Lines changed: 1 addition & 1 deletion b/‎clang/test/dpct/checkFormatAll.cu‎
Lines changed: 1 addition & 1 deletion
diff --git a/‎clang/test/dpct/checkFormatMigrated.cu‎
Lines changed: 18 additions & 18 deletions b/‎clang/test/dpct/checkFormatMigrated.cu‎
Lines changed: 18 additions & 18 deletions
@@ -3391,7 +3391,7 @@ MemVarMap::getItem<MemVarMap::DeclParameter>(ParameterStream &PS) const {
   }
 
   std::string ItemParamDecl =
-      MapNames::getClNamespace() + NDItem + " " + getItemName();
+      "const " + MapNames::getClNamespace() + NDItem + " &" + getItemName();
   return PS << ItemParamDecl;
 }
 
 
@@ -594,7 +594,7 @@ namespace experimental {
 /// a SYCL kernel can be scheduled actively at the same time on a device.
 template <int dimensions = 3>
 inline void
-nd_range_barrier(sycl::nd_item<dimensions> item,
+nd_range_barrier(const sycl::nd_item<dimensions> &item,
                  sycl::atomic_ref<
                      unsigned int, sycl::memory_order::seq_cst,
                      sycl::memory_scope::device,
@@ -634,7 +634,7 @@ nd_range_barrier(sycl::nd_item<dimensions> item,
 /// a SYCL kernel can be scheduled actively at the same time on a device.
 template <>
 inline void
-nd_range_barrier(sycl::nd_item<1> item,
+nd_range_barrier(const sycl::nd_item<1> &item,
                  sycl::atomic_ref<
                      unsigned int, sycl::memory_order::seq_cst,
                      sycl::memory_scope::device,
 
@@ -16,7 +16,8 @@
 #include "cuda_runtime.h"
 #include <stdio.h>
 
-// CHECK: void addKernel(int *c, const int *a, const int *b, sycl::nd_item<3> item_ct1)
+// CHECK: void addKernel(int *c, const int *a, const int *b,
+// CHECK-NEXT: const sycl::nd_item<3> &item_ct1)
 __global__ void addKernel(int *c, const int *a, const int *b)
 {
     // CHECK: int i = item_ct1.get_local_id(2);
 
@@ -138,7 +138,8 @@ int main() {
   InvokeKernel<double>();
 }
 
-// CHECK: void foo(sycl::nd_item<3> item_ct1, uint8_t *dpct_local, uint32_t &share_v) {
+// CHECK: void foo(const sycl::nd_item<3> &item_ct1, uint8_t *dpct_local,
+// CHECK-NEXT:         uint32_t &share_v) {
 // CHECK-NEXT:  auto share_array = (uint32_t *)dpct_local;
 // CHECK-NEXT:  for (int b = item_ct1.get_local_id(2); b < 64; b += item_ct1.get_local_range(2)) {
 // CHECK-NEXT:    dpct::atomic_fetch_add<uint32_t, sycl::access::address_space::generic_space>(&share_array[b], (uint32_t)1);
@@ -157,7 +158,8 @@ __shared__ uint32_t share_v;
   atomicAdd(&share_v, 1);
 }
 
-// CHECK:void foo_2(sycl::nd_item<3> item_ct1, uint8_t *dpct_local, uint32_t &share_v) {
+// CHECK: void foo_2(const sycl::nd_item<3> &item_ct1, uint8_t *dpct_local,
+// CHECK-NEXT:            uint32_t &share_v) {
 // CHECK-NEXT:  auto share_array = (uint32_t *)dpct_local;
 // CHECK-NEXT:  for (int b = item_ct1.get_local_id(2); b < 64; b += item_ct1.get_local_range(2)) {
 // CHECK-NEXT:    uint32_t *p_1 = &share_array[b];
@@ -451,7 +453,8 @@ __global__ void k() {
   atomicAdd(&f, f);
 }
 
-// CHECK: void mykernel(unsigned int *dev, sycl::nd_item<3> item_ct1, uint8_t *dpct_local) {
+// CHECK: void mykernel(unsigned int *dev, const sycl::nd_item<3> &item_ct1,
+// CHECK-NEXT:              uint8_t *dpct_local) {
 // CHECK-NEXT:  auto sm = (unsigned int *)dpct_local;
 // CHECK-NEXT:  unsigned int* as= (unsigned int*)sm;
 // CHECK-NEXT:  const int kc=item_ct1.get_local_id(2);
@@ -469,7 +472,8 @@ __global__ void mykernel(unsigned int *dev) {
 }
 
 // CHECK: void mykernel_1(unsigned char *buffer, long size,
-// CHECK-NEXT:                             unsigned int *histo, sycl::nd_item<3> item_ct1,
+// CHECK-NEXT:                             unsigned int *histo,
+// CHECK-NEXT:                             const sycl::nd_item<3> &item_ct1,
 // CHECK-NEXT:                             unsigned int *temp) {
 // CHECK-EMPTY:
 // CHECK-NEXT:  temp[item_ct1.get_local_id(2)] = 0;
@@ -546,7 +550,7 @@ __device__ void __gpu_sync(int blocks_to_synch) {
   while(g_mutex < blocks_to_synch);
 }
 
-//CHECK:void atomicInc_foo(sycl::nd_item<3> item_ct1, uint8_t *dpct_local,
+//CHECK:void atomicInc_foo(const sycl::nd_item<3> &item_ct1, uint8_t *dpct_local,
 //CHECK-NEXT:                   unsigned int &share_v) {
 //CHECK-NEXT:  auto share_array = (unsigned int *)dpct_local;
 //CHECK-NEXT:  for (int b = item_ct1.get_local_id(2); b < 64; b += item_ct1.get_local_range(2)) {
 
@@ -138,7 +138,8 @@ int main() {
   InvokeKernel<double>();
 }
 
-// CHECK: void foo(sycl::nd_item<3> item_ct1, uint8_t *dpct_local, uint32_t &share_v) {
+// CHECK:void foo(const sycl::nd_item<3> &item_ct1, uint8_t *dpct_local,
+// CHECK-NEXT:         uint32_t &share_v) {
 // CHECK-NEXT:  auto share_array = (uint32_t *)dpct_local;
 // CHECK-NEXT:  for (int b = item_ct1.get_local_id(2); b < 64; b += item_ct1.get_local_range(2)) {
 // CHECK-NEXT:    dpct::atomic_fetch_add<uint32_t, sycl::access::address_space::local_space>(&share_array[b], (uint32_t)1);
@@ -157,7 +158,8 @@ __shared__ uint32_t share_v;
   atomicAdd(&share_v, 1);
 }
 
-// CHECK:void foo_2(sycl::nd_item<3> item_ct1, uint8_t *dpct_local, uint32_t &share_v) {
+// CHECK: void foo_2(const sycl::nd_item<3> &item_ct1, uint8_t *dpct_local,
+// CHECK-NEXT:            uint32_t &share_v) {
 // CHECK-NEXT:  auto share_array = (uint32_t *)dpct_local;
 // CHECK-NEXT:  for (int b = item_ct1.get_local_id(2); b < 64; b += item_ct1.get_local_range(2)) {
 // CHECK-NEXT:    uint32_t *p_1 = &share_array[b];
@@ -457,7 +459,8 @@ __global__ void k() {
   atomicAdd(&f, f);
 }
 
-// CHECK: void mykernel(unsigned int *dev, sycl::nd_item<3> item_ct1, uint8_t *dpct_local) {
+// CHECK: void mykernel(unsigned int *dev, const sycl::nd_item<3> &item_ct1,
+// CHECK-NEXT: uint8_t *dpct_local) {
 // CHECK-NEXT:  auto sm = (unsigned int *)dpct_local;
 // CHECK-NEXT:  unsigned int* as= (unsigned int*)sm;
 // CHECK-NEXT:  const int kc=item_ct1.get_local_id(2);
@@ -475,7 +478,8 @@ __global__ void mykernel(unsigned int *dev) {
 }
 
 // CHECK: void mykernel_1(unsigned char *buffer, long size,
-// CHECK-NEXT:                             unsigned int *histo, sycl::nd_item<3> item_ct1,
+// CHECK-NEXT:                             unsigned int *histo, 
+// CHECK-NEXT:                             const sycl::nd_item<3> &item_ct1,
 // CHECK-NEXT:                             unsigned int *temp) {
 // CHECK-EMPTY:
 // CHECK-NEXT:  temp[item_ct1.get_local_id(2)] = 0;
 
@@ -23,7 +23,8 @@
 #include "cuda_runtime.h"
 #include <stdio.h>
 
-// CHECK: void addKernel(int *c, const int *a, const int *b, sycl::nd_item<3> item_ct1)
+// CHECK: void addKernel(int *c, const int *a, const int *b,
+// CHECK-NEXT: const sycl::nd_item<3> &item_ct1)
 __global__ void addKernel(int *c, const int *a, const int *b)
 {
     // CHECK: int i = item_ct1.get_local_id(2);
 
@@ -17,7 +17,7 @@ __global__ void foo(){
   int c= warpSize;
 }
 
-// CHECK: void bar(sycl::nd_item<3> item_ct1){
+// CHECK: void bar(const sycl::nd_item<3> &item_ct1){
 // CHECK-NEXT:   int a = sycl::max((int)item_ct1.get_sub_group().get_local_range().get(0), 0);
 // CHECK-NEXT:   int warpSize = 1;
 // CHECK-NEXT:   int b = sycl::max(warpSize, 0);
@@ -28,7 +28,7 @@ __global__ void bar(){
   int b = max(warpSize, 0);
 }
 
-// CHECK: int tensorPos(const int ct, sycl::nd_item<3> item_ct1, int numLane = 0) {
+// CHECK: int tensorPos(const int ct, const sycl::nd_item<3> &item_ct1, int numLane = 0) {
 // CHECK-NEXT:   if (!numLane) numLane = item_ct1.get_sub_group().get_local_range().get(0);
 // CHECK-NEXT:   int r = ct * numLane;
 // CHECK-NEXT:   return r;
@@ -38,17 +38,17 @@ __device__ int tensorPos(const int ct, const int numLane = warpSize) {
   return r;
 }
 
-// CHECK: int tensorPos(const int ct, sycl::nd_item<3> item_ct1, int numLane);
+// CHECK: int tensorPos(const int ct, const sycl::nd_item<3> &item_ct1, int numLane);
 __device__ int tensorPos(const int ct, const int numLane);
 
 
 
 
 
-// CHECK: int tensorPos2(const int ct, sycl::nd_item<3> item_ct1, int numLane);
+// CHECK: int tensorPos2(const int ct, const sycl::nd_item<3> &item_ct1, int numLane);
 __device__ int tensorPos2(const int ct, const int numLane);
 
-// CHECK: int tensorPos2(const int ct, sycl::nd_item<3> item_ct1, int numLane) {
+// CHECK: int tensorPos2(const int ct, const sycl::nd_item<3> &item_ct1, int numLane) {
 // CHECK-NEXT:   if (!numLane) numLane = item_ct1.get_sub_group().get_local_range().get(0);
 // CHECK-NEXT:   int r = ct * numLane;
 // CHECK-NEXT:   return r;
@@ -58,9 +58,9 @@ __device__ int tensorPos2(const int ct, const int numLane) {
   return r;
 }
 
-// CHECK: int tensorPos2(const int ct, sycl::nd_item<3> item_ct1, int numLane = 0);
+// CHECK: int tensorPos2(const int ct, const sycl::nd_item<3> &item_ct1, int numLane = 0);
 __device__ int tensorPos2(const int ct, const int numLane = warpSize);
 
 
-// CHECK: int tensorPos3(const int ct, sycl::nd_item<3> item_ct1, int numLane = 0) {}
+// CHECK: int tensorPos3(const int ct, const sycl::nd_item<3> &item_ct1, int numLane = 0) {}
 __device__ int tensorPos3(const int ct, const int numLane = warpSize) {}
@@ -17,7 +17,8 @@
 #include "cuda_runtime.h"
 #include <stdio.h>
 
-// CHECK: void addKernel(int *c, const int *a, const int *b, sycl::nd_item<3> item_ct1)
+// CHECK: void addKernel(int *c, const int *a, const int *b,
+// CHECK-NEXT: const sycl::nd_item<3> &item_ct1)
 __global__ void addKernel(int *c, const int *a, const int *b)
 {
     // CHECK: int i = item_ct1.get_local_id(2);
 
@@ -17,7 +17,7 @@ __device__ void testDevice(const int *K) {
 __device__ void testDevice1(const int *K) { int t = K[0]; }
 
      //CHECK:void testKernelPtr(const int *L, const int *M, int N,
-//CHECK-NEXT:                   sycl::nd_item<3> item_ct1) {
+//CHECK-NEXT:                   const sycl::nd_item<3> &item_ct1) {
 //CHECK-NEXT:  testDevice(L);
 //CHECK-NEXT:  int gtid = item_ct1.get_group(2) * item_ct1.get_local_range(2) +
 //CHECK-NEXT:             item_ct1.get_local_id(2);
 
@@ -18,8 +18,8 @@ __device__ void testDevice(const int *K) {
      //CHECK:void testDevice1(const int *K) { int t = K[0]; }
 __device__ void testDevice1(const int *K) { int t = K[0]; }
 
-     //CHECK:void testKernelPtr(const int *L, const int *M, int N,
-//CHECK-NEXT:                   cl::sycl::nd_item<3> item_ct1) {
+//CHECK:void testKernelPtr(const int *L, const int *M, int N,
+//CHECK-NEXT:                   const cl::sycl::nd_item<3> &item_ct1) {
 //CHECK-NEXT:  testDevice(L);
 //CHECK-NEXT:  int gtid = item_ct1.get_group(2) * item_ct1.get_local_range(2) +
 //CHECK-NEXT:             item_ct1.get_local_id(2);
@@ -107,8 +107,8 @@ typedef struct
 //CHECK-NEXT:                                 const float g_ewald, const float qqrd2e,
 //CHECK-NEXT:                                 const float denom_lj_inv,
 //CHECK-NEXT:                                 const int loop_trip,
-//CHECK-NEXT:                                 cl::sycl::nd_item<3> item_ct1, float *sp_lj,
-//CHECK-NEXT:                                 float *sp_coul, int *ljd,
+//CHECK-NEXT:                                 const cl::sycl::nd_item<3> &item_ct1,
+//CHECK-NEXT:                                 float *sp_lj, float *sp_coul, int *ljd,
 //CHECK-NEXT:                                 cl::sycl::local_accessor<double, 2> la) {
 template <int EFLAG>
 __global__ void k_mdppp_outer_nn(const int * __restrict__ pos,
@@ -152,7 +152,7 @@ void test() {
 
 
 
-     //CHECK:void k_mdppp_outer_n0(cl::sycl::nd_item<3> item_ct1, float *sp_lj,
+     //CHECK:void k_mdppp_outer_n0(const cl::sycl::nd_item<3> &item_ct1, float *sp_lj,
 //CHECK-NEXT:                      float *sp_coul, int *ljd,
 //CHECK-NEXT:                      cl::sycl::local_accessor<double, 2> la) {
 __global__ void k_mdppp_outer_n0() {
@@ -164,7 +164,7 @@ __global__ void k_mdppp_outer_n0() {
 }
 
      //CHECK:void k_mdppp_outer_n1(const int * __restrict__ pos,
-//CHECK-NEXT:                      cl::sycl::nd_item<3> item_ct1, float *sp_lj,
+//CHECK-NEXT:                      const cl::sycl::nd_item<3> &item_ct1, float *sp_lj,
 //CHECK-NEXT:                      float *sp_coul, int *ljd,
 //CHECK-NEXT:                      cl::sycl::local_accessor<double, 2> la) {
 __global__ void k_mdppp_outer_n1(const int * __restrict__ pos) {
@@ -177,7 +177,7 @@ __global__ void k_mdppp_outer_n1(const int * __restrict__ pos) {
 
      //CHECK:void k_mdppp_outer_22(const int * __restrict__ pos,
 //CHECK-NEXT:                                 const float * __restrict__ q,
-//CHECK-NEXT:                                 cl::sycl::nd_item<3> item_ct1,
+//CHECK-NEXT:                                 const cl::sycl::nd_item<3> &item_ct1,
 //CHECK-NEXT:                                 float *sp_lj,
 //CHECK-NEXT:                                 float *sp_coul,
 //CHECK-NEXT:                                 int *ljd,
@@ -193,7 +193,7 @@ __global__ void k_mdppp_outer_22(const int * __restrict__ pos,
 
 
      //CHECK:void k_mdppp_outer_n2(const int * __restrict__ pos, const float * __restrict__ q,
-//CHECK-NEXT:                      cl::sycl::nd_item<3> item_ct1, float *sp_lj,
+//CHECK-NEXT:                      const cl::sycl::nd_item<3> &item_ct1, float *sp_lj,
 //CHECK-NEXT:                      float *sp_coul, int *ljd,
 //CHECK-NEXT:                      cl::sycl::local_accessor<double, 2> la) {
 void __device__ k_mdppp_outer_n2(const int * __restrict__ pos, const float * __restrict__ q) {
@@ -207,7 +207,7 @@ void __device__ k_mdppp_outer_n2(const int * __restrict__ pos, const float * __r
 
 
      //CHECK:void k_mdppp_outer_n3(const int * __restrict__ pos, const float * __restrict__ q,
-//CHECK-NEXT:                      cl::sycl::nd_item<3> item_ct1, float *sp_lj,
+//CHECK-NEXT:                      const cl::sycl::nd_item<3> &item_ct1, float *sp_lj,
 //CHECK-NEXT:                      float *sp_coul, int *ljd,
 //CHECK-NEXT:                      cl::sycl::local_accessor<double, 2> la) {
 __device__
@@ -222,8 +222,8 @@ void k_mdppp_outer_n3(const int * __restrict__ pos, const float * __restrict__ q
 #define AAA const int * __restrict__ pos
 #define BBB const float * __restrict__ q
 
-     //CHECK:void foo1(AAA, BBB, cl::sycl::nd_item<3> item_ct1, float *sp_lj, float *sp_coul,
-//CHECK-NEXT:          int *ljd, cl::sycl::local_accessor<double, 2> la) {
+     //CHECK:void foo1(AAA, BBB, const cl::sycl::nd_item<3> &item_ct1, float *sp_lj,
+//CHECK-NEXT:          float *sp_coul, int *ljd, cl::sycl::local_accessor<double, 2> la) {
 __device__ void foo1(AAA, BBB) {
   __shared__ float sp_lj[4];
   __shared__ float sp_coul[4];
@@ -232,9 +232,9 @@ __device__ void foo1(AAA, BBB) {
   const int tid = threadIdx.x;
 }
 
-     //CHECK:void foo2(const int * __restrict__ pos, BBB, cl::sycl::nd_item<3> item_ct1,
-//CHECK-NEXT:          float *sp_lj, float *sp_coul, int *ljd,
-//CHECK-NEXT:          cl::sycl::local_accessor<double, 2> la) {
+     //CHECK:void foo2(const int * __restrict__ pos, BBB,
+//CHECK-NEXT:          const cl::sycl::nd_item<3> &item_ct1, float *sp_lj, float *sp_coul,
+//CHECK-NEXT:          int *ljd, cl::sycl::local_accessor<double, 2> la) {
 __device__ void foo2(const int * __restrict__ pos, BBB) {
   __shared__ float sp_lj[4];
   __shared__ float sp_coul[4];
@@ -243,9 +243,9 @@ __device__ void foo2(const int * __restrict__ pos, BBB) {
   const int tid = threadIdx.x;
 }
 
-     //CHECK:void foo3(AAA, const float * __restrict__ q, cl::sycl::nd_item<3> item_ct1,
-//CHECK-NEXT:          float *sp_lj, float *sp_coul, int *ljd,
-//CHECK-NEXT:          cl::sycl::local_accessor<double, 2> la) {
+     //CHECK:void foo3(AAA, const float * __restrict__ q,
+//CHECK-NEXT:          const cl::sycl::nd_item<3> &item_ct1, float *sp_lj, float *sp_coul,
+//CHECK-NEXT:          int *ljd, cl::sycl::local_accessor<double, 2> la) {
 __device__ void foo3(AAA, const float * __restrict__ q) {
   __shared__ float sp_lj[4];
   __shared__ float sp_coul[4];
@@ -254,7 +254,7 @@ __device__ void foo3(AAA, const float * __restrict__ q) {
   const int tid = threadIdx.x;
 }
 
-//CHECK:#define FFFFF(aaa,bbb) void foo4(const int * __restrict__ aaa, const float * __restrict__ bbb, cl::sycl::nd_item<3> item_ct1, float *sp_lj, float *sp_coul, int *ljd, cl::sycl::local_accessor<double, 2> la)
+//CHECK:#define FFFFF(aaa,bbb) void foo4(const int * __restrict__ aaa, const float * __restrict__ bbb, const cl::sycl::nd_item<3> &item_ct1, float *sp_lj, float *sp_coul, int *ljd, cl::sycl::local_accessor<double, 2> la)
 #define FFFFF(aaa,bbb) __device__ void foo4(const int * __restrict__ aaa, const float * __restrict__ bbb)
 
 FFFFF(pos, q)
Original file line number	Diff line number	Diff line change
`@@ -3391,7 +3391,7 @@ MemVarMap::getItem<MemVarMap::DeclParameter>(ParameterStream &PS) const {`
`3391`	`3391`	`}`
`3392`	`3392`
`3393`	`3393`	`std::string ItemParamDecl =`
`3394`		`- MapNames::getClNamespace() + NDItem + " " + getItemName();`
	`3394`	`+ "const " + MapNames::getClNamespace() + NDItem + " &" + getItemName();`
`3395`	`3395`	`return PS << ItemParamDecl;`
`3396`	`3396`	`}`
`3397`	`3397`
Original file line number	Diff line number	Diff line change
`@@ -16,7 +16,8 @@`
`16`	`16`	`#include "cuda_runtime.h"`
`17`	`17`	`#include <stdio.h>`
`18`	`18`
`19`		`-// CHECK: void addKernel(int c, const int a, const int *b, sycl::nd_item<3> item_ct1)`
	`19`	`+// CHECK: void addKernel(int c, const int a, const int *b,`
	`20`	`+// CHECK-NEXT: const sycl::nd_item<3> &item_ct1)`
`20`	`21`	`__global__ void addKernel(int c, const int a, const int *b)`
`21`	`22`	`{`
`22`	`23`	`// CHECK: int i = item_ct1.get_local_id(2);`
Original file line number	Diff line number	Diff line change
`@@ -23,7 +23,8 @@`
`23`	`23`	`#include "cuda_runtime.h"`
`24`	`24`	`#include <stdio.h>`
`25`	`25`
`26`		`-// CHECK: void addKernel(int c, const int a, const int *b, sycl::nd_item<3> item_ct1)`
	`26`	`+// CHECK: void addKernel(int c, const int a, const int *b,`
	`27`	`+// CHECK-NEXT: const sycl::nd_item<3> &item_ct1)`
`27`	`28`	`__global__ void addKernel(int c, const int a, const int *b)`
`28`	`29`	`{`
`29`	`30`	`// CHECK: int i = item_ct1.get_local_id(2);`
Original file line number	Diff line number	Diff line change
`@@ -17,7 +17,8 @@`
`17`	`17`	`#include "cuda_runtime.h"`
`18`	`18`	`#include <stdio.h>`
`19`	`19`
`20`		`-// CHECK: void addKernel(int c, const int a, const int *b, sycl::nd_item<3> item_ct1)`
	`20`	`+// CHECK: void addKernel(int c, const int a, const int *b,`
	`21`	`+// CHECK-NEXT: const sycl::nd_item<3> &item_ct1)`
`21`	`22`	`__global__ void addKernel(int c, const int a, const int *b)`
`22`	`23`	`{`
`23`	`24`	`// CHECK: int i = item_ct1.get_local_id(2);`