GEMM: support 2d grouped scales #4478

kealan-barbieri · 2025-12-22T23:55:15Z

Description

Enable scales with non-trivial M/N group dim in existing scales use cases. Fix for improper bf16 special path usage.

Fixes # MFDNN-14021

Checklist

General

Do all unit and benchdnn tests (make test and make test_benchdnn_*) pass locally for each commit?
Have you formatted the code using clang-format?

src/gpu/intel/gemm/jit.hpp

src/gpu/intel/matmul/ref.cpp

tests/benchdnn/inputs/matmul/shapes_scale_2d

kealan-barbieri · 2026-01-06T01:52:38Z

make test
set test_scope=NIGHTLY
disable benchdnn_all
enable benchdnn_matmul
enable arch_gpu_xe-hpc
enable arch_gpu_xe-hpg-atsm
enable arch_gpu_xe-hpg-dg2
enable arch_gpu_xe-lp
enable arch_gpu_xe-lpg
enable arch_gpu_xe-lpg+
enable arch_gpu_xe2-hpg-bmg
enable arch_gpu_xe2-lpg
enable arch_gpu_xe3-lpg

kealan-barbieri · 2026-01-06T23:52:49Z

make test
set test_scope=NIGHTLY
disable benchdnn_all
enable benchdnn_matmul
enable arch_gpu_xe-hpc
enable arch_gpu_xe-hpg-atsm
enable arch_gpu_xe-hpg-dg2
enable arch_gpu_xe-lp
enable arch_gpu_xe-lpg
enable arch_gpu_xe-lpg+
enable arch_gpu_xe2-hpg-bmg
enable arch_gpu_xe2-lpg
enable arch_gpu_xe3-lpg

src/gpu/intel/gemm/jit.hpp

src/gpu/intel/gemm/jit/generator/pieces/state.hpp

src/gpu/intel/gemm/jit/generator/pieces/quantization.cxx

src/gpu/intel/gemm/jit/pd.cpp

src/gpu/intel/gemm/jit/generator/pieces/state.hpp

src/gpu/intel/matmul/gemm.hpp

kealan-barbieri · 2026-01-08T17:17:23Z

make test
set test_scope=NIGHTLY
disable benchdnn_all
enable benchdnn_matmul
enable arch_gpu_xe-hpc
enable arch_gpu_xe-hpg-atsm
enable arch_gpu_xe-hpg-dg2
enable arch_gpu_xe-lp
enable arch_gpu_xe-lpg
enable arch_gpu_xe-lpg+
enable arch_gpu_xe2-hpg-bmg
enable arch_gpu_xe2-lpg
enable arch_gpu_xe3-lpg

dzarukin · 2026-01-08T20:15:14Z

tests/benchdnn/inputs/matmul/shapes_2d_attr

+2x2048x256:2x256x128_n"NCF:1*1"
+2x2048x128:1x128x128_n"NCF:2*1"
+2x896x1024:2x1024x4096_n"RNN-T:Encoder_cell1_Hidden*11"
+2x896x320:1x320x1280_n"RNN-T:Prediction_Input*12"


320 doesn't divide by 128 to the best of my knowledge. Does benchdnn skip as invalid or as unimplemented?

it skips as invalid, will drop the case just to reduce noise.

kealan-barbieri requested review from a team as code owners December 22, 2025 23:55

github-actions bot added platform:gpu-intel Codeowner: @oneapi-src/onednn-gpu-intel component:tests Codeowner: @oneapi-src/onednn-arch component:common labels Dec 22, 2025

dzarukin reviewed Jan 5, 2026

View reviewed changes

src/gpu/intel/gemm/jit.hpp Outdated Show resolved Hide resolved

src/gpu/intel/matmul/ref.cpp Outdated Show resolved Hide resolved

tests/benchdnn/inputs/matmul/shapes_scale_2d Show resolved Hide resolved

kealan-barbieri force-pushed the kealanba/double_block branch from 4cd1dcc to e124c19 Compare January 6, 2026 00:20

kealan-barbieri force-pushed the kealanba/double_block branch from e124c19 to f406547 Compare January 6, 2026 23:48

Simonsays095 reviewed Jan 7, 2026

View reviewed changes

kealan-barbieri force-pushed the kealanba/double_block branch 5 times, most recently from 960a50e to a165b12 Compare January 8, 2026 01:15

Simonsays095 approved these changes Jan 8, 2026

View reviewed changes

src/gpu/intel/gemm/jit/generator/pieces/state.hpp Outdated Show resolved Hide resolved

src/gpu/intel/matmul/gemm.hpp Show resolved Hide resolved

kealan-barbieri added 4 commits January 8, 2026 09:22

xe: gemm: jit: add m,n group dims, refactor swap

ef53ad7

src: common: enable gemm scaling with m group

0a41f9d

xe: matmul: fix ref m group scaling

a6b2ace

xe: gemm: jit: enable multiple group dims

bc88609

kealan-barbieri force-pushed the kealanba/double_block branch from a165b12 to cf96d81 Compare January 8, 2026 17:22

dzarukin approved these changes Jan 8, 2026

View reviewed changes

kealan-barbieri added 3 commits January 8, 2026 13:47

tests: benchdnn: inputs: matmul: 2d group scale cases

fe651c5

xe: gemm: jit: lower default attr checks

37dc593

xe: gemm: jit: disable reshape with grouped src scale

105cbc3

kealan-barbieri force-pushed the kealanba/double_block branch from cf96d81 to 105cbc3 Compare January 8, 2026 21:48

kealan-barbieri merged commit a10ac3a into main Jan 8, 2026
25 of 30 checks passed

kealan-barbieri deleted the kealanba/double_block branch January 8, 2026 22:12

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

GEMM: support 2d grouped scales #4478

GEMM: support 2d grouped scales #4478

Uh oh!

kealan-barbieri commented Dec 22, 2025 •

edited

Loading

Uh oh!

Uh oh!

Uh oh!

Uh oh!

kealan-barbieri commented Jan 6, 2026

Uh oh!

kealan-barbieri commented Jan 6, 2026

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

kealan-barbieri commented Jan 8, 2026

Uh oh!

dzarukin Jan 8, 2026

Uh oh!

kealan-barbieri Jan 8, 2026

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

GEMM: support 2d grouped scales #4478

GEMM: support 2d grouped scales #4478

Uh oh!

Conversation

kealan-barbieri commented Dec 22, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Description

Checklist

General

Uh oh!

Uh oh!

Uh oh!

Uh oh!

kealan-barbieri commented Jan 6, 2026

Uh oh!

kealan-barbieri commented Jan 6, 2026

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

Uh oh!

kealan-barbieri commented Jan 8, 2026

Uh oh!

dzarukin Jan 8, 2026

Choose a reason for hiding this comment

Uh oh!

kealan-barbieri Jan 8, 2026

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

kealan-barbieri commented Dec 22, 2025 •

edited

Loading