GitHub

Prerequsites

PyTorch
NVCC >= 11.3

Installation

git submodule update
cd csrc/cutlass && git checkout v3.1.0
cd ../.. && python setup.py install

Quick Start

import torch
from cutlass_flash_attention import FlashMultiHeadAttention

BATCH, N_HEADS, N_CTX, D_HEAD = 8, 32, 1024, 64
dtype = torch.float32
device = 'cuda'

q = torch.randn((BATCH, N_CTX, N_HEADS, D_HEAD), dtype=dtype, device=device, requires_grad=True)
k = torch.randn((BATCH, N_CTX, N_HEADS, D_HEAD), dtype=dtype, device=device, requires_grad=True)
v = torch.randn((BATCH, N_CTX, N_HEADS, D_HEAD), dtype=dtype, device=device, requires_grad=True)
scale = D_HEAD ** -0.5

fmha = FlashMultiHeadAttention()

o = cutlass_fmha(q, k, v, scale)

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
csrc		csrc
naive_flash_attention		naive_flash_attention
README.md		README.md
setup.py		setup.py
test.py		test.py
tmp.py		tmp.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Prerequsites

Installation

Quick Start

About

Releases

Packages

Languages

Starmys/NaiveFlashAttention

Folders and files

Latest commit

History

Repository files navigation

Prerequsites

Installation

Quick Start

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages