Extracting features for HLS kernels using CodeBERT

This repo uses CodeBERT, a multi-programming-lingual model pre-trained on NL-PL pairs in 6 programming languages, in order to extract features from HLS kernels. The features are then visualized with dimensionality reduction methods and clustered in order to gain insights on the similarity of their execution.

Motivation and results

See the presentation in NLP_for_HLS.pdf.

Data

See dataset folder.

Dependencies

See requirements.txt. Optional: CUDA support for torch.

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
dataset		dataset
images		images
.gitignore		.gitignore
NLP_for_HLS.pdf		NLP_for_HLS.pdf
README.md		README.md
clusters.txt		clusters.txt
clusters_original.txt		clusters_original.txt
data.py		data.py
main.py		main.py
requirements.txt		requirements.txt
visualize.py		visualize.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Extracting features for HLS kernels using CodeBERT

Motivation and results

Data

Dependencies

About

Releases

Packages

Languages

g-milis/NLP-for-HLS

Folders and files

Latest commit

History

Repository files navigation

Extracting features for HLS kernels using CodeBERT

Motivation and results

Data

Dependencies

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages