Hugging Face Transformer Deployment Tutorial #49

fpetrini15 · 2023-09-22T20:05:53Z

Tutorials to show how hugging face transformers can be quickly deployed in Triton.

Quick_Deploy/HuggingFaceTransformers/base_text_classification_model.py

Quick_Deploy/HuggingFaceTransformers/build_server.py

Quick_Deploy/HuggingFaceTransformers/base_text_generation_model.py

… add README, restructure repo

Quick_Deploy/HuggingFaceTransformers/create_repository.py

Quick_Deploy/HuggingFaceTransformers/text_generation/config.pbtxt

Quick_Deploy/HuggingFaceTransformers/README.md

…er-tutorials

fpetrini15 · 2023-10-03T19:36:03Z

All generation scripts were removed and replaced with static files. This new tutorial covers deploying falcon7b, persimmon-8b, and mistral 7b. Down the road, these models may get there own READMEs in a "Popular Models Guide" folder cc @jbkyang-nvi.

Quick_Deploy/HuggingFaceTransformers/README.md

Quick_Deploy/HuggingFaceTransformers/Dockerfile

Quick_Deploy/HuggingFaceTransformers/README.md

rmccorm4

Great tutorial overall! Only minor comments 🚀

Quick_Deploy/HuggingFaceTransformers/falcon7b/1/model.py

…er-tutorials

fpetrini15 · 2023-10-06T16:49:43Z

@nnshah1. I preemptively removed Mistral from the tutorial. I can always revert if necessary.

…er-tutorials

fpetrini15 · 2023-10-15T23:59:11Z

Incorporated some feedback from Dora incorporating how to gather performance metrics, load cached models, and adding comments.

Quick_Deploy/HuggingFaceTransformers/persimmon8b/1/model.py

Quick_Deploy/HuggingFaceTransformers/falcon7b/1/model.py

Quick_Deploy/HuggingFaceTransformers/persimmon8b/config.pbtxt

Quick_Deploy/HuggingFaceTransformers/falcon7b/config.pbtxt

Quick_Deploy/HuggingFaceTransformers/README.md

Quick_Deploy/HuggingFaceTransformers/falcon7b/config.pbtxt

Quick_Deploy/HuggingFaceTransformers/README.md

fpetrini15 · 2023-10-20T20:44:43Z

CC @nv-braf @matthewkotila in case there is any feedback regarding the PA/MA section.

Quick_Deploy/HuggingFaceTransformers/falcon7b/1/model.py

matthewkotila · 2023-10-23T18:34:23Z

PA stuff LGTM 👍

fpetrini15 added 2 commits September 22, 2023 13:00

Initial Commit

4c40127

Mount model repo so changes reflect, parameter tweaking, README file

ce7145b

fpetrini15 requested review from rmccorm4, tanmayv25 and nnshah1 September 22, 2023 23:51

Image name error

b89387b

nnshah1 reviewed Sep 23, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/base_text_classification_model.py Outdated Show resolved Hide resolved

nnshah1 reviewed Sep 23, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/base_text_classification_model.py Outdated Show resolved Hide resolved

nnshah1 reviewed Sep 23, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/build_server.py Outdated Show resolved Hide resolved

nnshah1 reviewed Sep 23, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/base_text_generation_model.py Outdated Show resolved Hide resolved

Incorporating review comments. Separate docker and model repo builds,…

c5b34d7

… add README, restructure repo

rmccorm4 reviewed Sep 27, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/create_repository.py Outdated Show resolved Hide resolved

rmccorm4 reviewed Sep 27, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/text_generation/config.pbtxt Outdated Show resolved Hide resolved

rmccorm4 reviewed Sep 27, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/text_generation/config.pbtxt Outdated Show resolved Hide resolved

yeahdongcn reviewed Sep 28, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Show resolved Hide resolved

nnshah1 reviewed Sep 28, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Outdated Show resolved Hide resolved

fpetrini15 added 5 commits September 29, 2023 16:35

Merge remote-tracking branch 'origin/main' into fpetrini-hf-transform…

7173dc8

…er-tutorials

Tutorial restructuring. Using static model configurations

28fb995

Merge remote-tracking branch 'origin/main' into fpetrini-hf-transform…

db04d14

…er-tutorials

Bump triton container and update README

266df4e

Remove client script

922a29c

fpetrini15 requested review from nnshah1 and rmccorm4 October 3, 2023 19:36

rmccorm4 reviewed Oct 3, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Outdated Show resolved Hide resolved

rmccorm4 reviewed Oct 3, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/Dockerfile Outdated Show resolved Hide resolved

rmccorm4 reviewed Oct 3, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Outdated Show resolved Hide resolved

rmccorm4 reviewed Oct 3, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Outdated Show resolved Hide resolved

rmccorm4 reviewed Oct 3, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Outdated Show resolved Hide resolved

rmccorm4 reviewed Oct 3, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Outdated Show resolved Hide resolved

rmccorm4 reviewed Oct 3, 2023

View reviewed changes

fpetrini15 added 2 commits October 3, 2023 17:13

Incorporating review comments

b1b0b28

Modify WIP line in vLLM tutorial

d96cf9e

rmccorm4 reviewed Oct 4, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/falcon7b/1/model.py Outdated Show resolved Hide resolved

fpetrini15 added 3 commits October 4, 2023 11:14

Remove trust_remote_code parameter from falcon model

20d027d

Merge remote-tracking branch 'origin/main' into fpetrini-hf-transform…

8a26eb4

…er-tutorials

Removing Mistral

9e16029

fpetrini15 added 2 commits October 15, 2023 16:56

Merge remote-tracking branch 'origin/main' into fpetrini-hf-transform…

dc3de39

…er-tutorials

Incorporating Feedback

b68af63

github-advanced-security bot found potential problems Oct 16, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/persimmon8b/1/model.py Fixed Show fixed Hide fixed

Quick_Deploy/HuggingFaceTransformers/falcon7b/1/model.py Fixed Show fixed Hide fixed

nnshah1 reviewed Oct 16, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/persimmon8b/config.pbtxt Outdated Show resolved Hide resolved

nnshah1 reviewed Oct 16, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/falcon7b/config.pbtxt Outdated Show resolved Hide resolved

fpetrini15 added 2 commits October 16, 2023 09:53

Change input/output names

09b0ee2

Pre-commit format

036955c

rmccorm4 reviewed Oct 16, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Outdated Show resolved Hide resolved

rmccorm4 reviewed Oct 16, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/falcon7b/config.pbtxt Outdated Show resolved Hide resolved

Different perf_analyzer example, config file format fixes

d02698a

rmccorm4 reviewed Oct 17, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Show resolved Hide resolved

rmccorm4 reviewed Oct 17, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Outdated Show resolved Hide resolved

rmccorm4 reviewed Oct 17, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/README.md Outdated Show resolved Hide resolved

Deep dive changes to Triton tools section

9e86af0

github-advanced-security bot found potential problems Oct 20, 2023

View reviewed changes

Quick_Deploy/HuggingFaceTransformers/falcon7b/1/model.py Fixed Show fixed Hide fixed

Remove unused variable

1a0d05d

jbkyang-nvi approved these changes Oct 24, 2023

View reviewed changes

tanmayv25 merged commit de7da4a into main Oct 24, 2023
3 checks passed

fpetrini15 deleted the fpetrini-hf-transformer-tutorials branch October 24, 2023 00:50

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Hugging Face Transformer Deployment Tutorial #49

Hugging Face Transformer Deployment Tutorial #49

fpetrini15 commented Sep 22, 2023

fpetrini15 commented Oct 3, 2023

rmccorm4 left a comment

fpetrini15 commented Oct 6, 2023

fpetrini15 commented Oct 15, 2023

fpetrini15 commented Oct 20, 2023

matthewkotila commented Oct 23, 2023

Hugging Face Transformer Deployment Tutorial #49

Hugging Face Transformer Deployment Tutorial #49

Conversation

fpetrini15 commented Sep 22, 2023

fpetrini15 commented Oct 3, 2023

rmccorm4 left a comment

Choose a reason for hiding this comment

fpetrini15 commented Oct 6, 2023

fpetrini15 commented Oct 15, 2023

fpetrini15 commented Oct 20, 2023

matthewkotila commented Oct 23, 2023