Remove enforce-eager to enable HPU graphs for better vLLM perf #954

wangkl2 · 2024-11-28T08:42:03Z

Description

Following opea-project/GenAIExamples#1210, remove the --enforce-eager flag for vllm-gaudi service, to enable HPU graphs optimization as default. It will improve both OOB latency and OOB throughput on Gaudi SW 1.18.

Type of change

Others (enhancement, documentation, validation, etc.)

Signed-off-by: Wang, Kai Lawrence <kai.lawrence.wang@intel.com>

…project#954) * remove enforce-eager to enable HPU graphs Signed-off-by: Wang, Kai Lawrence <kai.lawrence.wang@intel.com> * Increase the llm max timeout in ci for fully warmup Signed-off-by: Wang, Kai Lawrence <kai.lawrence.wang@intel.com> --------- Signed-off-by: Wang, Kai Lawrence <kai.lawrence.wang@intel.com>

remove enforce-eager to enable HPU graphs

6ab8cc7

Signed-off-by: Wang, Kai Lawrence <kai.lawrence.wang@intel.com>

wangkl2 requested a review from lvliang-intel as a code owner November 28, 2024 08:42

wangkl2 requested a review from XinyaoWa November 28, 2024 08:46

XinyaoWa approved these changes Nov 28, 2024

View reviewed changes

wangkl2 and others added 3 commits December 9, 2024 10:42

Merge branch 'main' into update-vllm-gaudi

9f4ee4e

Merge branch 'opea-project:main' into update-vllm-gaudi

b50e834

Increase the llm max timeout in ci for fully warmup

3828ff8

Signed-off-by: Wang, Kai Lawrence <kai.lawrence.wang@intel.com>

lvliang-intel approved these changes Dec 10, 2024

View reviewed changes

lvliang-intel merged commit ddd372d into opea-project:main Dec 10, 2024
12 checks passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Remove enforce-eager to enable HPU graphs for better vLLM perf #954

Remove enforce-eager to enable HPU graphs for better vLLM perf #954

Uh oh!

wangkl2 commented Nov 28, 2024

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

Remove enforce-eager to enable HPU graphs for better vLLM perf #954

Remove enforce-eager to enable HPU graphs for better vLLM perf #954

Uh oh!

Conversation

wangkl2 commented Nov 28, 2024

Description

Type of change

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants