[Model] Temporarily removing support for q0f32 models due to correctness issues #745

akaashrp · 2025-11-23T06:04:32Z

Certain q0f32 models are running into correctness issues after the TVM FFI refactor:

Qwen3-0.6B-q0f32-MLC
Qwen2.5-0.5B-Instruct-q0f32-MLC
Qwen2.5-Coder-0.5B-Instruct-q0f32-MLC
Qwen2-0.5B-Instruct-q0f32-MLC
Llama-3.2-1B-Instruct-q0f32-MLC

These have temporarily been commented out in config.ts while these issues are being debugged. If you need to use these specific models, please use WebLLM v0.2.79 (https://www.npmjs.com/package/@mlc-ai/web-llm/v/0.2.79).

…ess issues

[Model] Temporarily removing support for q0f32 models due to correctn…

4f67698

…ess issues

akaashrp merged commit ed368d7 into mlc-ai:main Nov 23, 2025
1 check passed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

[Model] Temporarily removing support for q0f32 models due to correctness issues #745

[Model] Temporarily removing support for q0f32 models due to correctness issues #745

Uh oh!

akaashrp commented Nov 23, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

[Model] Temporarily removing support for q0f32 models due to correctness issues #745

[Model] Temporarily removing support for q0f32 models due to correctness issues #745

Uh oh!

Conversation

akaashrp commented Nov 23, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant