[AOTI-CUDA] qwen3.5-35B-A3B prefill int8 perf through MoE #18949

Open

Assignees

opened

on Apr 16, 2026

Take MoE fused op from
bf16 @ (int4 --> bf16) = fp32
to
(bf16 --> int8) @ (int4 --> int8) = int32

Metadata

Assignees

digantdesai

Labels

No labels

No labels

Type

Projects

ExecuTorch Core

Status

In progress

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests