Skip to content

Conversation

@chengtyao2-design
Copy link

Description

本 PR 在 InfiniLM 中新增了对 Qwen3-MoE 模型的支持,并添加了相关的测试用例。
主要工作包括定义 Qwen3-MoE 的模型结构、加载逻辑以及对应的单元测试脚本。

Implemented Features

  • Qwen3-MoE Model: 新增了 Qwen3Moe 模型定义及其 Torch 实现。
    • python/infinilm/models/qwen3moe/qwen3moe.py
    • python/infinilm/models/qwen3moe/qwen3moe_torch.py
    • python/infinilm/models/qwen3moe/__init__.py
  • Documentation: 添加了 MoE 重构相关的说明文档。
    • python/infinilm/models/qwen3moe/MOE_REFACTOR.md
    • python/infinilm/models/qwen3moe/MOE_REFACTOR_CN.md
  • Tests: 添加了针对 MoE 模型的测试脚本。
    • test/models/qwen3_moe/ourmoe_test.py
    • test/models/qwen3_moe/test.sh

Testing

  • 添加了 test/models/qwen3_moe/test.sh 脚本用于运行测试。
  • 本地验证通过,模型能够正常加载并运行前向计算。

@chengtyao2-design chengtyao2-design requested a review from a team January 14, 2026 08:52
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants