0
联系电话:4001-158-698EN

公司新闻 行业动态 产品知识

bandao.com半岛(bandao·中国)电子科技-MUSA生态再验证:原生优化助力Qwen3.5在MTT S5000高效推理

【导读】于阿里继重磅开源Qwen3.5-397B-A17B以后,再次开释Qwen3.5系列三款中等范围模子(35B、122B和27B版本)之际,国产算力生态迎来了又一次要害的协同进级。摩尔线程迅速相应,公布其旗舰级AI训推一体全功效GPU MTT S5000已经率先完成对于这三款新模子的全方位适配。这一举措不仅标记着MUSA生态于应答前沿年夜模子时的成熟度与完整性获得了有力验证,更经由过程原生MUSA C撑持与深度兼容Triton-MUSA两年夜焦点能力,为开发者构建了从CUDA生态无缝迁徙至国产算力的高效桥梁。

这次高效撑持充实展示了摩尔线程MUSA生态的成熟度与完整性。于本次Qwen3.5系列模子的适配历程中,MUSA生态赋能开发者的两年夜焦点能力获得了有力验证:

原生MUSA C撑持:答应开发者直接利用MUSA C举行内核开发,年夜幅降低CUDA生态迁徙门坎;

深度兼容Triton-MUSA:开发者可以使用认识的Triton语法编写高机能算子,并经由过程Triton-MUSA后端,无缝运行于摩尔线程全功效GPU上。

于底层技能层面,针对于Qwen3.5多模态模子采用的混淆留意力机制,摩尔线程实现了原生优化。基在muDNN计较库及MATE开源算子库,摩尔线程为混淆留意力机制中的长序列处置惩罚提供高效支撑,乐成于MTT S5000上实现了该模子的高机能推理。

总结

从GLM、MiniMax到Kimi,再到这次Qwen3.5系列的极速适配,摩尔线程已经将对于SOTA年夜模子的快速撑持转化为一种“新常态”,充实印证了MUSA架构卓着的无缝兼容性与全功效GPU强盛的生态承载力。经由过程底层针对于混淆留意力机制的原生优化和muDNN、MATE算子库的高效支撑,摩尔线程不仅解决了长序列处置惩罚等要害技能难题,更筑牢了坚实、易用的国产算力底座。

3-958x200_20251021044824_513.png

-bandao.com半岛(bandao·中国)电子科技
1210
在线客服
在线客服

Maggie

微信咨询

黎小姐