服务于全球各领域电子制造客户
公司新闻 行业动态 产品知识
【导读】于阿里继重磅开源Qwen3.5-397B-A17B以后,再次开释Qwen3.5系列三款中等范围模子(35B、122B和27B版本)之际,国产算力生态迎来了又一次要害的协同进级。摩尔线程迅速相应,公布其旗舰级AI训推一体全功效GPU MTT S5000已经率先完成对于这三款新模子的全方位适配。这一举措不仅标记着MUSA生态于应答前沿年夜模子时的成熟度与完整性获得了有力验证,更经由过程原生MUSA C撑持与深度兼容Triton-MUSA两年夜焦点能力,为开发者构建了从CUDA生态无缝迁徙至国产算力的高效桥梁。
这次高效撑持充实展示了摩尔线程MUSA生态的成熟度与完整性。于本次Qwen3.5系列模子的适配历程中,MUSA生态赋能开发者的两年夜焦点能力获得了有力验证:
原生MUSA C撑持:答应开发者直接利用MUSA C举行内核开发,年夜幅降低CUDA生态迁徙门坎;
深度兼容Triton-MUSA:开发者可以使用认识的Triton语法编写高机能算子,并经由过程Triton-MUSA后端,无缝运行于摩尔线程全功效GPU上。
于底层技能层面,针对于Qwen3.5多模态模子采用的混淆留意力机制,摩尔线程实现了原生优化。基在muDNN计较库及MATE开源算子库,摩尔线程为混淆留意力机制中的长序列处置惩罚提供高效支撑,乐成于MTT S5000上实现了该模子的高机能推理。
总结
从GLM、MiniMax到Kimi,再到这次Qwen3.5系列的极速适配,摩尔线程已经将对于SOTA年夜模子的快速撑持转化为一种“新常态”,充实印证了MUSA架构卓着的无缝兼容性与全功效GPU强盛的生态承载力。经由过程底层针对于混淆留意力机制的原生优化和muDNN、MATE算子库的高效支撑,摩尔线程不仅解决了长序列处置惩罚等要害技能难题,更筑牢了坚实、易用的国产算力底座。
下一篇【产品推荐】超小型高频同轴连接器u.fl系列
www@bandao.com半岛
Maggie
微信咨询
黎小姐