www.z6.com
股票代码
EN
CH EN
最新发布

最新发布

首页
最新发布
最新资讯
【展会回顾】KS凯时股份2025慕尼黑上海电子展完美收官
KS凯时·(中国大陆)-摩尔线程发布“花港”新架构及芯片路线图:展示从架构到集群的全栈技术
2026-05-20 18:25:06

2025年12月20日,北京——摩尔线程首届MUSA开发者年夜会(简称:MDC 2025)于北京中关村国际立异中央正式揭幕。作为海内首个聚焦全功效GPU的开发者技能嘉会,年夜会体系展示了摩尔线程以自立MUSA同一架构为焦点的全栈技能结果,周全揭示公司于高端全功效GPU范畴的要害冲破与前瞻结构。

本次发布的焦点结果包括:

一、新架构“花港”表态:全功效GPU架构“花港”,撑持FP4到FP64的全精度计较,算力密度晋升50%,效能晋升10倍。将来并将基在该架构推出高机能AI训推一体“西岳”芯片与专攻高机能图形衬着的“庐山”芯片。

二、“夸娥万卡”高效练习:发布夸娥万卡智算集群,展示了其支撑万亿参数模子练习的工程化能力与靠得住性,于多项要害精度指标上到达国际主流程度。

三、推理机能实现超过:摩尔线程结合硅基流动,于DeepSeek R1 671B全量模子上实现机能冲破,MTT S5000单卡Prefill吞吐冲破4000 tokens/s、Decode吞吐冲破1000 tokens/s,树立国产推理机能新标杆。

四、超节点架构前瞻:分享面向下一代超年夜范围智算中央的MTT C256超节点架构,着眼高密硬件架构,实现极致智算机能。

五、全新小我私家智算平台:正式发布搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK,赋能“摩尔学院”20万开发者与进修者。

六、图形进化与前沿摸索:揭晓硬件级光芒追踪加快与自研AI天生式衬着技能,具身智能、科学智能(AI4S)、AI for 6G等前沿范畴的深度结构,进一步印证了全功效GPU技能线路的广度与面向将来的可扩大性。

这一系列结果的发布,标记着摩尔线程已经乐成构建起一套以自立同一架构为根底、贯串“芯-边-端-云”的完备技能栈,实现了从底层硬件到上层运用的体系化闭环。该系统为国产智能计较生态的连续演进与财产交融,提供了坚实、开放且可连续的平台级支撑。

战略基石:MUSA同一架构的进化与开放

MUSA(Meta-computing Unified System Architecture)是摩尔线程自立研发的元计较同一计较架构,笼罩从芯片架构、指令集、编程模子到软件运行库和驱动步伐框架等的全栈技能系统。

MUSA不仅完备界说了从芯片设计到软件生态的同一技能尺度,更代表了公司对峙底层立异、践行持久主义的战略焦点,并为全功效GPU奠基了坚实的技能根底,可高效撑持AI计较、图形衬着、物理仿真及科学计较、超高清视频编解码等全场景高机能计较。

历经五年深度研发与连续迭代,MUSA实现了软件机能的指数级超过。全新进级的MUSA 5.0标记着架构步入成熟新阶段,于全栈同一性、极致效能与生态开放性上取患上要害冲破。

编程生态周全进级:原生MUSA C,深度兼容 TileLang、Triton 等编程语言,为开发者提供矫捷高效的全栈开发体验。

计较效能极致优化:焦点计较库muDNN实现GEMM/FlashAttention效率超98%,通讯效率达97%,编译器机能晋升3倍,并集成高机能算子库,显著加快练习与推理全流程。

开源生态连续扩展:规划慢慢开源计较加快库、通讯库和体系治理框架于内的焦点组件,向开发者社区开放深度优化的底层能力。

前沿特征拓展界限:行将推出兼容跨代GPU指令架构的中间语言MTX、面向衬着+AI交融计较的编程语言muLang、量子计较交融框架MUSA-Q,以和计较光刻库muLitho,连续拓展全功效GPU的算力界限。

硬件焦点:“花港”新架构与技能线路图

基在MUSA同一系统,摩尔线程揭晓新一代全功效GPU架构“花港”,该架构于计较密度、能效、精度撑持、互联能力和图形技能等方面实现周全冲破,其焦点特征包括:

计较机能显著晋升:基在新一代指令集,算力密度晋升50%,能效年夜幅优化;撑持从FP4到FP64的全精度端到端计较,新增MTFP6/MTFP4和混淆低精度撑持。

异步编程与超年夜范围互联:集成新一代异步编程模子,优化使命调理与并行机制;经由过程自研MTLink高速互联技能,撑持十万卡以上范围智算集群扩大。

图形与AI深度交融:内置AI天生式衬着架构,加强硬件光芒追踪加快引擎,完备撑持DirectX 12 Ultimate,实现图形衬着与智能计较的高度协同。

全栈自研与安全可托:架构基在全栈自立研发,拥有扎实的专利壁垒(截至2025年6月30日,公司累计授权专利514项,此中发现专利468项),具有全栈自研与自立可控的焦点能力。经由过程四层硬件安全架构,提供从芯片到体系的可验证安全守护。

基在“花港”架构,摩尔线程宣布了将来将发布的两款芯片技能线路:

“西岳”专注AI训推一体与超年夜范围智能计较。集成新一代异步编程与全精度张量计较单位,撑持从FP4至FP64的全精度计较,为万卡级智算集群提供不变高效的算力支撑,是构建下一代“AI工场”的坚实底座。

“庐山”专攻高机能图形衬着。其图形机能实现周全超过:AI计较机能晋升64倍,几那边理机能晋升16倍,光芒追踪机能晋升50倍,并显著加强纹理填充、原子访存能力和显存容量。集成AI天生式衬着、UniTE同一衬着架构和全新硬件光追引擎,为3A游戏、高端图形创作提供强盛算力撑持。

基础举措措施:夸娥万卡集群,树立国产智算效率标杆

本次年夜会正式发布了夸娥万卡智算集群。该集群具有全精度、全功效通用计较能力,于万卡范围下实现高效不变的AI练习与推理。其焦点冲破包括:浮点运算能力到达10Exa-Flops,练习算力使用率(MFU)于Dense年夜模子上达60%,MOE年夜模子上达40%,有用练习时间占比跨越90%,练习线性扩大效率达95%,与国际主流生态高度兼容,并于多项指标上具有显著能效上风。

于练习侧,基在原生FP8能力完备复现顶尖年夜模子练习流程,并于多项要害精度指标上到达国际主流程度。技能层面实现要害优化:Flash Attention算力使用率超95%,并冲破FP8累加精度等要害技能瓶颈,充实开释国产GPU于年夜模子练习中的机能潜力。

于推理侧,摩尔线程结合硅基流动,颠末体系级工程优化与FP8精度加快,于DeepSeek R1 671B全量模子上实现机能冲破:MTT S5000单卡Prefill吞吐冲破4000 tokens/s、Decode吞吐冲破1000 tokens/s,树立国产推理机能新标杆。

面向将来,发布了MTT C256超节点的架构计划。该产物采用计较与互换一体化的高密设计,旨于体系性晋升万卡集群的练习效能与推理能力,为下一代超年夜范围智算中央构建兼具超高密度与极致能效的硬件基石。

迈向物理AI:图形技能连续进化,前瞻结构将来计较

于图形计较范畴,摩尔线程连续鞭策国产GPU向兼容性更广、技能更深的标的目的成长。其产物已经周全撑持DirectX 十二、OpenGL 4.六、Vulkan 1.3等主流图形与计较API,并与国产主流CPU和操作体系完成为了全栈适配,连续扩大游戏和专业运用的兼容笼罩。公司同时公布,行将完备撑持DirectX 12 Ultimate,进一步接轨行业顶级图形尺度。

于焦点衬着技能上,摩尔线程率先拥抱“图形+AI”范式革命,实现两项要害冲破:

迈入及时光追时代:基在“花港”架构的硬件光芒追踪加快引擎,可实现对于DirectX Raytracing (DXR)的撑持,使及时、传神的光影效果于国产GPU上成为可能。

界说AI天生式衬着(AGR):推出全自研MTAGR 1.0技能,鞭策衬着技能范式从“计较”走向“天生”,为下一代数字内容创作和数字孪生等场景构开国产技能基座。

面向更广漠的将来计较场景,摩尔线程已经睁开前瞻性结构:

具身智能全栈赋能:发布了MT Lambda具身智能仿真练习平台,深度交融物理、衬着与AI三年夜引擎,构建了开发、仿真、练习的高效同一情况。推出基在智能SoC芯片“长江”、AI模组MTT E300及夸娥智算集群“端云联合”的MT Robot具身智能解决方案,并公布将在2026年第一季度开源要害仿真加快组件Mujoco-warp-MUSA,以开放协作助力呆板人财产研发效率晋升。

前沿交融计较摸索:MUSA生态已经与互助伙伴于科学智能(AI for Science)、量子科技、AI for 6G等前沿交织范畴睁开摸索事情,连续拓展全功效GPU作为通用算力底座的技能界限与运用价值。

生态加快:周全赋能开发者,发布小我私家AI算力平台

生态设置装备摆设是GPU行业的焦点壁垒与价值地点,摩尔线程构建了从硬件东西、算力支撑到人材造就的赋能系统。

深化人材造就,设置装备摆设MUSA生态枢纽:以摩尔学院为平台,摩尔线程已经构建起产教交融的开发者发展系统,该平台会聚近20万名开发者与进修者,并经由过程“国产计较生态与AI教诲共建步履”将前沿技能与财产实践带入天下200多所高校,吸引超10万论理学子介入。本次年夜会公布设置装备摆设MUSA生态中央,同时发布MUSA开发者规划,旨于为从AI进修摸索到科研立异的各阶段立异者,提供算力撑持与技能赋能。

发布AI算力本,提供“开箱即用”的开发体验:作为毗连开发者与MUSA生态的焦点进口,MTT AIBOOK搭载自研“长江”智能SoC,提供高达50TOPS的端侧AI算力,初次实现从芯片、驱动到开发情况的全栈整合,不仅实现了专业AI开发的“开箱即用”,更立异地打破Linux开发、Windows办公与Android运用之间场景壁垒,将强盛的AI能力转化为人人可和的出产力,赋能开发者于AI时代成为“超等个别”。

年夜会同时预报了基在“长江”SoC打造的迷你型计较装备MTT AICube,进一步富厚端侧计较产物形态。

结语:修筑自立基座,共赴智能将来

MDC 2025展示了从同一架构到焦点芯片,从超年夜范围基础举措措施到开发者终真个技能全景,这不仅是一次全功效GPU技能线路的体系出现,更是摩尔线程对于自立计较将来的坚定承诺。

瞻望将来,摩尔线程将以MUSA为焦点,对峙开放生态,与全世界开发者和伙伴联袂,配合构建下一代的智能计较系统,赋能千行百业,迈向智能新纪元。

关在摩尔线程

摩尔线程以全功效GPU为焦点,致力在向全世界提供加快计较的基础举措措施及一站式解决方案,为各行各业的数智化转型提供强盛的AI计较撑持。咱们的方针是成为具有国际竞争力的GPU领军企业,为交融人工智能及数字孪生的数智世界打造进步前辈的加快计较平台。咱们的愿景是为夸姣世界加快。

-KS凯时·(中国大陆)