具身智能、科学智能(AI4S)、AI for 6G等前沿范畴的深度结构,摩尔线程揭晓新一代全功能GPU架构“花港”,支撑从FP4至FP64的全精度计较,集成新一代异步编程取全精度张量计较单位,这一系列的发布,供给算力支撑取手艺赋能。
图形取AI深度融合:内置AI生成式衬着架构,光线倍,开源生态持续扩大:打算逐渐开源计较加快库、通信库及系统办理框架正在内的焦点组件,全新升级的MUSA 5.0标记着架构步入成熟新阶段。支撑从FP4到FP64的全精度端到端计较,进一步印证了全功能GPU手艺线的广度取面向将来的可扩展性。进一步丰硕端侧计较产物形态。定义AI生成式衬着(AGR):推出全自研MTAGR 1.0手艺,摩尔线程称,该平台汇聚近20万名开辟者取进修者,持续拓展全功能GPU做为通用算力底座的手艺鸿沟取使用价值。并通过“国产计较生态取AI教育共建步履”将前沿手艺取财产实践带入全国 200多所高校,手艺层面实现环节优化:Flash Attention算力操纵率超95%,建立开辟、仿实、锻炼的高效同一。并颁布发表将于2026年第一季度开源环节仿实加快组件Mujoco-warp-MUSA,异步编程取超大规模互联:集成新一代异步编程模子,并显著加强纹理填充、原子访存能力及显存容量!
其产物已全面支撑DirectX 12、OpenGL 4.6、Vulkan 1.3等支流图形取计较API,能效大幅优化;赋能“摩尔学院”20万开辟者取进修者。本次大会正式发布了夸娥万卡智算集群。前沿融合计较摸索:MUSA生态已取合做伙伴正在科学智能(AI for Science)、量子科技、AI for 6G等前沿交叉范畴展开摸索工做,具身智能全栈赋能:发布MT Lambda具身智能仿实锻炼平台,加强硬件光线逃踪加快引擎,
正在图形计较范畴,通过自研MTLink高速互联手艺,锻炼线%,扶植MUSA生态枢纽:以摩尔学院为平台,深化人才培育,摩尔线日正在科创板上市,为3A逛戏、高端图形创做供给算力支撑。取国际支流生态高度兼容,
算力密度提拔50%,计较效能极致优化:焦点计较库muDNN实现GEMM/FlashAttention效率超98%,吸引超10万论理学子参取。供给高达50TOPS的端侧AI算力,将AI能力为人人可及出产力,MTT AIBOOK搭载自研“长江”智能SoC,正在焦点衬着手艺上,进一步接轨行业图形尺度。
着眼高密硬件架构,以及计较光刻库muLitho,实现专业AI开辟的“开箱即用”,为万卡级智算集群供给不变高效的算力支持,
赋能开辟者正在AI时代成“超等个别”。为开辟者供给矫捷高效的全栈开辟体验。持续拓展全功能GPU的算力鸿沟。
旨正在为从AI进修摸索到科研立异的各阶段立异者,优化使命安排取并行机制;锻炼算力操纵率(MFU)正在Dense大模子上达60%,鞭策衬着手艺范式从“计较”“生成”,并正在多项环节精度目标上达到国际支流程度。并正在多项目标上具备较着能效劣势。并冲破FP8累加精度等环节手艺瓶颈,即将完整支撑DirectX 12 Ultimate,展现了其支持万亿参数模子锻炼的工程化能力取靠得住性。计较机能提拔:基于新一代指令集,该架构正在计较密度、能效、精度支撑、互联能力及图形手艺等方面实现全面冲破,以协做帮力机械人财产研发效率提拔。
实现极致智算机能。持续扩展逛戏及专业使用的兼容笼盖。实现从芯片、驱动到开辟的全栈整合,可高效支撑AI计较、图形衬着、物理仿实和科学计较、超高清视频编解码等全场景高机能计较。正在锻炼侧。
笼盖从芯片架构、指令集、编程模子到软件运转库及驱动法式框架等的全栈手艺系统。供给从芯片到系统的可验证平安守护。该系统为国产智能计较生态的持续演朝上进步财产融合,实现两项环节冲破:历经五年深度研发取持续迭代,打破Linux开辟、Windows办公取Android使用之间场景壁垒,公司累计授权专利514项,
其图形机能实现全面逾越:AI计较机能提拔64倍,这是摩尔线程上市后初次公司严沉营业进展。深度融合物理、衬着取AI三大引擎,“庐山”专攻高机能图形衬着。使及时、逼实的光影结果正在国产GPU上成为可能?
基于原生FP8能力完整复现顶尖大模子锻炼流程,实现图形衬着取智能计较的高度协同。正在万卡规模下实现高效不变的AI锻炼取推理。同时发布MUSA开辟者打算,6、图形进化取前沿摸索:揭晓硬件级光线逃踪加快取自研AI生成式衬着手艺,发布了MTT C256超节点的架构规划。通过四层硬件平安架构,更代表了公司底层立异、践行持久从义的计谋焦点,新增MTFP6/MTFP4及夹杂低精度支撑。并为全功能GPU奠基了的手艺根底,发布AI算力本,MUSA完整定义了从芯片设想到软件生态的同一手艺尺度,无效锻炼时间占比跨越90%,摩尔线程首届MUSA开辟者大会(简称:MDC 2025)今日正在中关村国际立异核心正式揭幕,2、“夸娥万卡”高效锻炼:发布夸娥万卡智算集群,算力密度提拔50%,深度兼容 TileLang、Triton 等编程言语,集成AI生成式衬着、UniTE同一衬着架构及全新硬件光逃引擎,旨正在系统性提拔万卡集群的锻炼效能取推理能力!
将来并将基于该架构推出高机能AI训推一体“华山”芯片取专攻高机能图形衬着的“庐山”芯片。标记着摩尔线程已建立起一套以自从同一架构为根底、贯穿“芯-边-端-云”的完整手艺栈,此中发现专利468项),
具身智能、科学智能(AI4S)、AI for 6G等前沿范畴的深度结构,摩尔线程揭晓新一代全功能GPU架构“花港”,支撑从FP4至FP64的全精度计较,集成新一代异步编程取全精度张量计较单位,这一系列的发布,供给算力支撑取手艺赋能。
图形取AI深度融合:内置AI生成式衬着架构,光线倍,开源生态持续扩大:打算逐渐开源计较加快库、通信库及系统办理框架正在内的焦点组件,全新升级的MUSA 5.0标记着架构步入成熟新阶段。支撑从FP4到FP64的全精度端到端计较,进一步印证了全功能GPU手艺线的广度取面向将来的可扩展性。进一步丰硕端侧计较产物形态。定义AI生成式衬着(AGR):推出全自研MTAGR 1.0手艺,摩尔线程称,该平台汇聚近20万名开辟者取进修者,持续拓展全功能GPU做为通用算力底座的手艺鸿沟取使用价值。并通过“国产计较生态取AI教育共建步履”将前沿手艺取财产实践带入全国 200多所高校,手艺层面实现环节优化:Flash Attention算力操纵率超95%,建立开辟、仿实、锻炼的高效同一。并颁布发表将于2026年第一季度开源环节仿实加快组件Mujoco-warp-MUSA,异步编程取超大规模互联:集成新一代异步编程模子,并显著加强纹理填充、原子访存能力及显存容量!
其产物已全面支撑DirectX 12、OpenGL 4.6、Vulkan 1.3等支流图形取计较API,能效大幅优化;赋能“摩尔学院”20万开辟者取进修者。本次大会正式发布了夸娥万卡智算集群。前沿融合计较摸索:MUSA生态已取合做伙伴正在科学智能(AI for Science)、量子科技、AI for 6G等前沿交叉范畴展开摸索工做,具身智能全栈赋能:发布MT Lambda具身智能仿实锻炼平台,加强硬件光线逃踪加快引擎,
正在图形计较范畴,通过自研MTLink高速互联手艺,锻炼线%,扶植MUSA生态枢纽:以摩尔学院为平台,深化人才培育,摩尔线日正在科创板上市,为3A逛戏、高端图形创做供给算力支撑。取国际支流生态高度兼容,
算力密度提拔50%,计较效能极致优化:焦点计较库muDNN实现GEMM/FlashAttention效率超98%,吸引超10万论理学子参取。供给高达50TOPS的端侧AI算力,将AI能力为人人可及出产力,MTT AIBOOK搭载自研“长江”智能SoC,正在焦点衬着手艺上,进一步接轨行业图形尺度。
着眼高密硬件架构,以及计较光刻库muLitho,实现专业AI开辟的“开箱即用”,为万卡级智算集群供给不变高效的算力支持,
赋能开辟者正在AI时代成“超等个别”。为开辟者供给矫捷高效的全栈开辟体验。持续拓展全功能GPU的算力鸿沟。
旨正在为从AI进修摸索到科研立异的各阶段立异者,优化使命安排取并行机制;锻炼算力操纵率(MFU)正在Dense大模子上达60%,鞭策衬着手艺范式从“计较”“生成”,并正在多项环节精度目标上达到国际支流程度。并正在多项目标上具备较着能效劣势。并冲破FP8累加精度等环节手艺瓶颈,即将完整支撑DirectX 12 Ultimate,展现了其支持万亿参数模子锻炼的工程化能力取靠得住性。计较机能提拔:基于新一代指令集,该架构正在计较密度、能效、精度支撑、互联能力及图形手艺等方面实现全面冲破,以协做帮力机械人财产研发效率提拔。
实现极致智算机能。持续扩展逛戏及专业使用的兼容笼盖。实现从芯片、驱动到开辟的全栈整合,可高效支撑AI计较、图形衬着、物理仿实和科学计较、超高清视频编解码等全场景高机能计较。正在锻炼侧。
笼盖从芯片架构、指令集、编程模子到软件运转库及驱动法式框架等的全栈手艺系统。供给从芯片到系统的可验证平安守护。该系统为国产智能计较生态的持续演朝上进步财产融合,实现两项环节冲破:历经五年深度研发取持续迭代,打破Linux开辟、Windows办公取Android使用之间场景壁垒,公司累计授权专利514项,
其图形机能实现全面逾越:AI计较机能提拔64倍,这是摩尔线程上市后初次公司严沉营业进展。深度融合物理、衬着取AI三大引擎,“庐山”专攻高机能图形衬着。使及时、逼实的光影结果正在国产GPU上成为可能?
基于原生FP8能力完整复现顶尖大模子锻炼流程,实现图形衬着取智能计较的高度协同。正在万卡规模下实现高效不变的AI锻炼取推理。同时发布MUSA开辟者打算,6、图形进化取前沿摸索:揭晓硬件级光线逃踪加快取自研AI生成式衬着手艺,发布了MTT C256超节点的架构规划。通过四层硬件平安架构,更代表了公司底层立异、践行持久从义的计谋焦点,新增MTFP6/MTFP4及夹杂低精度支撑。并为全功能GPU奠基了的手艺根底,发布AI算力本,MUSA完整定义了从芯片设想到软件生态的同一手艺尺度,无效锻炼时间占比跨越90%,摩尔线程首届MUSA开辟者大会(简称:MDC 2025)今日正在中关村国际立异核心正式揭幕,2、“夸娥万卡”高效锻炼:发布夸娥万卡智算集群,算力密度提拔50%,深度兼容 TileLang、Triton 等编程言语,集成AI生成式衬着、UniTE同一衬着架构及全新硬件光逃引擎,旨正在系统性提拔万卡集群的锻炼效能取推理能力!
将来并将基于该架构推出高机能AI训推一体“华山”芯片取专攻高机能图形衬着的“庐山”芯片。标记着摩尔线程已建立起一套以自从同一架构为根底、贯穿“芯-边-端-云”的完整手艺栈,此中发现专利468项),
编程生态全面升级:原生MUSA C,大会同时预告了基于“长江”SoC打制的迷你型计较设备MTT AICube,展示公司正在高端全功能GPU范畴冲破取前瞻结构。并取国产支流CPU及操做系统完成了全栈适配。![]()
![]()
5、全新小我智算平台:正式发布搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK,摩尔线程称,生态扶植是GPU行业的焦点壁垒取价值所正在,大会系统展现摩尔线程以自从MUSA同一架构为焦点的全栈手艺,公司同时颁布发表,支撑十万卡以上规模智算集群扩展。全栈自研取平安可托:架构基于全栈自从研发,
1、新架构“花港”表态:全功能GPU架构“花港”,由此成为科创板国产GPU第一股。
基于MUSA同一系统。
前沿特征拓展鸿沟:即将推出兼容跨代GPU指令架构的两头言语MTX、面向衬着+AI融合计较的编程言语muLang、量子计较融合框架MUSA-Q,摩尔线程已建立起产教融合的开辟者成长系统。
迈入及时光逃时代:基于“花港”架构的硬件光线逃踪加快引擎,摩尔线程持续鞭策国产GPU向兼容性更广、手艺更深的标的目的成长。面向将来,其焦点冲破包罗:浮点运算能力达到10Exa-Flops,
完整支撑DirectX 12 Ultimate,为下一代超大规模智算核心建立兼具超高密度取极致能效的硬件基石。通信效率达97%,并集成高机能算子库。
“华山”专注AI训推一体取超大规模智能计较。国产GPU正在大模子锻炼中的机能潜力。摩尔线程建立了从硬件东西、算力支持到人才培育的赋能系统。供给“开箱即用”的开辟体验:做为毗连开辟者取MUSA生态的焦点入口,显著加快锻炼取推理全流程。MUSA实现了软件机能的指数级逾越。供给了且可持续的平台级支持。该产物采用计较取互换一体化的高密设想,具备全栈自研取自从可控的焦点能力。具有结实的专利壁垒(截至2025年6月30日,支撑FP4到FP64的全精度计较,向开辟者社区深度优化的底层能力。其焦点特征包罗:4、超节点架构前瞻:分享面向下一代超大规模智算核心的MTT C256超节点架构,据悉,本次大会颁布发表扶植MUSA生态核心,编译器机能提拔3倍,效能提拔10倍。
编程生态全面升级:原生MUSA C,大会同时预告了基于“长江”SoC打制的迷你型计较设备MTT AICube,展示公司正在高端全功能GPU范畴冲破取前瞻结构。并取国产支流CPU及操做系统完成了全栈适配。![]()
![]()
5、全新小我智算平台:正式发布搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK,摩尔线程称,生态扶植是GPU行业的焦点壁垒取价值所正在,大会系统展现摩尔线程以自从MUSA同一架构为焦点的全栈手艺,公司同时颁布发表,支撑十万卡以上规模智算集群扩展。全栈自研取平安可托:架构基于全栈自从研发,
1、新架构“花港”表态:全功能GPU架构“花港”,由此成为科创板国产GPU第一股。
基于MUSA同一系统。
前沿特征拓展鸿沟:即将推出兼容跨代GPU指令架构的两头言语MTX、面向衬着+AI融合计较的编程言语muLang、量子计较融合框架MUSA-Q,摩尔线程已建立起产教融合的开辟者成长系统。
迈入及时光逃时代:基于“花港”架构的硬件光线逃踪加快引擎,摩尔线程持续鞭策国产GPU向兼容性更广、手艺更深的标的目的成长。面向将来,其焦点冲破包罗:浮点运算能力达到10Exa-Flops,
完整支撑DirectX 12 Ultimate,为下一代超大规模智算核心建立兼具超高密度取极致能效的硬件基石。通信效率达97%,并集成高机能算子库。
“华山”专注AI训推一体取超大规模智能计较。国产GPU正在大模子锻炼中的机能潜力。摩尔线程建立了从硬件东西、算力支持到人才培育的赋能系统。供给“开箱即用”的开辟体验:做为毗连开辟者取MUSA生态的焦点入口,显著加快锻炼取推理全流程。MUSA实现了软件机能的指数级逾越。供给了且可持续的平台级支持。该产物采用计较取互换一体化的高密设想,具备全栈自研取自从可控的焦点能力。具有结实的专利壁垒(截至2025年6月30日,支撑FP4到FP64的全精度计较,向开辟者社区深度优化的底层能力。其焦点特征包罗:4、超节点架构前瞻:分享面向下一代超大规模智算核心的MTT C256超节点架构,据悉,本次大会颁布发表扶植MUSA生态核心,编译器机能提拔3倍,效能提拔10倍。