英伟达发布专用推理GPU Rubin CPX:英伟达推出专为超长上下文推理设计的Rubin CPX GPU。其采用单芯片(Monolithic)设计,搭载128GB GDDR7显存,在NVFP4精度下可提供30 PetaFLOPS的算力,专注于处理代码库分析、长视频生成等需处理***token的任务。其注意力机制性能据称达当前旗舰GB300 NVL72系统的3倍。
Rubin CPX采用解耦推理架构:该芯片旨在将AI推理的上下文处理(计算密集型) 与内容生成(内存带宽密集型) 阶段分离,通过针对性优化,预计可使整体推理效率提升最高达6.5倍。
构建Vera Rubin平台:Rubin CPX将与Vera CPU、Rubin GPU共同组成 NVIDIA Vera Rubin NVL144 CPX平台。单个机架预计可提供8 Exaflops的AI算力(NVFP4)、100TB高速内存及1.7 PB/s内存带宽,AI性能据称为GB200 NVL72的7.5倍。
Rubin CPX预计上市时间:预计于2026年底上市。
国内首个AI计算开放架构发布:中科曙光联合20余家产业链企业在2025世界智能产业博览会上,发布了国内首个AI计算开放架构及曙光AI超集群系统。其旨在通过开放协作,推动解决算力瓶颈问题,构建覆盖“算、存、网、电、冷、管、软”的协同创新体系。
曙光AI超集群系统性能提升:该系统单机柜支持96张加速卡,提供百P级算力,可扩展至百万卡规模。官方称其千卡集群训练推理性能达业界主流水平2.3倍,模型开发效率提升4倍,GPU算效增加55%,故障修复时间缩短47%。
强调开放与兼容:该架构致力于兼容多品牌GPU加速卡,并支持CUDA等主流软件生态,以降低用户软件开发适配成本,避免被单一技术路线绑定。
关键技术能力开放:中科曙光宣布开放AI存储优化技术、液冷基础设施设计规范(其浸没式液冷市场占有率超50%)和DeepAI基础软件栈三项核心技术能力,以促进生态共建。
成立联合实验室:依托国家先进计算产业创新中心,联合芯片、整机等企业成立 “AI计算开放架构联合实验室” ,聚焦部件级、系统层等五类技术开放,减少重复研发。
砺算TrueGPU显卡启动量产:砺算科技宣布其首款全自研高性能图形GPU “7G100”系列及Lisuan eXtreme系列显卡将于9月启动量产。官方演示其在《黑神话:悟空》1080P高画质下平均帧率超70帧,并称可满足个人AIPC对某些AI模型的需求。