科技巨头资本支出创纪录:为争夺AI领先地位,谷歌、亚马逊、Meta、微软四大科技公司2026年计划资本支出合计将达约6500亿美元,主要用于建设数据中心和购买AI芯片。
英伟达股价与行业预测:受AI需求推动,英伟达股价近期创下近10个月来**单日涨幅。美国半导体行业协会预测,2025年全球芯片销售额增长25.6%,并预计今年行业营收将首次突破1万亿美元。
算力租赁市场需求旺盛:由于全球算力供需失衡,亚马逊云服务(AWS)二十年来首次上调了AI算力租赁价格。同时,英伟达向算力租赁公司CoreWeave追加了20亿美元投资。
国产超大规模算力集群启用:中科曙光正式启用了全国首个三万卡规模的国产scaleX超大规模AI算力集群,可支撑万亿参数大模型训练,标志着我国大规模AI算力基础设施取得重要进展。
国产芯片走差异化路线:脱胎于商汤科技的GPU公司曦望,发布了专注于AI推理场景的“启望S3”芯片,通过放弃训练功能、采用LPDDR6内存等设计,追求**的推理性价比。
国内企业聚焦推理芯片降本:AI公司云天励飞公布了大算力推理芯片战略,目标是通过架构创新,将百万Tokens的推理成本降低100倍以上,以推动AI应用普惠化。
内存短缺影响产品布局:因AI算力需求爆炸性增长导致高端内存供应紧张,英伟达预计将暂缓推出2026年的新款消费级游戏显卡,这将是其数十年来首次中断年度更新惯例。
硬件涨价蔓延:AI算力需求拉动的硬件供需失衡持续,三星计划提高4纳米和8纳米晶圆代工价格,英飞凌也通知将上调部分功率半导体产品价格。
推理系统架构迎来变革:英伟达发布了推理上下文内存存储平台(ICMS),将管理大模型推理过程中产生的“键值缓存(KV Cache)”提升为独立的系统层级。这表明大规模AI推理的瓶颈正从计算转向内存管理。
CPO(共封装光学)技术受关注:为应对AI集群内部高速互联的需求,英伟达在其新一代超级计算平台中,将CPO交换机作为核心组件。该技术能显著降低功耗、提升带宽密度,成为算力网络演进的新方向。