云擎天下-超高性价比AI算力服务平台

 A100 pcie40G - 1200/卡/月;裸金属八卡机:8*910B - 11000/月  8*4090 - 5700/月  8*A100 pcie40G - 8800/月  8*A100 pcie80G - 22000/月  8*A100 nvlink80G - 25000/月  8*A800 nvlink80G - 23000/月  8*H20*96G - 25000/月 8*H20*141G - 32000/月  8*L40 - 9600/月  8*L40S - 13000/月 8*H100 - 53000/月 8*H800 - 49000/月 8*H200 -63000/月 8*B200 -91000/月 

全球GPU算力资讯简要【20260301】

  1. 芯片巨头AMD与社交媒体巨头Meta宣布达成一项为期五年的重磅合作协议,Meta计划部署高达6吉瓦(GW)算力的AMD Instinct GPU及EPYC CPU,用于其AI数据中心建设,交易价值预计高达数百亿甚至超千亿美元,旨在实现算力多元化并降低对英伟达的依赖。

  2. 英伟达发布了远超市场预期的2025年第四季度财报,总营收达681.3亿美元,同比增长73%。尽管业绩亮眼,但由于市场对其未来资本支出可持续性的担忧,公司股价在财报发布次日反而重挫5.5%,市值一夜蒸发近2600亿美元。

  3. 在股价大跌的同时,英伟达展示了其下一代Vera Rubin算力系统的内部构成细节,该系统将集成72颗Rubin GPU和36颗Vera CPU。市场普遍关注其即将在3月16日GTC 2026大会上可能揭晓的、代号为“Feynman”的革命性全新芯片。

  4. 受AI需求持续井喷影响,存储芯片市场供需紧张加剧。SK海力士表示所有客户需求都无法满足,HBM(高带宽内存)今年已全部售罄,并预计存储价格将持续上涨。三星的新一代HBM4报价也较上代产品高出20%至30%。

  5. 市场对AI芯片的追求正从“训练”向“推理”侧重,引发了对LPU(语言处理单元)等专用芯片及SRAM(静态随机存取存储器)技术的关注。传闻英伟达将在GTC大会上展示相关技术,这同时也带动了对高多层PCB板等上游材料的需求预期。

  6. 谷歌发布了新一代模型Gemini 3.1 Pro,其在推理能力、多模态表现上全面提升。模型的不断升级与AI智能体应用的深入,正持续推动着对全球底层算力硬件的旺盛需求。

  1. 一个标志性事件发生:全球AI模型调用数据显示,2026年2月,中国AI模型的周调用量首次超越美国,在全球调用量前五的模型中,中国模型占据四席,展现出集群式崛起态势。

  2. 在中国AI模型调用量激增的背景下,市场算力逻辑发生剧变。A股市场反应热烈,算力租赁、云计算、数据中心等板块掀起涨停潮。而英伟达的大跌与A股的走强形成了“冰火两重天”的鲜明对比,市场开始重新审视算力价值的分配。

  3. 国产GPU厂商迎来价值兑现关键期。摩尔线程和沐曦股份相继发布业绩快报,2025年营收分别实现243.37%和121.26%的高速增长,且亏损均显著收窄。这表明国产通用GPU正凭借技术实力和成本优势,逐步获得市场认可,受益于国产算力需求的指数级增长。

  4. 国产算力需求前景被普遍看好。分析指出,中国AI模型凭借高效的MoE(混合专家)架构和显著的成本优势(如较低的电力成本),正在削弱市场对英伟达高端GPU的线性依赖。摩根大通预测,从2025年到2030年,中国Token消耗量的年复合增长率将达到330%,这将直接催生对国产算力基础设施的庞大需求。

商务合作:cloud-engine-ben(微信)
客服热线:19886543806
联系地址:深圳市南山区招商街道沿山社区南海大道1079号花园城数码大厦A座二楼
企业信息