HBM太贵用不起?高通HBC另辟蹊径,提供能效6倍、成本更优的AI算力新选择

半导体 网络 Andy 2026-06-26 15:19

近两年生成式AI大模型参数量与运算规模快速扩张,算力部署普遍遭遇带宽不足、存储成本高企的约束,而主流HBM内存方案长期存在造价高昂、产能紧张的行业痛点。6月25日,高通在2026投资者日发布高带宽计算(High-Bandwidth Compute,HBC)架构,依托差异化近内存3D堆叠设计,对标HBM技术路线,针对性解决AI场景数据传输延迟、功耗偏高、部署成本高的核心难题。

架构设计:LPDDR+TSV堆叠,打造区别于HBM的全新方案

当前AI服务器高端算力方案高度依赖HBM高带宽内存,但该技术方案需要配套昂贵的硅中介层,制备成本高、供应链产能受限,持续制约AI算力规模化落地。高通HBC架构跳出传统HBM的技术框架,采用自研近内存计算方案,将专用HBC加速器堆叠在LPDDR存储堆栈下方,通过TSV硅通孔工艺实现垂直高密度互联。

该设计不再依赖HBM方案中成本高昂的硅中介层,转而通过标准2D有机基板连接主SoC与HBC堆栈,大幅缩短芯片间数据传输链路。相比传统HBM方案,这一架构不仅有效降低数据交互延迟,还显著优化系统散热与整体功耗,同时依托LPDDR成熟供应链缓解产能压力,形成与现有GPU-HBM方案错位竞争的差异化技术优势。

能效对标:多项核心指标超越传统GPU-HBM-SRAM组合方案

基于高通同规格标准化测试条件,HBC架构展现出优异的能效表现,相较传统存储方案优势显著。官方测试数据显示,卡级标准化场景下,HBC每瓦内存带宽达到主流HBM产品的6倍;机架级部署场景中,HBC每瓦存储容量为传统SRAM方案的200倍。

在同等功耗约束下,HBC架构可实现更高的有效数据吞吐能力,能够有效降低大规模AI推理、算力部署的能耗压力,同时依托成本与能效优势,提供优于传统HBM方案的性价比选择。需要说明的是,上述对标对象为当前主流的GPU-HBM-SRAM组合方案,HBC架构并非意在短期内全面替代HBM,而是在特定的低功耗、高能效云端推理场景中,提供一条更具综合成本优势的技术路径。

产品迭代路线:两代芯片接力升级,持续拉大能效差距

高通为HBC架构规划了清晰的多代技术迭代路线,通过两代产品持续优化性能、能效与成本,持续对标传统GPU-HBM方案并扩大能效优势。

第一代HBC Gen1将搭载于AI250加速器,单卡内存读写速率可达133TB/s,相较搭载LPDDR5X的前代AI200,有效内存带宽提升18倍,产品预计2027年年中推出工程样品并启动商业化测试。

第二代HBC Gen2配套AI300加速器,计划于2028年正式推出,相较AI200有效带宽最高可提升54倍。在每瓦带宽方面,官方预计其对标HBM的提升幅度最高可达7倍(具体倍数因测试基线不同而略有浮动,以终案产品为准),可进一步降低AI推理单Token能耗与整机总体拥有成本(TCO)。

行业布局:差异化入局,破解AI存储核心瓶颈

高通表示,HBC架构整合了自身3D集成工艺研发积累与LPDDR成熟技术、供应链优势,将联合产业链上下游合作伙伴,针对性攻克当前AI算力部署中内存容量有限、带宽不足、综合成本偏高的三大核心瓶颈。

随着生成式AI与智能体技术商业化落地提速,AI算力市场需求持续扩容。高通依托HBC架构,在低功耗云端推理、大规模AI算力部署赛道形成与传统HBM方案错位竞争的技术优势,持续完善自身AI算力生态布局。这一路径有望在特定场景下为客户提供HBM之外的高能效、低成本新选择,整体AI加速市场将呈现多元技术路线并存的格局,HBC与HBM各有适用边界,共同服务于日益增长的AI算力需求。

推荐:电脑用的少,手机扫一扫,资讯快一步!

扫码关注我们

标签:

简讯快报

更多