您好,欢迎来到 Global-PNG请登录免费注册
分享
收藏

HBM 介绍及发展历程

Global PNG2025-05-21 17:38:28
0   收藏40 阅读
半导体工艺与设备 2025年05月13日 09:33 北京

HBM 介绍及发展历程

半导体工艺与设备 2025年05月13日 09:33 北京

1. HBM 概述

HBM 是一种创新的 3D 堆叠 DRAM 技术,由 AMD 和 SKhynix 联合开发。它通过垂直堆叠多层 DRAM 芯片,并使用高带宽串行接口与 GPU 或 CPU 直连,提供远超传统 DRAM 的带宽和容量。高带宽内存(HBM)它象征着内存技术的革命性跨越,尤其在高性能计算(HPC)、人工智能(AI)、数据中心和高端游戏等领域。

s62b975a0-7d4c-4eeb-a03c-a7120578106e.png

2. HBM 原理

HBM 的核心在于独特的 3D 堆叠架构和 TSV(Through - Silicon - Via)技术:

① 3D 堆叠架构 :垂直堆叠多个 DRAM 芯片层,增加单位面积内存容量,各层 DRAM 通过微凸点与逻辑芯片相连。

② TSV 技术 :在硅芯片中垂直贯穿导电通路连接不同层次电路,减少芯片间连接长度和电阻。

③ 高带宽串行接口 :与传统并行接口相比,串行接口在更少引脚数量下实现更高数据传输速率。

a5fcfa9b-0fb2-49fe-ba7c-6088ea9530a3.png

3. HBM 的优势

◎高带宽 :满足高性能计算需求,带宽远超传统 DRAM。

◎高容量 :3D 堆叠技术在相同芯片面积内集成更多 DRAM 层,提供更大内存容量。

◎低功耗 :垂直堆叠结构减少数据传输距离,TSV 技术也有助于降低功耗。

◎小尺寸 :3D 堆叠设计使内存模块尺寸大幅减小,利于系统紧凑设计。

4. HBM 技术的发展历程


① HBM1

39844e68-eefc-4866-b07c-fc94e07f5b16.png

HBM1量产是在2014年,但早在2009年AMD与SK hynix就开始研发探索相关的产品。

9e10e6bb-78a2-4aef-a9f3-55ee5b3d73af.png

2015年AMD发布的Fiji GPU游戏卡首次搭载其与SK Hynix多年的研究成果HBM。

89b61ed8-91cd-404c-814e-b0c71e51f36f.png

HBM1 Stacks规格比较简单,仅有4 Hi类型,单Stack 1024bit,最大容量1GB,带宽128GB/s。Fiji GPU搭载4个HBM1 Stacks总容量4GB,总带宽为512GB/s。

fe606cd2-d8c4-4233-ba1c-f8b33a64d9df.png

HBM以其总线宽度优势其带宽大幅领先于GDDR,适逢内存瓶颈已经成为制约算力发展的一大难题,GPGPU计算卡在随后的日子里少不了HBM。



HBM不仅在带宽以上有极大的优势,其能耗比以及尺寸相对传统的DDR均有不可比拟的巨大优势。
②.HBM2

d34abd42-145e-433d-ab28-a1a4cb7b3c23.png

11ab95a9-9495-42fc-bd49-959134f47877.png

d7874510-beef-4331-8371-4ef97a8670b1.png

HBM2首发在2016年的NVIDIA P100上(大概是),P100采用4个HBM2 4GB Stacks,此时总带宽达到了720GB/s. 是采用GDDR的M40带宽的3倍。

a342cbaa-9f66-4007-859e-e9ff3bd1e968.png

2017年,也许是为了赶上深度学习热潮,仅隔一年,首次搭载Tensor Core的V100也正式发布,同样搭载4 HBM2 Stacks,内存翻倍至32GiB。

72d3b57d-e8d0-4e24-ad57-97ed8fa2e379.png

得益于HBM的发展,V100 HBM带宽是P100的1.5倍,来到了900GB/s。

08abf619-000c-489f-8187-9a83a23bdde4.png

③ HBM2e

4b6b66c9-0c67-45f2-bf2d-d7eccde141fa.png


2020年面世的A100搭载5个HBM2e 8Hi 16GB Stacks,此时总容量达到了80GB,带宽2039GB/s是前代V100 900GB/s的两倍有余(初代A100搭载的是5个HBM2 8GB Stacks,带宽仅有1.6TB/s)。

1353524b-03da-4aef-b089-3e6b165e37b4.png

也许是Die Size过于庞大,预留的12个HBM Controller,仅有10个被启用,非满血的6个HBM2e。

④ HBM3

21bf1d26-c1ad-4c50-8c4c-a14c0ad7e67f.png

2023年年底,AMD正式发布了MI300X,搭载了8个HBM3 12Hi 24GB Stacks,总容量192GB,总带宽达到了惊人的5.3TB/s。

⑤ HBM3e

HBM3E 采用 2.5D/3D 架构,3D 表示 HBM 封装在一个设备上的 3D DRAM 堆栈,2.5D 表示 HBM 存储设备与处理芯片(比如 GPU)的连接方式,两者之间的数据路径达到了 1024 条,HBM 和 GPU之间通过 interposer 连接。1F设计(1-Flip Chip)是一种先进的封装技术,旨在提高芯片的性能和效率,提高更高的带宽、传输速率、较低的延迟。

3aaa303a-029b-4910-9e90-3794a8641ace.png

国际知名研究机构Yole公布了海力士HBM 3E产品的横截面,该产品用于英伟达超级服务器GH200中。

1406d68c-0ca6-42ae-a067-6f3446446504.png

从横截面图中,可以清楚地看到8层存储单逻辑电路的堆叠结构。海力士的HBM3E提供8Gbps传输速度和16GB内存,是HBM3的扩展版本,旨在为高性能计算和人工智能应用提供突破性性能。

⑥ HBM4

2025416JEDEC 发布了 HBM4(高带宽存储器 4)官方规范 JESD238,这是一项旨在满足人工智能工作负载、高性能计算和高级数据中心环境快速增长需求的新内存标准。新标准引入了架构变化和接口升级,旨在提升内存带宽、容量和效率,以适应不断演变的数据密集型应用。

b90eb1d1-70de-4f38-b6f6-1941f67a058f.png

近日,在台积电北美技术研讨会上,SK海力士首次向公众展示其最新的16层堆叠HBM4方案以及其他几种内存产品。SK海力士介绍,HBM4的容量高达48 GB,带宽为2.0 TB/s,I/O速度为8.0 Gbps。SK海力士宣布计划在2025年下半年实现量产,这意味着该工艺最早可能在年底前集成到产品中。

3e30ad86-ba29-4686-a56c-dcba88edd544.png

三星电子将HBM4业务的重点放在了正在开发的10㎚级第6代(1c)DRAM上,计划在HBM4 12Hi产品中配备1c DRAM和逻辑芯片。如果能够稳步量产1c DRAM,有望在HBM4的产品性能上取得优势。SK海力士的HBM4配备的是1b DRAM。

美光则计划于2026 年量产上市HBM4。在2025财年第二季度财报电话会议上,美光总裁兼首席执行官Sanjay Mehrotra宣布这项计划。他表示,与HBM3E相比,美光的HBM4可将带宽提高60%以上。


热门推荐
专属顾问 1对1服务

联系电话
13681074969

扫码联系微信
足迹
购物车
快速下单
发布询盘
在线客服