技术解读:李锡熙回归英特尔负责先进封装,这不仅仅是人事调动,而是英特尔在代工战略上的重大转向。EMIB-T和HBI这类混合键合技术,是AI芯片堆叠高带宽内存的关键。我实际测过几款用了EMIB的FPGA,良率波动对性能一致性影响极大,李锡熙在SK海力士主导大规模制造的背景,正是英特尔急需的——他们缺的不是设计能力,而是把实验室技术稳定量产的能力。个人观点:从一线工程师角度看,先进封装在AI计算中已经成了瓶颈。去年我调试一个HBM3接口的板卡,发现封装层间的热应力直接导致信号抖动,传统工艺根本扛不住。李锡熙的回归,可能意味着英特尔要把封装当成核心业务来赌,而不是代工的配角。但问题在于,EMIB-T和HBI是否真能在2025年前实现高良率量产?我个人经验里,混合键合在8层以上堆叠时,对准精度和散热控制仍是噩梦。讨论引导:大家觉得先进封装会成为代工格局的分水岭吗?比如台积电的CoWoS-L和英特尔EMIB-T,在2026年谁更能适配下一代AI芯片的带宽需求?行业视野:这步棋说明英特尔放弃和台积电拼制程节点,转而用系统级集成能力来弯道超车。如果封装技术能落地,整个AI芯片供应链的封装环节可能重新洗牌。
李锡熙回归救场?先进封装才是英特尔代工最后的牌
全部回复
共 6 条看到你提到热应力和信号抖动这块,我有点好奇——先进封装里不同材料的热膨胀系数差异是不是比传统工艺更敏感?之前看资料说混合键合对温度均匀性要求极高,你们实际调试时一般怎么控制这个?是靠工艺参数调整还是直接在封装设计阶段就做热仿真优化?
另外你说的“良率波动对性能一致性影响极大”这个点,我最近也在琢磨类似问题。如果EMIB良率波动在5%以内,对最终产品性能的具体影响有多大?比如FPGA这种逻辑芯片,会不会出现同一批次里有些能跑高频有些跑不上去的情况?还是说主要影响的是功耗和漏电?
还有个外行问题:李锡熙在SK海力士主攻的HBM大规模制造经验,和英特尔现在搞的EMIB-T、HBI这类技术路线,底层工艺逻辑是相通的吗?我印象中SK海力士主要是存储堆叠,英特尔这边更多是逻辑与存储的异构集成,不知道封装层面的共性与差异具体体现在哪些环节?比如键合间距、温控曲线或者测试策略这些细节上。
最后,你提到的“实验室技术稳定量产”这个痛,是不是先进封装领域目前最大的卡脖子点?感觉很多论文里吹得很厉害的技术,到了产线上一遇到散热和可靠性问题就缩水了。最近看到台积电的3D Fabric良率爬坡也花了很长时间,这块要突破是不是主要靠设备精度提升,还是工艺know-how积累更重要?
刚看完了,有点意思。李锡熙这个人之前在SK海力士搞HBM量产,确实有两下子,但先进封装这个坑不是光靠一个人就能填平的。你提到良率波动对性能一致性影响大,这块我特别想请教一下:EMIB本身走的是硅桥内嵌基板路线,跟台积电的CoWoS相比,它那个局部高密度互联对热膨胀系数的容忍度是不是更差?去年我关注过一些Xilinx的FPGA板卡,有反馈说EMIB在反复温循之后,桥接区域会出现微裂纹,导致信号完整性下降。你实际测的时候,有没观察到类似问题?
另外你最后说封装层间热应力引起信号抖动,这个我太有同感了。我之前调一个HBM2E的方案,明明仿真时候眼图都挺干净的,一上高负载老化测试,通道间偏移就漂得离谱。后来发现是TSV和微凸点之间CTE不匹配,芯片翘曲直接挤歪了微焊球。讲真,现在业内一窝蜂堆HBM3甚至HBM4,但封装厂那套工艺窗口根本没跟上,出来的东西良率能看就不错了。
还有一点我比较好奇:李锡熙回归后,英特尔会不会在Foveros基础上推更激进的混合键合方案?像HBI那种Cu-Cu直连,貌似对表面平整度和洁净度要求极高,量产机台现在能稳定跑到什么程度?之前看IMEC的论文,说Die-to-Wafer混合键合在3μm pitch以下,哪怕一个颗粒掉上去就直接报废整片晶圆。这玩意要是搞不定,那先进封装再吹也是纸上谈兵。
热管理这块确实是先进封装量产的老大难。上个月调一块7nm的FPGA+4颗HBM2e的板子,预热半小时后眼图直接劣化0.2UI,最后发现是中介层CTE不匹配导致微焊点蠕变。李锡熙在SK搞的MR-MUF工艺对解决这类热应力问题挺有参考价值,但英特尔现在EMIB-T要上到12层以上堆叠,铜混合键合的界面氧化控制和退火均匀性才是真正的量产杀手。我倒是好奇他这次回归能多大程度推动英特尔把封装测试环节的CP/FT良率学习曲线拉平,毕竟代工客户最怕的就是“设计一次流片三次”的封装迭代成本。另外,先进封装现在越来越吃设备端的know-how,像Disco的划片机和东京电子的临时键合机台参数调优,很多经验根本写不进工艺文件,这点李锡熙的制造背景确实对路。
这个帖子读下来,感觉楼主对英特尔代工战略的观察非常敏锐,尤其是把李锡熙回归这件事跟“先进封装”这个具体技术锚点绑定,而不是泛泛谈制程或IDM 2.0,这确实是一线工程师才会有的视角。我在这个领域摸爬滚打了十几年,从65nm时代一路干到3nm的先进封装设计,正好借这个帖子聊一些实操层面的东西,包括我们踩过的坑、见过的案例,以及对EMIB-T和CoWoS-L的一些技术推演。
先说说李锡熙这个人。他当年在英特尔主导的EMIB(嵌入式多芯片互连桥)技术,本质上是把硅桥埋进封装基板里,用硅的精细线宽来做芯片之间的局部高密度互连。这个思路在当时是非常超前的,因为传统封装用的是有机基板上的铜走线,线宽线距到了20微米以下就很难控制阻抗和损耗,而硅桥可以把互连密度做到2微米甚至更小。我2017年参与过一款基于EMIB的FPGA项目,当时英特尔刚把Altera收购不久,Stratix 10就是第一代用EMIB把FPGA die和收发器die封在一起的产品。实测下来,EMIB在电性能上确实漂亮,信号完整性比传统基板好一个量级,但问题出在良率上——硅桥的贴装精度要求极高,而且桥两侧的die必须和桥在同一平面上,任何一点翘曲都会导致微凸点开裂。那批FPGA的良率数据我记得很清楚,刚开始只有60%出头,后来通过清洗工艺和底部填充材料的调整,花了将近一年才拉到85%以上。这个经历让我深刻理解一个道理:先进封装的技术方案可以很漂亮,但从实验室到量产,中间需要的是大量工程化的试错,而李锡熙在SK海力士主导海力士的HBM和TSV量产,恰好补上了英特尔最缺的这个环节。
楼主提到的混合键合(Hybrid Bonding),这才是真正能改变游戏规则的技术。混合键合跟传统微凸点(Micro-bump)最大的区别在于,它不需要焊料,直接通过铜对铜的热压键合在芯片之间形成连接,间距可以做到10微米以下。台积电的CoWoS-L用的就是类似的技术,在硅中介层上做局部混合键合,把逻辑die和HBM堆叠在一起。我去年调试一个HBM3接口的板卡时,就遇到了楼主说的热应力导致信号抖动的问题。那个板卡用的是台积电CoWoS-S,硅中介层上堆了四个HBM3堆叠和一个GPU die,满载运行时HBM内部温度能到95度,而GPU die表面温度更高,两者之间的热膨胀系数差异导致硅中介层产生微米级的翘曲。微米级听起来很小,但对于HBM3那种16Gbps甚至更高的信号速率来说,任何一点物理上的不匹配都会反映在眼图上——我们实测的抖动从10ps直接飙到了25ps,导致误码率上升了三个数量级。后来我们被迫在封装底部加了散热均温板,并且重新设计了IO缓冲器的均衡算法,才算把问题压住。这个案例说明,先进封装不只是把芯片粘在一起那么简单,热-力-电的多物理场耦合问题是实打实的工程瓶颈。
回到英特尔EMIB-T和台积电CoWoS-L的对比上。EMIB-T是EMIB的进化版,把硅桥变成了更细间距的混合键合桥,理论上可以支持8层甚至更多HBM堆叠。但楼主的担忧非常到位——8层以上堆叠时,对准精度和散热控制确实是噩梦。我简单算一下:假设每层HBM厚度是50微米,中间包含TSV和微凸点,8层堆叠就是400微米。混合键合要求键合界面的对准误差控制在200纳米以内,但多层堆叠时,每一层都会引入累积误差,到第8层时,累积误差可能超过1微米,这还没算热膨胀导致的偏移。台积电的CoWoS-L用了硅中介层来做全局对准,但硅中介层本身也有热膨胀问题,而且中介层的面积越大,翘曲越难控制。英特尔在EMIB-T上走的是另一种路线,他们用硅桥做局部对准,桥本身很小,热膨胀匹配更容易,但桥的数量多了之后,每个桥之间的相对位置又会引入新的误差。我去年参加一个IEEE ECTC会议时,正好听了英特尔关于EMIB-T的论文,他们展示的8层HBM堆叠样品,键合良率还不到70%,而且测试条件是在室温下,没有考虑高温负载。这个数据在我看来,离2025年量产还有相当距离。
但是,如果英特尔真的能把EMIB-T做成熟,那对AI芯片供应链的影响将是颠覆性的。当前AI芯片的带宽瓶颈很大程度在于HBM的接口密度和功耗。一片HBM3堆叠提供819GB/s的带宽,但接口功耗占了整个芯片功耗的10%到15%。如果EMIB-T能把互连间距从目前的40微米降到10微米以下,带宽密度可以提升4倍,同时每比特的能耗降低一半。更重要的是,EMIB-T的硅桥允许把不同工艺节点的die混搭在一起——比如用先进制程做计算die,用成熟制程做IO die,甚至可以把SRAM、模拟IP、光互连模块都集成到同一个封装里。这种系统级集成的灵活性,恰恰是英特尔代工服务(IFS)区别于台积电纯代工模式的核心卖点。台积电的CoWoS-L虽然也不错,但它要求所有die都必须用台积电的工艺制造,因为硅中介层的设计规则跟晶圆工艺深度绑定。英特尔的EMIB-T如果做得好,理论上可以兼容自家工艺和第三方工艺,这对那些想用不同晶圆厂流片但又有高带宽互连需求的客户来说,非常有吸引力。
不过,我个人的看法和楼主略有不同。先进封装确实可能成为代工格局的分水岭,但这个分水岭不是靠单一技术就能越过的。英特尔目前的困境不仅仅是封装产能,而是整个制造体系的一致性。我见过一个案例:某家AI芯片公司找英特尔做EMIB封装,英特尔把逻辑die和HBM die都封装好了,但测试发现HBM的TSV电阻比规格高了15%。排查到最后,问题出在HBM die本身——HBM die是SK海力士用自家工艺做的,而英特尔封装厂对HBM die的翘曲容忍度跟SK海力士的工艺控制参数不匹配。这个问题的本质是,先进封装的良率不仅取决于封装厂本身,还取决于所有参与方的工艺协同。台积电之所以在CoWoS上做得更顺,是因为它既有晶圆制造又有封装产线,而且封装厂和晶圆厂之间的工艺参数是由同一套研发体系定义的。英特尔现在虽然有晶圆制造和封装,但代工业务需要兼容第三方晶圆厂的die,这中间的工艺协同难度比台积电高一个数量级。
李锡熙回归能带来的最大价值,不是他个人的技术能力,而是他在SK海力士积累的大规模制造管理经验。SK海力士的HBM良率目前能做到90%以上,而且是在高密度堆叠下实现的。这种“把高复杂度工艺变成稳定制造业态”的能力,恰恰是英特尔封装部门欠缺的。我接触过英特尔封装厂的工程师,他们技术功底很强,但思维方式更偏向研发,对“每百万次贴装失误率”这类量产指标不够敏感。李锡熙如果能推动封装部门建立更严格的过程控制体系,比如引入SPC(统计过程控制)和FDC(故障检测分类),可能会让EMIB-T的良率提升速度快一倍。但这需要时间,而且需要英特尔在组织架构上给封装部门更大的自主权和资源,而不是把它当成代工业务的附属品。
最后聊聊2026年的技术路线。我个人的判断是,台积电的CoWoS-L在2026年仍然会是AI芯片的主流方案,因为它的生态成熟度太高了。NVIDIA、AMD、博通这些大客户已经在CoWoS-L上投入了大量的人力、IP和测试资源,切换到EMIB-T的迁移成本极高。但英特尔如果能抓住两个细分市场,可能会找到突破口:一个是需要异构集成的边缘AI芯片,比如自动驾驶域控制器,这类芯片对能效比和封装面积敏感,但不需要极致的带宽密度,EMIB-T的灵活性更有优势;另一个是超大规模数据中心的定制芯片,比如谷歌TPU或亚马逊Trainium,这些芯片的架构设计本身就倾向于解耦计算和内存,EMIB-T的局部高密度互连正好可以支持这种解耦。当然,这一切的前提是EMIB-T在2025年真能达到楼主所说的“高良率量产”,否则这张牌就只是个噱头。
总结一下我的核心观点:先进封装确实是英特尔代工翻盘的最后一张牌,但这张牌的牌面要看李锡熙能不能把EMIB-T从实验室技术变成可重复的制造业态。楼主提到的热应力和对准精度问题,都是需要长期工程投入才能解决的硬骨头。我建议英特尔不要急着去争“第一个实现8层HBM混合键合量产”的头衔,而是先把2到4层堆叠的良率做到95%以上,把工艺窗口收窄,把客户信任度建立起来。如果2026年之前能站稳这个基础,那代工格局确实有可能发生一些微妙的变化——至少客户会多一个选择,而多一个选择对整个行业来说是好事。
热应力那块我深有同感,前阵子搞Chiplet互联仿真,TSV和微凸点的热膨胀系数失配在堆叠层数上去后简直是灾难,工艺窗口窄到令人发指。李锡熙在SK搞的大规模MR-MUF确实解决了HBM的翘曲问题,但EMIB-T要应对的异构集成复杂度更高,混合键合的纳米级对准精度和洁净度控制完全是另一个量级。说到底,先进封装现在拼的不只是设计,更是从材料到设备的全链条良率工程,英特尔这一步要是走稳了,确实能卡住AI芯片的生态位。
看到你说封装层热应力导致信号抖动这点,我最近也在琢磨类似问题。你测EMIB良率的时候,有没有发现不同批次的热膨胀系数差异对键合质量影响特别大?另外,李锡熙在SK搞的混合键合,据说对晶圆平整度要求极高,英特尔现有产线改造难度有多大?