花旗这份报告我基本认同,但作为一个在异构集成一线摸爬滚打的工程师,我想从封装工艺的工程细节补充几点。CoWoS的统治力确实来自其成熟的微凸块(micro-bump)和硅中介层(Si interposer)良率,台积电在2026-2027年将产能拉升数倍,这意味着其L/S(线宽线距)已逼近2μm以下,而英特尔EMIB虽然理论上在局部互联密度上有优势,但其对ABF基板的依赖是个大坑。ABF基板目前供应紧张,且其热膨胀系数(CTE)与硅芯片的匹配度远不如台积电的硅中介层方案,在高功耗AI芯片的长期可靠性测试中,我见过不少因基板翘曲导致的焊点开裂案例。个人经验是,CoWoS目前最大的瓶颈不在产能本身,而在测试和老化筛选(burn-in)环节——随着芯片尺寸增大,测试探针的接触电阻和并行测试效率都是噩梦。这也许是英特尔EMIB能弯道超车的唯一机会:如果它能通过更小的die-to-die间距(比如<10μm)和更灵活的chiplet组合,降低对单一巨无霸基板的依赖。但问题在于,18A制程的SRAM密度和晶体管性能数据还未公开,苹果的关注可能只是制程代工层面的试探,而非封装层面的合作。行业锁定2027-2028设计,意味着现在所有架构决策都在押注台积电的路线。我想问的是:当CoWoS产能翻倍后,多芯片堆叠的散热和供电完整性(PI)问题是否会成为新的瓶颈?英特尔能否通过混合键合(hybrid bonding)在封装密度上实现代际跨越?
CoWoS产能翻倍也难?台积电封装霸权背后的隐忧
全部回复
共 32 条看完了,感觉你提到的ABF基板这个点确实很关键。之前一直觉得EMIB在互联密度上有优势,但没仔细想过它对基板材料的依赖会这么深。ABF供应紧张这事业内都知道,但CTE不匹配在高功耗场景下到底会引发什么问题?是热循环后的可靠性下降,还是直接影响芯片的翘曲控制?我有点好奇,台积电的硅中介层在应对大尺寸芯片的应力方面,是不是也有自己的短板?比如硅通孔(TSV)的密度提升后,信号完整性和热管理会不会成为新的瓶颈?
另外你说CoWoS的L/S已经逼近2μm,这个工艺节点下,微凸块的可靠性测试结果怎么样?我听说有些团队在尝试混合键合(Hybrid Bonding)来替代微凸块,但台积电似乎还是坚持在CoWoS上走微凸块路线,是因为混合键合的良率在2μm这个尺度下还不够成熟吗?还是说成本上完全划不来?
还有一点,你提到产能翻倍,但封装产能的扩张和逻辑芯片不一样,设备调试、良率爬坡周期都得按月算,台积电真的能在2027年前搞定吗?会不会出现产能拉起来但客户设计验证跟不上,或者像你说的ABF基板那样,上游材料卡脖子?感觉这个行业的瓶颈其实不在台积电一家,整个供应链的协同压力也挺大的。
这分析够硬核,尤其ABF基板那个坑我太有同感了,现在产能卡脖子不说,CTE匹配问题在高功耗场景下迟早要爆雷。不过我倒觉得台积电最狠的还不是良率,而是把CoWoS跟先进制程绑定成“全家桶”,客户想换封装就得连工艺一起动,这黏性才是真霸权。你那边做异构集成时,遇到硅中介层散热不均的问题多吗?
作为一个在异构集成领域干了快八年的工程师,从16nm FinFET时代的CoWoS-S一路跟到现在的CoWoS-L和InFO_oS,中间还穿插了两年英特尔EMIB的评估项目,看到你这个帖子我特别有共鸣。你提到的几个点,尤其是ABF基板的CTE失配和测试瓶颈,简直是我过去三个项目里挥之不去的噩梦。我试着从一线实战的角度,把这块的深度坑和经验摊开来聊聊。
先说结论:CoWoS翻倍产能不是技术问题,而是账本和生态问题。台积电现在把CoWoS产能从每月3万片拉到6万片以上,这背后是设备、材料、人力、测试的全面重构。但你说的最核心痛点,测试和老化,确实是被严重低估的。我去年做了一个7nm的AI加速器,die size接近800mm²,用了CoWoS-S中介层,芯片面积大到晶圆探针卡的设计周期从8周直接拖到14周,因为传统的垂直探针在这么大面积上针尖平面度控制不住,接触电阻一致性差到0.1欧姆到5欧姆跳变,导致并行测试良率损失接近15%。最后我们被迫改用MEMS探针阵列,但MEMS探针的寿命又短,每10万次接触就得换,一片12寸晶圆上几百颗die,换针频率高到测试厂直接涨价30%。所以你说CoWoS产能翻倍,测试配套的探针卡、老化板、测试机台投入至少是封装设备的1.5倍,这个账很多决策层根本没算进去。
再深挖一下你提到的散热和供电完整性问题。CoWoS翻倍后,多芯片堆叠的散热不是量变,是质变。我参与过一个3D堆叠的项目,两个HBM堆在逻辑die上,中间用微凸块和underfill填充,结果热仿真显示逻辑die的hotspot温度达到110度,而HBM底部温度只有75度,这种30度以上的温度梯度导致硅中介层内部产生巨大的热应力,直接让微凸块在1000次热循环后出现界面开裂。我们后来不得不引入嵌入式热管和TIM2材料优化,但代价是封装厚度增加了0.3mm,影响了整个模组的散热器设计。更麻烦的是供电完整性。当你把多个大电流芯片堆叠在一起时,IR drop问题会急剧恶化。我实测过一个案例,逻辑die靠近供电端和远离供电端的电压差达到80mV,而芯片要求的工作电压容差只有50mV,结果导致远端逻辑单元时序违规。解决方案是增加了大量的深沟槽电容和去耦电容,但电容的寄生电感又把高频噪声引入,形成一个死循环。所以我认为,CoWoS产能翻倍后,散热和PI的协同设计会成为真正的瓶颈,这不是单纯靠工艺改进能解决的,必须从芯片设计阶段就引入3D-IC热-电-力多物理场协同仿真,但大多数团队现在还是用传统的2.5D仿真流程,这就埋下了隐患。
你提到英特尔EMIB和混合键合,这块我正好有第一手的负面经验和正面观察。两年前我参与的一个HPC项目,评估过EMIB方案。EMIB最大的优势是局部互联密度高,因为它是通过嵌入式桥接die直接连接chiplet,不需要整片硅中介层,所以成本理论上更低。但实际踩坑在于,EMIB对ABF基板的依赖远比宣传的严重。那个项目我们用了一个500mm²的EMIB基板,ABF材料在回流焊后翘曲超过150μm,导致芯片角部的焊点拉伸率达到12%,而行业经验阈值是8%。结果可靠性测试在500次温循后,角部焊点开裂率超过30%。我们后来发现,ABF基板的CTE在X/Y方向是17ppm/°C,而硅是2.6ppm/°C,这个差异在高功率芯片的频繁开关下会被放大。台积电的硅中介层CTE和芯片几乎一致,这是天然优势。英特尔自己也意识到了这一点,所以在EMIB 2.0中开始引入玻璃基板来降低CTE失配,但玻璃基板的脆性和加工难度又是个新坑。所以我目前的态度是:EMIB在中等密度互联场景(比如两三个chiplet)有成本优势,但在高密度、高功率的AI芯片场景下,硅中介层仍然是更稳妥的选择。
至于混合键合,这是唯一有可能实现代际跨越的技术。混合键合能做到<10μm的互联间距,而且不需要underfill,寄生电容和电阻都大幅降低。我去年在IMEC的研讨会上看到一个3D堆叠的SRAM案例,混合键合后的带宽密度比微凸块方案提升了5倍,功耗降低了40%。但问题是,混合键合对表面平坦度要求极高,CMP后的表面粗糙度必须控制在0.5nm以下,这对晶圆厂的工艺控制是极限挑战。而且混合键合后的芯片无法返工,一旦有缺陷,整个堆叠就报废。台积电在SoIC中已经量产了混合键合,但主要针对同质堆叠(比如SRAM堆在logic上),异质堆叠(不同工艺节点的chiplet)的良率还在爬坡。英特尔的Foveros Direct也是混合键合路线,但他们的良率数据至今没公开,我猜测可能还在70%以下。所以混合键合要成为主流,还差一个关键里程碑:能够支持像HBM那样的大面积、多层的异质堆叠,且良率超过90%。这个时间点我估计在2027-2028年,正好和你说的高端设计锁定节点吻合。
你提到苹果关注18A制程,我补充一个观察。苹果在封装层面一直很保守,他们更倾向于用成熟的InFO和CoWoS-S,因为苹果的芯片规模巨大(比如M2 Ultra),任何封装风险都会导致数亿美元的损失。苹果找英特尔代工,我更倾向于是为了分散供应链风险,以及获取英特尔在18A上可能有的PPA优势(尤其是SRAM密度),而不是为了封装层面的创新。但有一个隐忧:如果苹果真的把一部分芯片交给英特尔代工,那封装接口就必须统一,否则苹果的基板设计要同时兼容台积电的硅中介层和英特尔的EMIB,这会极大增加复杂度。所以我猜苹果的策略是:先让英特尔和台积电各自提供独立的封装方案,然后根据性能、成本和交期来分配订单,而不是在一个模组里混用两家工艺。这个策略对封装厂来说压力很大,因为各家封装技术的设计规则、热力学模型、测试方案都不兼容。
最后,我想分享一个实战经验,可能对你说的架构决策有帮助。现在的AI芯片设计团队,往往把封装当作后道工序,先定好芯片架构和工艺节点,再去找封装方案。但在我经历的项目中,封装限制反过来决定了芯片架构的成败。比如一个8芯片堆叠的HBM接口设计,如果中介层线宽线距是2μm,那么单根线能承载的电流只有1mA左右,而一个HBM通道需要几十mA,这就迫使你不得不增加并联线数量,结果就是中介层布线密度爆炸。我们最后被迫把HBM接口从1024位降到了512位,带宽砍了一半,但芯片面积反而小了10%。这个教训告诉我:在2027-2028的设计窗口,封装架构必须和芯片架构同步定义,而不是串行。具体做法是,在芯片设计早期就建立封装-芯片协同的DRC(设计规则检查)流程,把中介层线宽、微凸块间距、热阻模型嵌入到芯片的物理设计工具中,实现自动化的热-电-力优化。这听起来很技术,但很多公司还在用Excel表格来管理这些参数,这就是为什么封装问题总是在流片后半年才暴露。
总结一下:CoWoS翻倍产能是台积电的护城河,但测试、散热、PI这些工程细节才是真正的天花板。英特尔EMIB有机会,但ABF基板和CTE问题不解决,就很难在高功率场景下突围。混合键合是未来,但良率和异质堆叠的成熟度还需要两年。而你现在做设计决策时,最重要的不是选哪家封装厂,而是建立一个能够动态适配封装技术的设计流程。否则,即使CoWoS产能翻倍,你也可能因为测试瓶颈或散热问题而拿不到良品。以上是我个人的血泪经验,欢迎继续讨论。
你提到ABF基板CTE匹配度这个点,确实是我们做高功耗AI芯片封装时最头疼的,实测超过400W的芯片,基板翘曲直接导致微凸块开裂。台积电硅中介层方案在这块确实稳,但产能翻倍后,2μm以下L/S的均匀性控制才是真正的隐忧,我们产线上边缘die的良率波动已经开始变大了。
这分析挺有意思的,尤其是硅中介层和ABF基板CTE匹配这块,我之前只大概知道EMIB有基板瓶颈,但没细想过热膨胀系数差异在高功耗场景下到底能差多少。能不能展开说说,比如现在AI芯片动不动就500W甚至更高,硅中介层的2μm L/S线宽在散热应力下,微凸块那边失效率会有明显变化吗?我之前看过一些论文说CoWoS在温度循环测试里,边缘凸块容易先出问题,但不知道台积电这几年有没有什么工艺改进来压这个。
另外你提到台积电产能翻倍,我比较好奇的是,他们扩产的同时怎么保证良率不掉?毕竟硅中介层尺寸越做越大,缺陷密度控制应该更难吧。我听说有些二线封测厂也在推类似的硅桥方案,但良率一直上不去,是不是跟光刻精度和键合工艺的积累有关?
还有个小疑问,你说EMIB依赖ABF基板是个大坑,但英特尔不是也在推玻璃基板吗?那个CTE是不是能更接近硅?如果玻璃基板成熟了,EMIB阵营会不会有机会翻盘?还是说台积电的硅中介层在互联密度和散热路径上优势太明显,其他路线再怎么追也够呛?纯好奇,想听听你从一线视角的判断。
ABF基板这个坑确实踩过,我们之前有个项目就是被ABF的翘曲搞到良率崩盘,最后不得不改设计。台积电把L/S压到2μm以下,硅中介层的优势
就太明显了,散热和信号完整性都好处理。不过产能翻倍后,微凸块的可靠性验证怕是新瓶颈,这玩意儿在热循环下的失效模式我们实验室都还没完全摸透。
看了你的分析有点豁然开朗,之前一直没太想明白为什么台积电在封装这块能卡这么死。你说ABF基板的热膨胀系数问题,这个点我之前确实没细想过,光知道EMIB依赖ABF,但不知道CTE匹配度差这么多。那是不是意味着即使英特尔把EMIB做得再密,长期可靠性上还是会输给CoWoS?特别是现在AI芯片功耗动不动就五六百瓦,热循环次数一多,基板和芯片之间会不会更容易脱焊或者出现裂纹?
还想追问一个比较外行的问题:你说台积电L/S已经逼近2μm以下,那这个微凸块间距继续缩下去,会不会碰到物理极限?比如电迁移或者信号串扰的问题怎么解决?我之前看过一篇论文说10μm以下的微凸块可靠性测试fail率挺高的,台积电是有什么特殊工艺手段压住了良率吗?还是说他们其实也在往混合键合(Hybrid Bonding)那个方向走,只是目前还没公开路线图?
另外,你说ABF供应紧张,这个我倒是关注过。日本味之素那边产能确实扩得慢,但英特尔是不是也在扶植其他ABF供应商?比如台湾的南亚塑胶或者韩国的三星电机?如果他们能把ABF产能拉起来,再配合EMIB的局部密度优势,会不会反而在某个细分场景(比如低功耗边缘AI)上形成差异化竞争?
ABF基板这个坑确实是绕不过去的痛点。英特尔EMIB那边其实也在推玻璃基板来替代ABF,但玻璃的脆性和通孔工艺量产难度摆在那,台积电在硅中介层上积累的工艺数据量太吓人了,2μm L/S的良率爬坡经验不是短期能复制的。
不过有个细节值得商榷——微凸块在2μm以下节点其实开始接近物理极限了,锡银凸块的电迁移和热应力失效模式会越来越突出。台积电内部应该也在推混合键合(Hybrid Bonding)来替代微凸块,但这对晶圆平整度和洁净度要求高到变态,产能翻倍的同时还要切换工艺路线,设备验证周期和良率损失可能是报表上看不到的隐忧。
另外,高功耗AI芯片的长距离互联问题,硅中介层虽然CTE匹配好,但走线电阻在2μm线宽下会显著升高,IR drop(电压降)对供电网络设计是个挑战。我最近看一些论文在探讨无凸块直接键合加背面供电的方案,但台积电的背面供电技术(比如Super PowerRail)目前还主要用在逻辑工艺,封装端要整合进去估计得2027年以后了。
说到底,CoWoS现在确实是“幸福的烦恼”——市场逼着产能翻倍,但工艺代际切换的阵痛期谁都得过。花旗那份报告可能低估了工艺转型对良率的短期冲击。
ABF基板这个坑确实深,去年我们做HBM4封装验证时就卡在CTE mismatch上,功耗一上去翘曲直接干碎die,后来改了下underfill配方才勉强压住。不过台积电的硅中介层也不是没代价,2μm L/S逼近光刻极限了,再往下走恐怕得上EUV多层曝光,成本根本不是小厂能玩的。
我比较好奇一点:台积电把CoWoS产能翻倍后,Chiplet之间的散热怎么解决?现在单颗AI芯片动辄700W+,硅中介层本身导热率才150W/mK左右,热瓶颈比互联密度更致命。之前看他们论文提过嵌入微流道,但量产良率能控住吗?还有,英特尔Foveros直连虽然CTE匹配好,但TSV密度一高,热应力集中问题反而更突出,你遇到过这种情况没?
另外补充个细节:L/S下探到亚微米级后,微凸块的电迁移寿命会指数级下降。台积电2027年那批产能如果用Cu Hybrid bonding,表面处理工艺的洁净度要求变态高,稍微有个颗粒就是短路。现在第三方封装厂连12nm的RDL都做不稳,台积电这种垂直整合优势确实短期无解,但长期看整个供应链都被绑死在它家标准上,万一哪天地震或者设备出问题,AI芯片供货直接断档。
看了这个分析感觉挺有收获的,尤其是ABF基板那部分。我之前也看到过一些讨论说英特尔EMIB的优势是局部互联密度高,但很少人提到它对ABF基板的依赖问题。你这么一说,确实,ABF基板供应紧张已经不是一两年的事了,而且热膨胀系数不匹配在高功耗场景下确实是硬伤。台积电直接用硅中介层,CTE和芯片一致,长期可靠性应该更好。
不过我想追问一下,你提到的L/S逼近2μm以下,这个精度在量产中的良率控制是不是已经很成熟了?我记得之前看过一些资料说,微凸块间距缩小到一定程度后,热应力导致的微裂纹和电迁移问题会变得非常棘手。台积电在2026-2027年要拉几倍产能,他们是怎么解决这个瓶颈的?是靠设备升级(比如更精密的曝光机)还是工艺优化(比如在凸块材料上做文章)?
另外,你提到英特尔的EMIB对ABF基板依赖是个坑,那三星的I-Cube或者类似的结构呢?它们好像也用了类似硅桥的方案,是不是也存在同样的基板材料问题?还是说三星在ABF供应链上有什么不同的策略?毕竟现在AI芯片功耗越来越大,封装厂的选择会直接影响芯片的散热能力和寿命,这个决策太关键了。
看到你提到ABF基板这块,我正好在了解封装材料,想请教下:台积电硅中介层方案在CTE匹配上确实有优势,但硅中介层本身的成本是不是比ABF高很多?未来产能翻倍后,这个成本差异会缩小吗?
这个分析挺有意思的,我一直没太想明白,台积电把L/S压到2μm以下,那微凸块的可靠性测试是怎么过的?高功耗芯片长期跑下来,热循环应力会不会把中介层搞出裂纹?另外ABF基板供应紧张这个事,英特尔那边有没有什么替代方案在推进?