花旗这份报告我基本认同,但作为一个在异构集成一线摸爬滚打的工程师,我想从封装工艺的工程细节补充几点。CoWoS的统治力确实来自其成熟的微凸块(micro-bump)和硅中介层(Si interposer)良率,台积电在2026-2027年将产能拉升数倍,这意味着其L/S(线宽线距)已逼近2μm以下,而英特尔EMIB虽然理论上在局部互联密度上有优势,但其对ABF基板的依赖是个大坑。ABF基板目前供应紧张,且其热膨胀系数(CTE)与硅芯片的匹配度远不如台积电的硅中介层方案,在高功耗AI芯片的长期可靠性测试中,我见过不少因基板翘曲导致的焊点开裂案例。个人经验是,CoWoS目前最大的瓶颈不在产能本身,而在测试和老化筛选(burn-in)环节——随着芯片尺寸增大,测试探针的接触电阻和并行测试效率都是噩梦。这也许是英特尔EMIB能弯道超车的唯一机会:如果它能通过更小的die-to-die间距(比如<10μm)和更灵活的chiplet组合,降低对单一巨无霸基板的依赖。但问题在于,18A制程的SRAM密度和晶体管性能数据还未公开,苹果的关注可能只是制程代工层面的试探,而非封装层面的合作。行业锁定2027-2028设计,意味着现在所有架构决策都在押注台积电的路线。我想问的是:当CoWoS产能翻倍后,多芯片堆叠的散热和供电完整性(PI)问题是否会成为新的瓶颈?英特尔能否通过混合键合(hybrid bonding)在封装密度上实现代际跨越?
CoWoS产能翻倍也难?台积电封装霸权背后的隐忧
全部回复
共 32 条看了这篇分析,有个地方特别想请教一下——你说ABF基板的热膨胀系数跟硅芯片匹配度不如硅中介层,这个差异在高功耗AI芯片长期跑负载的时候,具体会带来什么可靠性问题?是界面应力导致微凸块开裂,还是会影响翘曲控制进而影响良率?我最近刚接触封装这块,看到有些资料说台积电也在推无凸块的混合键合(Hybrid Bonding)技术,这个跟CoWoS的micro-bump路线相比,除了间距能更小,在热管理上是不是也有优势?毕竟AI芯片功耗动不动就500W+,中介层本身会不会变成额外的热阻?另外你提到英特尔EMIB依赖ABF基板是个坑,那有没有可能英特尔通过改进基板材料或者优化封装结构来绕过这个问题?还是说这本质上是个物理限制,短期内很难有根本性突破?问题有点多,因为刚好在学异构集成,想把这几个方案的优劣势理清楚。
看到这篇帖子,我忍不住要回一个。作为同样在异构集成圈子里摸爬滚打多年的人,你提到的几个点——ABF基板CTE匹配、测试探针的噩梦、以及2027-2028设计窗口——每一个都像是我过去三年夜班时盯着显微镜看晶圆翘曲的实况转播。先给你点个赞,这不是客套,而是因为能同时把CoWoS的工艺细节和产业节奏挂在一起讨论的人,在论坛里确实不多见。
你帖子里最戳中我痛点的是那个测试和老化筛选环节。你说得对,CoWoS产能翻倍后,真正的瓶颈不在前道的微凸块和硅中介层,而在后道的良率测试和burn-in。我去年参与的一个HPC项目,芯片尺寸接近800平方毫米,采用CoWoS-S封装,客户要求全速老化测试。结果呢?探针卡的针尖在100微米间距的微凸块上接触电阻波动达到30%以上,而且由于芯片功耗接近500W,老化测试时温度梯度造成的中介层应力直接导致三个样品在测试中途出现了微裂纹。这不是个案,是整个行业在向超大尺寸chiplet演进时必须面对的物理极限。台积电虽然在中介层良率上做到了99.5%以上,但封装级测试的并行效率却卡在60%左右——因为探针卡的设计必须兼顾信号完整性和机械寿命,而现有的MEMS探针在应对2μm L/S的微凸块时,针尖磨损速度已经快于想象。我建议团队转向垂直探针卡配合局部加热的测试方案,但这又带来了热机械应力的问题,至今没有完美的工程解。
关于你提出的散热和供电完整性(PI)瓶颈,我补充一个实际案例。今年初我接触过一个采用CoWoS-L方案的多芯片堆叠设计,HBM和计算die之间通过硅桥互联,但散热路径极为复杂。核心计算die的热流密度突破了350W/cm²,而中介层下方的TSV(硅通孔)在传输大电流时产生了显著的焦耳热,导致顶部芯片的结温在满负载下比仿真值高了12摄氏度。PI问题同样棘手:当多个chiplet同时切换时,电源分配网络的谐振频率被激发,在2GHz附近的阻抗峰值导致电压跌落超过8%,直接触发了芯片内部的欠压保护。我们的解决方案是引入嵌入式深沟槽电容(eDTC)和背面电源传输(BSPDN),但这两项技术目前只有台积电和英特尔在开发,且量产成本尚未明确。如果你在做2027-2028的设计,建议现在就开始和供应商讨论硅桥的散热片设计,以及中介层上的去耦电容布局,否则后期花在热仿真和PI仿真上的时间会成倍增加。
英特尔EMIB的弯道超车机会,我认为比你预期的要窄。混合键合(hybrid bonding)确实能实现亚10微米的互连间距,理论上可以绕过ABF基板的CTE问题,但实际量产中,混合键合的洁净度要求极高,任何0.1微米的颗粒都会导致空洞,而英特尔在18A上尚未公开其SRAM的良率数据。我见过一个采用类似技术的原型(非英特尔官方产品),其die-to-die互连的良率在初期只有70%,经过六轮工艺优化才达到90%以上,而CoWoS的微凸块方案已经稳定在99%以上。更重要的是,混合键合对芯片的翘曲控制要求比微凸块高一个数量级——当芯片尺寸超过600平方毫米时,即使采用背面研磨和应力补偿层,翘曲也常常超过10微米,而混合键合的工艺窗口通常只有5微米。苹果对英特尔的关注,我更倾向于认为是制程代工的试探,而非封装层面的合作。苹果在M系列Ultra上已经验证了UltraFusion封装(基于硅桥),但那是台积电的InFO-LSI技术,和英特尔的EMIB路线完全不同。库克在供应链上向来不会只押注一家,但台积电在封装上的积累——从CoWoS-S到CoWoS-L再到CoWoS-R,三代演进的经验——英特尔短期内很难复制。
回到你最初的问题,CoWoS产能翻倍后,最大的瓶颈可能不是散热或PI本身,而是测试和可靠性验证的生态。台积电的封装产能扩张主要依赖新厂(比如竹南和苗栗),但测试和老化设备供应商的产能扩张速度明显滞后。我了解的情况是,2025-2026年,全球能提供高并行度、高精度探针卡的供应商只有三家,而且它们的交期已经拉长到18个月以上。如果你在设计2027-2028的产品,建议现在就开始锁定测试设备和老化筛选的产能,而不是只盯着封装厂的产能。同时,考虑采用chiplet的分布式测试策略——在单个芯片级别进行全速测试,再在封装级别进行互联测试,这样可以在不牺牲整体良率的情况下降低测试复杂度。
最后,关于行业锁定2027-2028设计窗口,我完全同意你的判断。这个时间点正好是AI芯片从单die向多chiplet演进的关键阶段,而台积电的CoWoS路线图已经明确到2028年。但我想提醒一点:不要忽视英特尔在Foveros Direct上的进展。虽然混合键合的量产挑战很大,但英特尔在实验室已经实现了亚5微米的键合间距,并且正在开发基于玻璃基板的封装方案,其CTE与硅的匹配度优于ABF基板。如果英特尔能通过玻璃基板解决翘曲问题,同时利用Foveros Direct提高互联密度,那么它在2028年后可能会对台积电构成实质性威胁。不过,这取决于英特尔能否在18A上实现与台积电N3P相当的晶体管性能,以及苹果是否真正愿意将封装业务转移到英特尔——这需要时间验证。
总而言之,你提出的问题触及了异构集成行业最核心的工程矛盾:工艺密度、可靠性测试和供应链生态之间的平衡。CoWoS的统治力确实来自其成熟的微凸块和硅中介层,但产能翻倍后,测试和散热的瓶颈会迫使行业重新思考封装架构。我建议关注三个方向:一是嵌入式电容和背面供电技术的量产进度,二是混合键合在超大尺寸芯片上的翘曲控制方案,三是测试设备供应商的产能扩张计划。如果你有具体的架构设计需要讨论,我们可以进一步展开。
看到你说ABF基板CTE匹配度这块,我有点疑问——台积电硅中介层方案虽然CTE匹配好,但大尺寸硅中介层本身的翘曲和成本问题是不是也随着产能翻倍变得更棘手了?另外想请教,CoWoS把L/S压到2μm以下,对信号完整性和散热的影响你们实际测试下来怎么样?
ABF基板这个坑确实深,去年我们做样片就被CTE不匹配坑过一回,高温循环直接分层。硅中介层这条路台积电走得太稳了,
微凸块良率拉到90%以上,别人想追得先解决材料工艺的物理限制。不过产能翻倍后,2μm以下的光刻均匀性会不会是新瓶颈?
看了这个帖子有点上头,我正好在学先进封装方向的东西,想求教个具体问题。你提到的英特尔EMIB依赖ABF基板这个点,我之前看资料说EMIB的局部互联密度能做到每平方毫米几百个凸点,理论上确实不差,但你说的CTE匹配问题,具体到实际量产环节,是不是意味着在高功耗场景下(比如700W以上的AI芯片),长期可靠性会明显不如CoWoS?我最近在实验室用热循环测试模拟过硅中介层和ABF基板两种方案的应力分布,硅中介层确实稳很多,但台积电把L/S压到2μm以下,微凸块的电流密度会不会是个新瓶颈?我看过几篇论文说,2μm这个尺度下电迁移失效的风险会指数级上升,台积电是怎么在良率和可靠性之间找平衡的?另外,你提到产能翻倍,我好奇的是,台积电要把这么多晶圆厂改造成CoWoS产线,硅中介层的沉积和蚀刻环节设备够用吗?特别是那种大尺寸(比如3倍光罩面积)的中介层,听说对光刻机的套刻精度要求极高,这会不会是产能爬坡的隐形天花板?如果方便的话,能讲讲你在一线看到的实际困难是卡在工艺参数调试上,还是设备交付周期上?感谢!
这个分析挺有意思的,尤其是关于ABF基板那个坑,我之前还真没想那么深。一直以为EMIB主要是互联密度优势,没想到热膨胀系数这个物理限制在功耗上去之后会这么致命。不过有个疑问,台积电L/S压到2μm以下,对光刻机的套刻精度要求得多变态?现有的深紫外能撑住吗,还是说先进封装也要上EUV?另外你说CoWoS产能翻倍,但硅中介层本身面积就大,一片12寸晶圆切不了几颗,这翻倍是不是主要靠堆设备而不是工艺改进?那良率爬坡的压力会不会集中在检测环节,比如微凸块焊接后的空洞率怎么控?我之前看过一些资料,觉得异构集成现在最大的瓶颈反而不是互联密度,而是热管理——你把逻辑、HBM、还有各种小芯片挤在一起,热点密度指数级上升,硅中介层再好导热也就那样,台积电有没有提过嵌入式散热或者微流道之类的方案?还是说现在大客户宁可堆液冷也要硬上CoWoS?
ABF基板这个坑确实深,我们团队去年有个项目就被它卡了三个月,交期一拖再拖,最后不得不降频妥协。你提到CTE匹配度的问题,我深有体会——之前测过一批用EMIB的样品,热循环测试跑到500次左右就开始出现界面开裂,虽然良率还在可接受范围,但用在数据中心那种常年满载的场景下,长期可靠性我真不敢打包票。
不过话说回来,台积电把CoWoS的L/S压到2μm以下,微凸块的电流密度和热应力问题其实也在逼近物理极限。我手头一个3nm的HPC项目,单芯片功耗都飙到600W+了,中介层过孔的通流能力已经开始吃紧,未来再往1.5μm走,电迁移寿命可能会成为新瓶颈。而且产能翻倍要同时保证良率,台积电那套in-house的检测和修复方案虽然强,但设备产能和熟练工艺工程师的培养速度根本跟不上,这波扩产大概率要经历一段良率阵痛期。
另外想请教个实际问题:你们在桥接芯片和主芯片的间距设计上,对微凸块的pitch和高度是怎么权衡的?我们试过把pitch缩到40μm以下,但underfill的流动填充出了问题,空洞率直接飙到5%以上,现在还在找解决方案。
ABF基板这问题确实头疼,去年我们做HPC项目就被CTE mismatch坑过,高温老化直接翘片。不过你提到的2μm L/S,台积电是做到了,但量产一致性还得打个问号,尤其是边缘die的微凸块连接可靠性,不知道你们在实际跑老化测试时有没有遇到随机开路的情况?
ABF基板这个坑确实踩过的人才知道多疼。我们之前有个项目本来想用EMIB,结果ABF交期直接拖了两个月,而且良率波动大得离谱,尤其是大尺寸封装,翘曲问题搞得工艺窗口窄到不行。台积电的硅中介层虽然贵,但至少CTE匹配这块是真省心,高功耗芯片长时间跑下来,焊点疲劳寿命差距肉眼可见。
不过你说CoWoS把L/S压到2μm以下,这个我有点疑问。我接触到的实际量产数据,目前主流还是2μm出头,再往下走,微凸块的电阻和电迁移问题会越来越突出,而且硅通孔(TSV)的深宽比挑战也在那摆着。台积电2026-2027年产能翻倍,我更关心的是他们怎么解决多层中介层的散热问题。现在AI芯片动不动就700W以上,硅的导热能力就那样,光靠微通道冷板也不够,封装内部热点温度压不住的话,翻倍产能可能反而变成翻倍报废率。
另外你提到英特尔依赖ABF,其实他们也在推玻璃基板,但玻璃基板的脆性和与硅的键合工艺目前还不太成熟。我倒是觉得台积电真正的护城河不是技术指标多好看,而是他们能把这么多复杂工艺的良率控制在可量产水平上,这点不服不行。不过话说回来,整个产业链都绑在台积电一家身上,万一哪天封装厂的设备维护周期或者材料出点问题,下游AI芯片厂商得集体跳脚。
ABF基板这个坑确实够深,尤其现在产能还被服务器和交换机吃掉了大半。台积电靠硅中介层把CTE问题压到最低,但代价是成本和设计灵活性受限。我倒好奇,当L/S往亚微米走的时候,微凸块的电迁移和热应力问题会不会成为新的良率瓶颈?毕竟AI芯片功耗密度摆在那。
你提到ABF基板CTE匹配的问题,这个确实很关键。我在想,台积电把L/S压到2μm以下后,硅中介层的散热瓶颈会不会反而更突出?毕竟AI芯片功耗越来越高,硅的导热系数虽然比ABF好,但厚度上去后热阻也不小,有没有考虑过用玻璃通孔或者嵌入式散热通道来缓解?
ABF基板这个坑确实够深,英特尔EMIB的CTE mismatch在高功率场景下可靠性风险不小,台积电靠硅中介层吃透这波红利是必然的。不过CoWoS产能翻倍后,2μm以下的L/S制程均匀性管控才是真挑战,尤其大面积硅中介层的翘曲问题,不知道台积电在2027年的方案里有没有引入新的应力补偿层?
看完帖子忍不住想问个细节问题——你提到台积电的硅中介层方案在CTE匹配上有优势,这个我理解,毕竟硅对硅确实比硅对ABF要稳。但台积电把L/S压到2μm以下之后,微凸块的可靠性会不会成为新瓶颈?我记得之前看过一些论文,当凸块间距缩到一定程度,热循环下的疲劳寿命会指数级下降,尤其是AI芯片那种动不动几百瓦的功耗,热梯度一上来,硅中介层本身会不会反而因为太硬导致应力集中?还是说台积电在underfill材料上有什么独家配方?
另外,你提到英特尔EMIB依赖ABF基板是个坑,但最近不是有消息说英特尔在推玻璃基板吗?玻璃的CTE跟硅更接近,而且平整度比ABF好,如果英特尔真能把玻璃基板量产搞定,是不是能绕开ABF的供应问题,顺便把局部互联密度再往上提一档?还是说玻璃基板目前也只是实验室好看,量产良率还差得远?
最后想请教一下,CoWoS产能翻倍后,那些二线封装厂像日月光、Amkor还有没有机会在异构集成上分一杯羹?毕竟台积电的产能再大也是优先供自家大客户,其他中小芯片设计公司会不会被迫去用更贵的方案,或者只能等台积电产能松动?这问题可能有点小白,但确实很想知道一线工程师怎么看。
你这段工程细节分析太硬核了,尤其是ABF基板那个坑,我最近也在关注。之前看英特尔EMIB的宣传总觉得有点虚,现在听你这么一说,CTE匹配问题在高功耗场景下确实容易炸裂,尤其是AI芯片动不动几百瓦,热循环几次翘曲就够喝一壶的。台积电那个硅中介层虽然成本高,但良率上去了之后,确实比ABF这种外购基板靠谱太多。
不过你提的L/S逼近2μm以下,我有点好奇——微凸块的间距缩小到这种程度,热应力会不会在凸块界面产生新的失效模式?我之前看一些论文,2.5D封装里微凸块在热循环下的疲劳寿命已经是个瓶颈了,再缩间距的话,锡须或者IMC层生长会不会更不可控?还是说台积电已经搞定了新型underfill材料?
另外产能翻倍这事,我倒是觉得台积电真正的隐忧不在工艺本身,而是客户绑定太深。现在英伟达、AMD这些大客户几乎把所有高阶封装需求都押在台积电身上,万一哪天某个客户的芯片设计改架构,不需要那么大面积的硅中介层了,台积电这条重资产产线怎么调头?相比之下英特尔那个EMIB虽然ABF有坑,但胜在灵活,小芯片拼起来不需要整片大硅中介层,对中小客户可能更友好。你觉得台积电会不会被迫开放部分CoWoS产线给第三方设计?还是继续走垂直整合的霸权路线?
ABF基板这个坑确实被你说到痛处了。我们团队去年做过一个项目,本来想试试EMIB的方案省点成本,结果ABF基板的交期和良率直接让进度拖了两个月。尤其是高功耗场景下,CTE mismatch导致的翘曲问题,我们在可靠性测试阶段废了好几批样品,最后不得不切回CoWoS。台积电那个硅中介层虽然贵,但热应力管理确实成熟,2μm以下的L/S良率能稳定在95%以上,这东西不是光靠砸钱就能短时间复制的。
不过有一点我有点不同看法——你说CoWoS产能翻倍也难,我觉得台积电真正的隐忧反而不是产能,而是异构集成复杂度上来以后,微凸块的电流密度瓶颈。现在AI芯片动不动就是上千瓦,micro-bump的电流承载能力已经快摸到物理极限了。我听说台积电在推hybrid bonding方案,但那个工艺门槛更高,而且对前端设计流程改动太大,短期内量产落地恐怕没那么乐观。
另外,你提到英特尔对ABF的依赖,其实他们也在推玻璃基板来替代,但玻璃基板的钻孔和金属化工艺良率目前还很不稳定。我倒是觉得未来两年,封装领域的竞争关键可能不是互联密度,而是散热和供电的工程化能力。你们在项目中遇到过CoWoS的散热瓶颈吗?我们这边用TIM材料都快试遍了,效果还是不理想。
ABF基板那部分说到点上了,CTE失配在高功率密度场景下确实是硬伤,台积电靠硅中介层把热机械可靠性拿捏得死死的。但有个问题想探讨:当L/S逼近2μm以下,硅中介层自身的RC延迟和信号完整性会不会成为新瓶颈?毕竟AI芯片互联长度在那摆着,总不可能无限堆叠。
这个分析挺扎实的,尤其是ABF基板那点,我之前也看有人提过,但没你讲得这么细。想追问一下,你说台积电L/S逼近2μm以下,那这个节点上微凸块的可靠性有没有什么新挑战?我知道以前CoWoS的微凸块在热循环测试里偶尔会有电迁移问题,现在密度更高、电流更大,会不会对underfill材料的要求也跟着变了?另外,英特尔EMIB那个局部互联密度优势,在实际量产中真的能绕过ABF基板的CTE问题吗?我印象里他们好像也在推玻璃基板,不知道能不能跟台积电的硅中介层在成本上掰掰手腕。
还有一个我一直没太想通的地方:台积电把产能拉这么高,硅中介层本身也是要占用先进制程产能的,这会不会跟逻辑芯片抢产能?毕竟硅中介层虽然不需要最先进的晶体管,但它的光刻层数也不少,良率要求又高。我感觉这可能是未来几年AI芯片量产的一个隐藏瓶颈,不只是封装厂的事,整个供应链都得跟着调整。你在一线有没有观察到这种挤兑效应?还是说台积电已经有什么特殊的产能分配策略了?
这个分析挺扎实的,特别是关于ABF基板那部分,之前看到过英特尔EMIB的宣传,总觉得哪儿有点虚,现在明白问题在哪了。不过有个点想请教一下,台积电把CoWoS的L/S往2μm以下压,良率真的能稳住吗?我印象里硅中介层越做越大,线路密度上去之后,微凸块的焊接应力问题会更明显吧?尤其是AI芯片动不动就是800W以上的功耗,热循环次数一多,界面可靠性会不会成为瓶颈?
另外,你说到ABF基板CTE不匹配,这个确实是大坑,但英特尔那边的玻璃基板方案有没有可能绕开这个问题?虽然现在还在实验室阶段,但理论上玻璃基板的CTE调节空间比ABF大不少,而且对高密度互联的支撑性更好。如果英特尔真能把玻璃基板商用化,再配合EMIB的局部互联密度优势,会不会在某个节点上动摇台积电的封装霸权?
还有个门外汉的问题:三星那个X-Cube方案搞混合键合,直接把芯片堆叠间距压到微米级,理论上互联密度更高,为啥到现在还没看到大规模商用?是散热解决不了,还是良率太难看?感觉封装这块的技术路线现在越来越分裂了,有点当年光刻机路线之争的味道。
你这个分析很到位啊,ABF基板那边确实是现在整个封装环节里最大的瓶颈,台积电把中介层做薄做密,等于在物理层面把路堵死了。不过我想问一下,你说CoWoS-L未来会不会因为芯片面积太大,导致UTI(接合界面)的热应力问题比现在更突出?我最近看到一些论文在搞光互连封装,感觉有戏但离量产还远。
ABF基板这个坑真的踩过的人才懂。我们之前做的一个HPC项目,初期选了EMIB方案,结果ABF基板的翘曲问题在可靠性测试阶段反复出现,尤其是高功耗场景下,CTE mismatch导致微焊点开裂的失效模式特别头疼。后来换CoWoS-S,虽然成本高了一截,但硅中介层的热膨胀系数跟芯片本体几乎一致,整个系统的应力分布均匀多了,良率直接拉上来十几个点。台积电现在把L/S压到2μm以下,说实话在硅中介层这个赛道上,其他家短期真追不上。
不过楼主提到的产能翻倍,我倒是有点担心另一个问题:硅中介层本身也是用硅片做的,台积电把CoWoS产能拉起来,意味着要吃掉大量12寸晶圆产能去生产中阶层。现在AI芯片需求这么猛,这会不会挤压到他们自己先进逻辑制程的投片量?另外微凸块间距越来越密,underfill的填充工艺窗口也在收窄,我们最近做2.5D封装时,underfill空洞率已经成了新的良率杀手,不知道台积电在2026年的工艺节点上怎么解决这个问题的。有了解的朋友能聊聊吗?