「咱们的 Blackwell 芯片存在设计缺点,只管可以反经常常使用,但该设计缺点造成良率低下,」黄仁勋示意。「这 100% 是英伟达的错。」
自 3 月份颁布以来,环球科技公司都在疯狂求购的 Blackwell AI 芯片,仿佛终于要到了出货的时刻。
本周三,在与高盛(Goldman Sachs)启动的会议中,英伟达示意 Blackwell GPU 中影响良率的设计缺点已宣告修复,B100/B200 解决器的改良版行将投入量产。
据路透社等内媒报道, 英伟达 CEO 黄仁勋本周抵赖,该缺点齐全由英伟达形成,并示意该如今已在台积电的及时协助下修复了缺点 。
往年 8 月,当无关英伟达最新一代芯片 Blackwell 设计缺点的第一批报道产生时,一些媒体称台积电应承当责任 —— 并暗示这或者造成英伟达与其代工协作同伴之间的相关弛缓。
黄仁勋示意,理想并非如此。他还批驳了无关两家公司相关弛缓的报道,并称其为「假资讯」。 为了让 Blackwell 计算设施反常上班,英伟达设计了七种不同类型的芯片,并同时投入消费 。
英伟达的 Blackwell 芯片驳回全新一代架构,台积电 4NP 工艺打造,领有 2080 亿个晶体管,在口头大模型推理等义务时效率较前代优化了 30 倍,因此备受科技公司等候。
此种面积的芯片,显然不能再经过传统模式来打造。Blackwell 的 B100 和 B200 GPU 两个型号经常使用台积电的 CoWoS-L 封装技术衔接两个芯片,该技术依赖于装备部分硅互连(LSI)桥接器的 RDL 中介层(以成功约 10 TB/s 的数据传输速率)。
英伟达示意,双芯片的 GPU 没有内存部分性疑问或缓存疑问,CUDA 将其视为单块 GPU,可见这些芯片的桥接器至关关键。但是,GPU 芯片、LSI 桥接器、RDL 中介层和主板基板之间的热收缩个性或者不婚配,造成系统笔挺和缺点。
因此,英伟达在 8 月抵赖了其 Blackwell GPU 的良品率低,须要修正 GPU 硅片的顶部金属层和凸片,以提高消费良率。过后,英伟达在一份申明中示意,「公司曾经对 Blackwell GPU 的掩膜实施了修复。」
不过,英伟达也重申,公司在第二季度与客户一同对 Blackwell GPU 启动了抽样审核,并抵赖必定消费「低良率 Blackwell 资料」才干满足对 Blackwell 解决器的需求。
同时,黄仁勋在 2025 财年第二季度财报电话会议上示意,公司针对 Blackwell B100 和 B200 GPU 的设计启动了一切必要的变卦,从而有望在第四季度成功量产。
英伟达 Blackwell GPU 不同型号的参数规格。
其真实半导体行业中,影响良率的 bug 以及严重配置疑问并不是什么新颖事。通常,公司经过修正金属层(或两层)等新步进(stepping)来修复这些疑问。
据此前报道,英特尔的 Sapphire Rapids 有 500 个 bug。因此,英特尔颁布了大概十几个步出去修复一切 bug(其中五个是基础重置)。每个新步进大概须要三个月才干成功(包含识别疑问、修复疑问和消费新版本芯片)。
从这一点来看,英伟达和台积电修复 Blackwell GPU 的速度确实令人印象深入。
目前, 已修复的用于 AI 和超级计算机的 Blackwell GPU 估量将于最近几天投入量产,并在 2025 年终开局发货(仍在英伟达 2025 财年内) 。
此外,依据英伟达在往年终披露的信息,AWS、谷歌、Meta 和微软是其关键客户(算计支出占比高达 40%),为满足他们对其新一代 AI 算力的需求,该公司必定在本年度出货一些最后低良率的 Blackwell GPU。不过,2024 年终究会有多少 Blackwell GPU 被「送」往数据核心,咱们不得而知。
周三美股收盘,刚刚创下历史新高的英伟达股票收跌 2.81 %,回落到 140 美元以下。