导读 台积电为 AMD 生产芯片,但现在它也使用 AMD 的处理器来控制它用来为 AMD(以及其他客户)制造芯片的设备。听起来像一个奇怪的硅循环,

台积电为 AMD 生产芯片,但现在它也使用 AMD 的处理器来控制它用来为 AMD(以及其他客户)制造芯片的设备。听起来像一个奇怪的硅循环,但这正是世界上最大的第三方代工厂幕后发生的事情。

有数百家公司将基于 AMD EPYC 的机器用于其重要工作负载,有时是业务关键型工作负载。然而,当谈到关键任务工作时,英特尔至强(甚至英特尔安腾和大型机)统治着世界。对 AMD 来说幸运的是,事情已经开始发生变化,台积电宣布它现在正在使用基于 EPYC 的服务器进行关键任务晶圆厂控制操作。

“对于我们晶圆厂内部机器的自动化,每台机器都需要有一台 x86 服务器来控制运行速度和水、电、气的供应或电力消耗,”基础设施和通信服务部总监 Simon Wang 说。台积电。

“这些机器非常昂贵。它们可能要花费数十亿美元,但控制它们的服务器要便宜得多。我需要确保我们有高可用性,以防一个机架停机,然后我们可以使用另一个机架支持机器。使用标准构建块,我可以生成大约 1,000 个虚拟机,这些虚拟机可以控制我们洁净室中的 1,000 个晶圆厂工具。这将意味着在不牺牲故障转移冗余或可靠性的情况下节省大量成本。”

台积电很久以前就开始使用 AMD EPYC 机器来处理其一般数据中心工作负载,例如计算、存储和网络。AMD 的 64 核 EPYC 处理器具有 128 个 PCIe 通道并支持高达 4TB 的内存,这是用于运行虚拟机的服务器的两个关键特性。但是,虽然支持全球 50,000 名台积电员工的基础设施非常复杂和重要(有些人会称之为关键业务),但它并不像台积电控制晶圆厂工具的服务器那么重要。

Fab 工具的成本高达数千万或数亿美元,并且加工晶圆承载数百个芯片,可用于制造价值数万美元的产品。每个生产工具使用一台 x86 服务器,或者至少使用一台虚拟服务器。有时硬件会出现故障,因此 TSMC 以这样一种方式运行其工作负载,即一台服务器可以快速替换发生故障的服务器。(当然,台积电不会透露其晶圆厂运行哪些操作系统和应用程序。)

目前,台积电在数据中心使用 HPE 的 DL325 G10 平台,运行 64 核(2.0 GHz ~ 3.35 GHz)的 AMD EPYC 7702P 处理器。它还使用基于 24 核 EPYC 7F72s 的服务器进行研发,频率为 3.20 GHz。至于台积电晶圆厂使用的机器,代工厂对其规格保密。

值得注意的是,AMD的数据中心产品不仅用于生产芯片,还用于开发芯片。AMD 自己的 Radeon 技术集团 使用 EPYC 处理器来设计 GPU。