一年一度Hot Chips大会一向是微处理器设计师的重要聚会之一。在今年的活动上,围绕在处理器设计师的热门话题就是机器学习(ML),反映出一场为新的AI工作负载打造新兴处理器架构的竞赛正热烈展开。此外,随着薪资飙涨,让新创公司、大型芯片供应商及其客户之间,开始陷于深度学习专业工程师的抢人大作战。
新创公司Esperanto Technologies Inc.最近聘请了两位来自特斯拉(Tesla)自动驾驶(Autopilot)部门的资深工程经理。David Glasco和Dan Bailey将加入Esperanto,带领高阶RISC-V核心和处理器工程团队,负责深度学习和通用处理器开发任务。
新创公司Tachyum在Hot Chips大会介绍为其处理器擘划的长远目标——但也相当接近其竞争对手Esperanto。该公司将介绍一系列据称性能更胜英特尔(Intel) Xeon的16-64核心SoC,以及一款水冷式64核心版本,支持用于人工智能(AI)的32 GBytes HBM3,预计在明年出样。
赛灵思(Xilinx)将描述其75W FPGA,采用板载18x27 MAC数组、382Mbits SRAM和64GB DRAM,能以8位整数运算提供20TOPS运算效能,用于推论作业。此外,该公司还将介绍其 Everest加速器,这款7nm芯片采用组织成不同数据流的向量核心,可用于AI、5G和其他处理器密集型任务,预计可在今年投片。
此外,Xilinx在上个月收购的中国新创公司深鉴科技(DeePhi Tech),将介绍其最新版的AI核心和软件优化细节。在Hot Chips大会上,Xilinx显示目前至少拥有三种独立的AI架构,得以与英特尔的FPGA部门(已经取得微软数据中心订单)竞争。
在移动领域,Arm将深入探索其新的机器学习核心。这款GHz级的机器学习(ML)核心承诺可在卷积网络上支持4TOPS,以及在7nm打造的2.5mm2芯片上实现3 TOPS/W性能。Google和三星(Samsung)将讨论包括AI硬件的应用处理器。
此外,新创公司Mythic则介绍其内存处理器(processor-in-memory;PIM)架构。这种新兴的架构据称明年可望为嵌入式推论任务提供高阶GPU性能。Nvidia则将为客户提供其开放源码的深度学习加速器,以及用于在云端训练模型的GPU服务器。
针对日益热门的AI领域,Esperanto最近从特斯拉挖角了两名自动驾驶人才。David Glasco曾经是特斯拉自动驾驶SoC的架构与设计主管,将在Esperanto担任工程副总裁。而原先负责自动驶硬件电路设计的Dan Bailey则担任Esperanto的资深工程总监。
今年,特斯拉似乎不断地流失高阶人才。除了因为特斯拉近来把重心放在生产新车型,同时,今年3月一场可能使用自动驾驶模式酿祸的意外也还在调查中。今年4月,英特尔也挖角了特斯拉前资深芯片设计师Jim Keller。
Tachyum将服务器软件移植至其专有的高阶SoC(来源:Hot Chips)
新加入Esperanto的两位工程师都拥有十分资深的芯片设计背景。在加入特斯拉之前,Glasco曾任AMD服务器SoC资深总监,还曾经在Nvidia任职超过12年。Bailey在加入特斯拉之前曾经是AMD资深研究员,深入研究过从Digital Equipment的Alpha之后的各种处理器。
去年11月,Esperanto在RISC-V大会上首度亮相。当时,Esperanto首席执行官Dave表示,该公司正在开发两款RISC-V核心和两款SoC,其中至少有一款将采用7nm技术工艺。搭载Maxion核心的16核心芯片瞄准单线程性能,而使用Minion核心的4,096核心芯片则在每颗核心中加进了一个向量单元,旨在实现最佳的每瓦性能。