自主可控的 AI 芯片和深度学习结构,是构建自主 AI 生态的要害,其间量产是衡量技能开发的最终一关。百度昆仑再进一步,至此百度和阿里都为其云上芯片栓上了一层自主化稳妥。
上一年 7 月,百度发布了首款云端全功用 AI 芯片「昆仑」。时隔一年多,昆仑总算走上量产议程,选用三星 14 纳米工艺和 i-Cube TM 封装解决方案。
这是百度和三星的初次代工协作,百度挑选三星代工可看出其在工艺和制作资源上的差异化打法(阿里首颗云端 AI 芯片含光 800 选用 12nm 制程),百度供给先进的 AI 渠道来最大化 AI 功用,三星将把代工事务扩展到专为云核算和边际核算规划的高功用核算(HPC)芯片范畴。
机器之心 12 月 18 日音讯,据三星官网音讯显现,百度首款用于云核算和边际核算的昆仑 AI 芯片现已完结研制,由三星代工下一年初完结量产。
昆仑芯片将根据百度针对云、边际和人工智能的 XPU 神经处理器架构构建,选用三星 14 纳米工艺和 i-Cube TM 封装解决方案。
三星的 14nm 工艺是其最广泛运用的制作节点之一,该工艺的晶体管密度为 32.5 MTr /mm,大多数都用在英伟达的 GeForce 10 系列,以及许多高通和三星芯片。它有多种变体,包括 14nm LPE(Low Power Early)和 14nm LPP(Low Power Plus)。
现在三星现已为高通、苹果、Nvidia 和许多其他厂商出产芯片,而且还将其 14nm 工艺答应给美国半导体公司 GlobalFoundries。
三星电子代工行销副总裁 Ryan Lee 表明,「关于三星代工来说,百度昆仑是一个重要的里程碑,因为咱们正在经过开发和批量出产 AI 芯片将事务范畴从移动扩展到数据中心使用。三星将供给从规划支撑到顶级制作技能(例如 5LPE,4LPE 以及 2.5D 封装)的全面工艺解决方案。」
在制作工艺布局上,全球各大半导体公司都在广泛布局。英特尔进入 10nm 工艺年代,并将推出 7nm,台积电、三星也纷繁完结 7nm 工艺,并将推出 5nm、3nm。
前段时间台积电表明,前期 5nm 测验芯片良率 80%,下一年或迎来大规模量产。台积电宣称,5nm EUV 工艺的全体改动在于:逻辑密度添加约 1.84 倍,能效增益 15%,功耗下降 30%。现在对 256Mb 的 SRAM 和一些逻辑芯片进行测验,均匀产率为 80%,产率峰值大于 90%。
制作工艺某些特定的程度上决议了处理器的集成度。因为在 AI 和 HPC 等各种使用中需求更高的功用,因而芯片集成技能渐渐的变重要。
三星的 I-Cube 技能经过刺进器衔接逻辑芯片和高带宽存储器,可经过使用三星的差异化解决方案以最小的尺度供给更高的密度/带宽。
与曾经的技能比较,这些解决方案将电源/信号完整性提高了 50%以上,然后最大极限地提高了产品功用,估计 I-Cube 技能将标志着异构核算商场的新纪元。三星还在开发更先进的封装技能,包括再分配层(RDL)刺进器和 4x,8x HBM 集成封装。
百度昆仑AI芯片下一年初量产
最开端,百度开端测验为深度学习而规划的现场可编程门阵列 (FPGA) 芯片,后逐步演进成「昆仑」项目,昆仑的速度比百度的第一个 FPGA 芯片快 30 倍,而且能到达每秒 260 tera-operations(TOPS) 和 512 GB /秒的内存带宽,并以 150 瓦的功率供给每秒 260 Tera 操作(TOPS)。
此外,该芯片运用于自然语言处理的预练习模型 Ernie 的推理速度比传统 GPU / FPGA 加快模型快三倍。
使用昆仑的极限运算才能和能效,百度能够有用支撑多种功用,包括大规模的 AI 作业负载,例如查找排名、语音辨认、图画处理、自然语言处理、无人驾驶和 PaddlePaddle(飞桨)等深度学习渠道。
上一年 7 月,百度正式推出首款云端全功用 AI 芯片「昆仑」,其间包括练习芯片昆仑 818-300,推理芯片昆仑 818-100。昆仑可使用于云和边际场景,例如数据中心、公共云和无人驾驶轿车。
早在 2011 年,百度就渐渐的开端运用专门为深度学习而规划的现场可编程门阵列(FPGA)芯片。跟着 AI 芯片的发布,百度也逐步参加谷歌、英伟达、英特尔和其他许多制作专门用于人工智能处理器的科技公司的队伍。
这是百度和三星的初次代工协作,百度挑选三星代工可看出其在工艺和制作资源上的差异化打法,百度供给先进的 AI 渠道来最大化 AI 功用,三星将把代工事务扩展到专为云核算和边际核算规划的高功用核算(HPC)芯片范畴