大参考

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 3147|回复: 0

戍天九思:全球首颗存算一体芯片:中国打开算力革命天...

[复制链接]
发表于 2023-10-11 19:46:05 | 显示全部楼层 |阅读模式
  据10月11日《人民日报》报道,近日,清华大学集成电路学院教授吴华强、副教授高滨团队基于存算一体计算范式,研制出全球首颗全系统集成的、支持高效片上学习(机器学习能在硬件端直接完成)的忆阻器存算一体芯片,在支持片上学习的忆阻器存算一体芯片领域取得重大突破,有望促进人工智能、自动驾驶可穿戴设备等领域发展。相关成果在线发表于最新一期的《科学》。

  ▲忆阻器存算一体芯片及测试系统

  笔者认为,如果说CPU是芯片领域第一次革命,GPU是芯片领域第二次革命,那么,存算一体芯片就是芯片领域的第三次革命。

  存算一体芯片顶开冯·诺依曼架构天花板

  早在1946年,“计算机之父”冯·诺依曼提出并定义了计算机架构,采用二进制的编码,由存储器和处理器分别完成数据存储和计算。此后,全球几乎所有计算机都采取冯·诺依曼架构,开启了长达70多年的算力革命。

  但是,随着摩尔定律逐渐趋近于极限,基于冯·诺依曼架构AI芯片的“存储墙”和“功耗墙”问题日益凸显,芯片算力的增长速度变得越来越慢。

  一方面,处理器性能以每2年3.1倍的速度增长,而内存性能以每2年1.4倍的速度提升,导致存储器增长速度跟不上处理器增长速度。

  另一方面,根据英特尔的研究显示,半导体工艺到了7nm时代,数据搬运功耗达到35pJ/bit,占比达63.7%,数据传输功耗大成为芯片发展的又一大瓶颈。

  目前,存算一体成为“后摩尔时代”公认的一个技术发展方向。达摩院计算技术实验室科学家郑宏忠曾讲过:“存算一体是颠覆性的芯片技术,它天然拥有高性能、高带宽和高能效的优势,可以从底层架构上解决后摩尔定律时代芯片的性能和能耗问题。”

  那么,到底如何实现存算一体?

  华为创始人任正非一语中的:未来的边缘计算是存算一体的,要么把 CPU 做到存储器,要么把存储器做到 CPU 里,这样才能加快计算速度。

  这次清华大学吴华强团队走的就是“把 CPU 做到存储器”这种技术路线。他们研发的全球首颗存算一体芯片,开辟了芯片研发的新材料、新原理、新架构、新赛道,打开了冯·诺依曼架构天花板,必将开启算力革命新时代!

  吴华强团队重大突破在3篇论文和1个新产品

  冯·诺依曼架构是以计算为中心的架构,存算一体芯片是以数据为中心的架构——STELLAR,直接利用存储单元进行数据处理 —— 通过修改“读”电路的存内计算架构,可以在“读”电路中获取运算结果,并将结果直接“写”回存储器的目的地址。

  冯·诺依曼以计算为中心的架构可以通过擅长计算的硅晶芯片实现,研发存算一体芯片首先必须找到一种新材料作为存算一体单元。传统硅基芯片集成电路的基本单元是二极管,利用与非门做布尔逻辑计算;存算一体芯片集成电路的基本单元是忆阻器,利用欧姆定律直接做乘法计算和加法计算。

  吴华强团队从2012年开始研发“长征”,11年先后实现了从忆阻器件、原型芯片、系统集成三大突破,标志性成果在3篇权威刊物论文和1个新产品上。

  吴华强团队第一个重大突破:发现氧化物忆阻器并提升集成规模。忆阻器芯片的研发涉及材料科学、物理学、电子工程等多学科的前沿知识,他们通过一次又一次实验失败,两年多才突解了材料器件优化和集成工艺难题。2017年5月,钱鹤、吴华强团队在《自然通讯》发表论文称,首次实现了基于1024个氧化物忆阻器阵列的类脑计算,将氧化物忆阻器的集成规模提高了一个数量级。

  记忆电阻器(忆阻器)是继电阻、电容、电感之后的第四种电路基本元件。它可以在断电之后,仍能“记忆”通过的电荷,被当作新型纳米电子突触器件。

  忆阻器有很多存储优点:尺寸小、速度快、低功耗、与 CMOS工艺可兼容等。忆阻器还有一项特殊功能:能在存储数据“原地”实现计算。

  目前,可作忆阻器的材料主要有四种:金属氧化物,如二氧化铪;相变材料,即黄铜;磁性材料,即钴或铁;铁电材料,即钛酸钡。

  忆阻器可广泛用于存储、计算、通信和加密。

  吴华强团队第二个重大突破:研发忆阻器原型芯片。2020年1月,清华大学钱鹤、吴华强团队与合作者在《自然》杂志在线发表论文,报道了基于忆阻器阵列芯片卷积网络的完整硬件实现。该芯片集成了 8 个忆阻器单元,每个单元包含 2048 个忆阻器阵列,构建的五层卷积神经网络进行图像识别精度高达 96% 以上。

  吴华强团队第三个重大突破:系统集成忆阻器存算一体芯片。2023 年 9 月 14 日,清华大学吴华强、高滨在《科学》在线发表题为“面向边缘学习的全集成类脑忆阻器芯片”的研究论文。

  吴华强团队第四个突破:1个新产品。2018 年 6 月,吴华强团队孵化出由清华控股的创业公司——北京新忆科技,专注于将忆阻器进行产业化。经过两年的努力,他们已经实现 40nm 的工艺,并开发出了相关存储芯片——RRAM,已获得物联网和汽车等领域的订单。目前,他们的存算一体芯片已问世,正在产业化的路上。这是非常了不起的突破!说明存算一体芯片应用比量子芯片来得更早、更实用!

  据说,在 2019 年的一次会议上,吴华强曾和英特尔Loihi 神经形态计算芯片的负责人 “打赌”,看将来到底谁的芯片应用得更好。

  从目前来看,吴华强已领先一步。当前,国际上的相关研究主要集中在忆阻器阵列层面的学习功能演示,而实现全系统集成的、支持高效片上学习的忆阻器芯片仍未实现。

  中国算力革命的突破让美国政客抓狂

  2018年4月开始,美国打压中兴,对华发动芯片战。中国一直忍而不发,却以举国之力解决“卡脖子”问题。清华大学集成电路学院院长、留美博士吴华强团队就是其中的杰出代表。

  年近80仍坚守“龙芯”研发中心的中科院大学微电子所研究员黄令仪老师说,“我这辈子最大的心愿就是匍匐在地,擦干祖国身上的耻辱。”

  5年来,中国在算力革命上取得一系列重大突破,终于有了反制的底气,开始对美国实施有力反制。

  一是中国存储芯片取得重大突破。今年3月底,中国对美国美光公司进行网络安全审查。5月份,中国宣布美光未能通过网络安全审查,要求“关键信息基础设施”的运营者停止采购美光公司产品。背后是中国长江存储芯片的崛起,已经摆脱了对外国存储芯片的依赖。最近,美国宣布同意三星和SK海力士向其中国工厂提供半导体设备。其目的就是想借刀杀人,借处于垄断地位的三星和SK海力士对新兴的中国存储芯片打价格战,搞垮中国存储芯片产业链。但是,为时已晚。

  二是中国突破7纳米芯片先进工艺。今年7月,中国宣布对镓锗实施出口管制,这是中国反制美国对华芯片战的第二张牌,也是一张王牌,说明中国反制底气十分。雷蒙多访华之时,华为Mater60手机横空出世,让美国懵圈了。最近,美国国会参议院多数党领袖舒默率领的两党参议员代表团访华。坚定反华的舒默访华主要是摸底,想了解中国经济和芯片战的真实情况,这些都说明美国在中美斗争中心中无数和被动。据美媒报道,美国正在酝酿对芯片架构RISC-V的管制。美国企业家说:中国RISC-V架构用5年走过了ARM架构过去20年走过的路,现在,RISC-V架构芯片达到100亿颗规模。对RISC-V架构管制就像禁用互联网一样悲剧 。我们从美国的纠结中不难看出中国的进步和反制的威力。

  三是量子计算和量子通信的领先。今年,中国先后取得量子芯片量产、实现光纤1002公里点对点远距离量子密钥分发、量子系统真纠缠比特数由24个大幅刷新至51个等重大突破。10月11日,《科技日报》报道,成功构建255个光子的量子计算原型机“九章三号”,再度刷新了光量子信息的技术水平和量子计算优越性的世界纪录。

  四是全球首颗存算一体芯片。该芯片包含支持完整片上学习所必需的全部电路模块,成功完成图像分类、语音识别和控制任务等多种片上增量学习功能验证,展示出高适应性、高能效、高通用性、高准确率等特点,有效强化智能设备在实际应用场景下的学习适应能力。相同任务下,该芯片实现片上学习的能耗仅为先进工艺下专用集成电路(ASIC)系统的1/35,同时有望实现75倍的能效提升。

  当前,算力革命进入硅基芯片向存算一体芯片转换的关键时期,中国率先研发出全球首颗存算一体芯片,还有望快速量产。一步先,步步先!必将抢先在人工智能、大数据计算、类脑计算、感存算一体、自动驾驶等领域应用发挥广泛作用,必将加快算力革命进程。另外,存算一体芯片计算过程不需要数据交换,可以从源头上保证数据安全,对于打破黑客帝国霸权意义重大。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则




QQ|手机版|小黑屋|大参考

GMT+8, 2025-7-5 10:13 , Processed in 0.406713 second(s), 16 queries .

 

Powered by 大参考 X3.4 © 2001-2023 dacankao.com

豫公网安备41010502003328号

  豫ICP备17029791号-1

 
快速回复 返回顶部 返回列表