大参考

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 1424|回复: 0

戍天九思:重大突破!通用“智能光计算芯片”来了!

[复制链接]
发表于 2024-4-16 00:38:10 | 显示全部楼层 |阅读模式
  据4月12日新华社报道,针对大规模光电智能计算难题,清华大学电子工程系副教授方璐课题组、自动化系戴琼海院士课题组,摒弃传统电子深度计算范式,另辟蹊径,首创分布式广度光计算架构,研制大规模干涉-衍射异构集成芯片太极(Taichi),实现160 TOPS/W的通用智能计算。在如今大模型通用人工智能蓬勃发展的时代,该科研成果以光子之道,为高性能算力探索新灵感、新架构、新路径。相关科研成果发表于最新一期的国际期刊《科学》。

  清华太极光芯片突破在哪里?

  虽然智能光计算作为新兴计算模态,在后摩尔时代展现出远超硅基电子计算的性能与潜力。但是,其计算任务局限于简单的字符分类、基本的图像处理等。其痛点是光的计算优势被困在不适合的电架构中,计算规模受限,无法支撑亟须高算力与高能效的复杂大模型智能计算。

  方璐在接受记者采访时表示:“相异于电学神经网络依赖网络深度以实现复杂的计算与功能,太极芯片架构源自光计算独特的‘全连接’与‘高并行’属性,化深度计算为广度计算。我们建立了自顶向下的编码拆分-解码重构机制,将复杂任务拆分为多通道高并行的子任务,构建了分布式‘大感受野’浅层光网络对子任务分而治之,突破模拟计算多层深度级联的固有误差。”

  方璐说:“研发芯片时,受周易典籍中‘易有太极,是生两仪’启发,建立片上干涉-衍射联合传播模型,融合衍射光计算大规模并行优势与干涉光计算灵活重构特性,以时序复用突破通量瓶颈,为片上大规模通用智能光计算探索了新路径。”

  两仪一元:干涉-衍射融合计算芯片。

  据介绍,太极光芯片的计算能效超现有智能芯片2—3个数量级,将可为百亿像素大场景光速智能分析、百亿参数大模型训练推理、毫瓦级低功耗自主智能无人系统提供算力支撑。

  那么,清华太极光芯片160 TOPS/W的通用智能计算到底有多强大?英伟达最新GPU——B200只有4.5tops/w,华为昇腾920是 5.714tops/w。也就是说,太极芯片是B200的35.6倍,意味着清华太极光芯片实现同样的算力能耗只有英伟达B200的2.8%,可大幅度节约电力。

  太极芯片与清华全模拟光电智能计算芯片有什么不同?

  2023年11月3日新华社报道,我国科学家研制出首个全模拟光电智能计算芯片。经长期联合攻关,清华大学研究团队突破传统芯片的物理瓶颈,创造性提出光电融合的全新计算框架,并研制出国际首个全模拟光电智能计算芯片(简称ACCEL)。经实测,该芯片在智能视觉目标识别任务方面的算力可达目前高性能商用芯片的3000余倍,为超高性能芯片的研发开辟全新路径。相关成果以“高速视觉任务中的纯模拟光电芯片”为题,以长文形式发表在10月26日《自然》期刊上。

  从新华社两次报道看,尽管报道两次课题组都有清华的方璐和戴琼海院士,但是,这次太极芯片的论文第一作者是博士生徐智昊,说明徐智昊才是贡献最大的人,也说明这两种芯片既有联系,更有重大创新。不然,《科学》杂志也不会刊登。

  从设计理念和架构来看,太极芯片采用了独特的分布式广度智能光计算架构,通过利用光在芯片内的传播进行计算,实现了惊人的通用智能计算能力。这种创新方式不仅提升了计算精度,还成功打破了物理模拟器件在多层深度级联时产生的计算误差。而全模拟光电智能计算芯片则结合光计算和纯模拟电子计算技术,旨在突破传统芯片架构中的数据转换速度、精度与功耗之间的物理瓶颈。

  从应用场景来看,太极芯片具有更广泛的通用性,能够处理各种复杂的指令和适应多种外部设备的请求。它的计算能效远超现有智能芯片,有望为百亿像素级大场景的光速智能分析、百亿参数级别大模型的训练与推理等提供算力支撑。而全模拟光电智能计算芯片则更专注于特定领域,如无人驾驶、人工智能等,通过其强大的计算能力在这些特定场景下发挥出重要作用。

  从研发目标和背景来看,太极芯片可能更侧重于在通用计算领域的创新,推动高性能计算的发展。而全模拟光电智能计算芯片则可能是针对当前人工智能和机器学习领域的快速发展,以及传统芯片架构的局限性,提出的一种全新的计算解决方案。

  笔者认为,清华大学智能光计算芯片研究成果5个月内两次上了国际权威刊物,说明清华大学智能光计算芯片研发进展迅速、成果喜人。如果说清华去年11月的全模拟光电芯片是第一代专用光芯片,那么,这次太极芯片就是第二代通用光芯片。

  光芯片四大优势可彻底解决芯片卡脖子问题

  光芯片是采用光波作为信息传输和数据运算载体的芯片,区别于传统芯片将电流信号作为信息载体。它具有四大优势:

  一是算力大。光电芯片的计算速度理论上是电子芯片的三个数量级以上,即1000倍以上。目前,单个电子芯片的计算速度大约是7.8TFlops,而此前认为光电芯片的计算速度大概是3200TFlops。

  二是功耗低。光电芯片的功耗仅为电子芯片的百分之一,单位电子芯片和耗电量大概300W,此前认为对应的光电芯片的耗电量大概为4W。

  三是抗干扰强。光信号比电信号具有更强抗电磁干扰能力,光电芯片不易受干扰。

  四是工艺简单成本低。高端电子芯片要使用先进极紫外光刻机(EUV),而光芯片不需要高精度光刻机。目前,我国已量产的28纳米深紫外光刻机足矣。去年11月清华用180纳米制程就取得了比传统7纳米制程的电子芯片高3000多倍的算力。而且其所使用的材料简单易得,造价仅为后者的几十分之一。

  中国弯道超车的机会来了!

  美国是光电子领域起步最早也是发展最好的国家,1991年美国便成立了“美国光电子产业振兴会”,以引导资本和各方力量进入光电子领域。2014年,美国又建立了“国家光子计划”产业联盟,明确将支持发展光学与光子基础研究与早期应用研究计划开发。欧洲和日本也在跟进,中国大概在2010年才开始入局光电芯片赛道。目前,全球光电芯片产业链已逐渐成熟,英特尔、思科、英伟达是行业领头羊,中国华为也后来居上。

  据国际知名市场调研公司Yole统计,全球光电芯片市场中,美国、中国和日本的市场份额分别为45%、40%和8%。其中,中国主要占据中低端光电芯片市场,全球前10大光电芯片生产企业中,中国企业占5席。

  去年11月《自然》杂志特邀发表的该研究专题评述指出,“或许这枚芯片的出现,会让新一代计算架构,比预想中早得多地进入日常生活”。

  清华大学戴琼海院士说:“开发出人工智能时代的全新计算架构是一座高峰,而将新架构真正落地到现实生活,解决国计民生的重大需求,是更重要的攻关,也是我们的责任。”

  现在,更可喜的是,这次新华社通稿称:“据悉,目前该团队正与相关机构洽谈,建设算力实验室,以期用智能光计算芯片支撑大模型训练与推理、通用人工智能等人工智能研究与应用。”说明太极光芯片不仅仅是实验室的新技术,而且可以开始量产和进入实用阶段。

  去年10月,英伟达创始人、首席执行官黄仁勋发表最新预言:计算技术将会每十年进步一百万倍,只需2年,英伟达甚至整个行业就会面目全非。其判断依据,60年来首次看到两项技术转型同时发生:人工智能与计算。

  山雨欲来风满楼!算力革命加速走来,黄仁勋率先感到了危机!还有一个好消息,华为昇腾920也来了!英伟达的好日子快到头,中国的算力新时代来了!

  ▲华为昇腾920与英伟达H100、B200参数对照

  美国步步升级对华芯片战,不仅华为打赢了新时代的”科技上甘岭战役“,而且倒逼中国另起炉灶,中国正在取得存算一体芯片、智能光计算芯片、量子芯片等数字根技术的重大突破,美国对华芯片“卡脖子”的时代即将一去不复还了!

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则




QQ|手机版|小黑屋|大参考 |

GMT+8, 2024-5-19 04:59 , Processed in 0.093750 second(s), 16 queries .

 

Powered by 大参考 X3.4 © 2001-2023 dacankao.com

豫公网安备41010502003328号

  豫ICP备17029791号-1

 
快速回复 返回顶部 返回列表