清华大学取得光芯片领域重大突破:发布AI光芯片“太极”

计算速度比电子芯片快约1000倍,功耗却更低的光芯片,作为一种创新型技术,以其独特的光速处理能力和低能耗特性,被寄予厚望。

今天,来自清华电子工程系的研究团队,在光芯片方面,取得了重要突破!

1.jpg

光电智能技术交叉创新团队部分成员合影 (左三为戴琼海院士、右二为方璐副教授)

他们摒弃传统电子深度计算范式,另辟蹊径,首创分布式广度智能光计算架构,设计了一种能以极高能效解决先进 AI 任务的大规模光芯片——Taichi,有效地将光子架构的网络规模提升到百万神经元级别,与其他光子集成电路相比,能效提高了两倍,适用于现实世界中的高级 AGI 应用。

2.jpg

Taichi 光芯片

该研究成果于北京时间4月12日凌晨以《大规模光芯片“太极”赋能160 TOPS/W通用人工智能》为题发表在最新一期的《科学》(Science)上。

3.jpg

方璐、戴琼海为论文的通讯作者,电子工程系博士生徐智昊、博士后周天贶(清华大学水木学者)为论文第一作者。

化 " 深 " 为 " 广 ":分布式广度光计算架构

4.jpg

光计算是将计算载体从电变为光,利用光在芯片中的传播进行计算,以其超高的并行度和速度,被认为是未来颠覆性计算架构的最有力竞争方案之一。

光芯片具备高速高并行计算优势,被寄予希望用来支撑大模型等先进人工智能应用。

智能光计算作为新兴计算模态,在后摩尔时代展现出有望超越硅基电子计算的潜力。然而其计算任务局限于简单的字符分类、基本的图像处理等。其痛点是光的计算优势被困在了不适合的电架构中,计算规模受限,无法支撑亟需高算力与高能效的复杂大模型智能计算。

帮助光计算“挣脱”算力瓶颈,另辟蹊径,“从0到1”重新设计适合光计算的新架构,是这个清华团队迈出的关键一步。

相异于电子神经网络依赖网络深度以实现复杂的计算与功能,“太极”光芯片架构源自光计算独特的‘全连接’与‘高并行’属性,化深度计算为分布式广度计算,为实现规模易扩展、计算高并行、系统强鲁棒的通用智能光计算探索了新路径。

据论文第一作者、电子系博士生徐智昊介绍,在“太极”架构中,自顶向下的编码拆分-解码重构机制,将复杂智能任务化繁为简,拆分为多通道高并行的子任务,构建的分布式‘大感受野’浅层光网络对子任务分而治之,突破物理模拟器件多层深度级联的固有计算误差。

两仪一元:干涉-衍射融合计算芯片

5.jpg

团队以周易典籍‘易有太极,是生两仪’为启发,建立干涉-衍射联合传播模型,融合衍射光计算大规模并行优势与干涉光计算灵活重构特性,将衍射编解码与干涉特征计算进行部分/整体重构复用,以时序复用突破通量瓶颈,自底向上支撑分布式广度光计算架构,为片上大规模通用智能光计算探索了新路径。

据论文报道:Taichi 可以实现每瓦 160 万亿次操作的能效,并支持超过 1000 个类别的图像分类,并在 1623 个类别的 Omniglot 数据集上达到了 91.89% 的准确率,超现有智能芯片 2—3 个数量级,可以为百亿像素大场景光速智能分析、百亿参数大模型训练推理、毫瓦级低功耗自主智能无人系统提供算力支撑。

“太极”光芯片有望为大模型训练推理、通用人工智能、自主智能无人系统提供算力支撑。

方璐表示,“之所以将光芯片命名为‘太极’,也是希望可以在如今大模型通用人工智能蓬勃发展的时代,以光子之道,为高性能计算探索新灵感、新架构、新路径。”

尽管研究团队在光电芯片领域实现了重大突破。但研究团队表示,光芯片与 AI 的结合依然面临着一些难题和挑战。

例如,光芯片的制造和集成仍然是一个技术难题;光芯片的计算模型和算法需要进一步研究和优化;光芯片的应用领域也需要进一步拓展等等。

研究团队认为,要想解决以上挑战,需要在技术创新、算法优化和应用拓展等多方面继续努力。

方璐认为,这次突破性科研成果的成功取得,是清华大学深入推进有组织科研的一次生动实践。

该课题受到科技部2030“新一代人工智能”重大项目、国家自然科学基金委杰青项目、基础科学中心项目,清华大学-之江实验室联合研究中心支持。

来源:蜂耘网

最新文章