(原标题:初创公司开发了一款光学NPU)开云(中国)Kaiyun·体育官方网站-登录入口
如若您但愿不错不时碰面,接待标星保藏哦~
来源:实践来自eejournal,谢谢。
哄骗基于光子学的时间进行“光速计较”有赫然的诱骗力——不单是是极高的速率,尽管这诚然很紧迫,而且与基于晶体管逻辑的计较杀青比拟,其功耗也极低。
以前几年,我搏斗过几家提供各式光学计较科罚决策的公司。但到刻下为止,这些科罚决策主要波及将不同频率和相位的多束光注入光纤,并哄骗干与进行复杂的计较,如若用硅片进行这些计较,则需要无数晶体管。
好吧,我刚刚搏斗到光学计较领域的一些极新事物。我和Michael F?rtsch 博士聊天,他是一家名为Q.ANT的德国初创公司的首席履行官。诚然,当我说“初创公司”时,咱们需要记着 Q.ANT 成立于 2018 年,到撰写本文时已过程去了六年。我不知说念你是如何念念的,但从时间角度来看,六年前对我来说似乎是一世之久。
绵薄先容一下布景故事,迈克尔起原从事的是计较网站的服务,但其后以为败兴,于是他运行学习数学和物理,临了赢得了马克斯·普朗克学会的博士学位。随后,迈克尔在好意思国国度法式与时间琢磨所(NIST)服务了几年,还作念了一些其他服务,临了他决定重返工业界,创办了 Q.ANT。
在络续之前,值得闪耀的是,咱们(东说念主类)但愿履行的计较量现在每三个月傍边就会翻一番。这在多个层面上都是可怕的。
这里的一个问题是咱们履行计较所破钞的能量。刻下,大多数计较都是使用基于 CMOS 时间的硅芯片进行的。较小的晶体管比较大的晶体管破钞的功率更少。咱们正在转向越来越小的工艺节点,其中晶体管的尺寸以纳米为单元,是以这很好 - 对吗?
问题是,咱们但愿履行的计较量呈指数级增长,这意味着咱们需要在单个芯片上装置数百亿个晶体管。数百亿个晶体管会破钞无数动力,而当一台服务器中有多个这么的芯片、一个机架中有多个服务器、一个数据中亲信知彼万个机架时,动力破钞就会加重。
归根结底,咱们刻下的计较科罚决策 (a) 远莫得达到咱们所但愿的速率,而且 (b) 破钞太多电力。举例,迈克尔指出,他最近投入了一次超等计较契机议和展览。他说每个机架都需要水冷。他还指出,在不久的将来,新的超标量数据中心将运行需要我方的专用发电站——可能是微型模块化反馈堆 (SMR) 的格式。
Q.ANT 是一家敬爱的公司。它领有来自 21 个国度的 100 多名人人,领有约 890 年的行业教授,平均年纪约为 36 岁。该公司的服务是开发光子计较科罚决策,以应答刻下东说念主工智能 (AI) 时间的两大挑战:1)治理东说念主工智能推理和其他数据密集型应用所需的无数数据(包括复杂的数学运算)。2)显耀减少刻下人人东说念主工智能数据中心所破钞的无数电力和动力。
现在,咱们不错真切琢磨 Q.ANT 的时间,但我惦记真切琢磨可能会遮掩更大的故事,是以让咱们将事情保握在相对较高的水平。让咱们从底下的图像运行,这是基于光子学的本机处理单元 (NPU),它建设在公司的光赋能本机算法 (LENA) 架构上。
Q.ANT 的光子芯片是 LENA 的中枢(来源:Q.ANT)
与其他家具比拟,这款光子芯片的第一个折柳在于,它接收薄膜铌酸锂 (TFLN) 制造而成。不雅察左侧的低损耗波导,它将引入光信号;不雅察右侧的低损耗耦合器,它将输出光信号。
中间的金色圆圈是电控光调制器。咱们不错这么融会,每个圆圈都是一个电容器的极板。通过向该极板施加电压,咱们不错调制通过调制器的光信号。多个调制器不错相互汇聚使用,以杀青越来越复杂的计较。
这款 Q.ANT NPU 使用光而不是电子来履行复杂的非线性数学运算,有望杀青比传统 CMOS 时间至少高 30 倍的动力成果和显耀的计较速率升迁。 念念念念看,傅里叶变换在传统计较中频频需要数百万个晶体管,而现在只需一个光学元件就能完成。这很令东说念主振奋,不是吗?
基于这一底层时间,Q.ANT 晓示推出其首款买卖家具——基于光子学的 NPU,它配备了行业法式的 PCI-Express(PCIe)接口,与刻下现存的计较生态系统足够兼容。
PCIe 卡上的 Q.ANT NPU(来源:Q.ANT)
嗯,这照实看起来很棒,但这项时间到底有多好呢?我很欢畅你问这个问题,因为迈克尔共享了一张以很是直不雅的方式“传达这个念念法”的图片,如下所示。
LENA 与法式 GPU(来源:Q.ANT)
假定咱们试图历练 AI 识别文森特·梵高的《星夜》。咱们使用基于 LENA 的 NPU 而不是在传统图形处理单元 (GPU) 上杀青的法式东说念主工神经汇聚 (ANN) 进行历练
上行暴露一个历练周期 (epoch) 后的死一火。下行暴露 150 个周期后的死一火。很容易看出 Q.ANT 科罚决策有多先进。一样值得闪耀的是,LENA 仅需要 0.1 百万个参数,仅履行 0.2 百万次操作,而 GPU 则需要 5.1 百万个参数和 10 百万次操作。
现在我还是引起了你们的闪耀,我会起原告诉你们刻下的情况,然后告诉你们我认为畴昔事情可能会如何发展。
刻下的情况是,上图第一张图中所示的 TFLN NPU 装置在一块原始的硅基板上——基本上即是一块莫得任何晶体管的硅片。刻下,这块基板的主要作用(诚然,除了提供放弃物除外)是为调制器提供电容器的另一侧(我将其视为不错偏置或至少接地的“大容量电容器板”)。此外,如今,光信号通过惯例光纤传入和传出该开辟。
那么畴昔会若何呢?起原,我不错设念念将铌酸锂层平直装置在功能王人全的硅芯片上。在这种情况下,咱们不错在芯片顶部(搏斗 NPU 底面的一侧)使用金属化圈行为各个调制器电容器的名义,而且不错在 NPU 顶面上涂一层导体行为“大容量电容器板”。
其次,与使用光纤将光信号“水平”地传送到铌酸锂层的边际不同,咱们不错使用硅芯片中制造的激光二极管将光信号垂直朝上传输到 NPU 的低损耗光波导中。一样,与使用光纤拜访从铌酸锂层的边际“水平”传出的光信号不同,咱们不错使用硅芯片中制造的光电二极管从 NPU 的低损耗光耦合器垂平直收这些光信号。
念念象一下,将刻下任何高端 CPU、GPU、FPGA 或 SoC(刻下仅由硅制成)与上述光学 NPU 相汇聚。悉数东西都将放在团结个封装中(不比今天的封装大),在外界看来就像平庸芯片一样。我应该指出,悉数这些都只是我的揣摸;这不是迈克尔说 Q.ANT 正在作念的事情,但如若我在 Q.ANT 有话要说,我会考察这件事。
非线性汇聚的潜在应用不错通过 Q.ANT 时间得到增强,从而提供更高的性能,同期破钞更少的电量,这些应用多种各样。底下列出了一些示例。
非线性汇聚的示例应用(来源:Q.ANT)
我认为,对于任何参与 AI 和高性能计较 (HPC) 的东说念主来说,这种光子处理在成果和性能方面都很是敬爱。诚然,这不全是对于我的(应该是,但事实并非如斯)。那么,你对这一切有什么成见?
如有硅光流片需求,
接待扫码,将有专东说念主对接。
https://www.eejournal.com/article/a-bold-new-twist-on-optical-computing/
半导体极品公众号推选
专注半导体领域更多原创实践
善良人人半导体产业动向与趋势
*免责声明:本文由作家原创。著述实践系作家个东说念主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或救助,如若有任何异议,接待关系半导体行业不雅察。
今天是《半导体行业不雅察》为您共享的第3976期实践,接待善良。
『半导体第一垂直媒体』
及时 专科 原创 深度
公众号ID:icbank
心爱咱们的实践就点“在看”共享给小伙伴哦开云(中国)Kaiyun·体育官方网站-登录入口