首頁  技術(shù)文章  博覽:2021 Nature 使用集成光子張量核的并行卷積運算

博覽:2021 Nature 使用集成光子張量核的并行卷積運算

發(fā)布時間:2022-04-11 17:33:19 瀏覽量:4205 作者:LY.Young 光學前沿

摘要

隨著超高速移動網(wǎng)絡和互聯(lián)網(wǎng)連接設備的激增揍瑟,以及人工智能(AI) 的興起白翻,我們的世界正在生成大量需要以快速有效方式處理的數(shù)據(jù)。因此,高度并行化滤馍、快速和可擴展的硬件變得越來越重要岛琼。在這里,作者展示了一個計算特定的集成光子硬件加速器(張量核)巢株,它能夠以每秒數(shù)萬億次乘法累加運算(乘法累加運算是矩陣矢量乘法(matrix-vector multiplication,MVM)運算所需的基本數(shù)學元素,目前執(zhí)行此任務的硅基計算硬件有FPGA槐瑞、ASICs、GPUs)的速度運行阁苞。張量核心可以被視為專用集成電路(ASIC) 的光學模擬困檩。它使用相變材料(phase-change material,PCM)存儲陣列和基于光子芯片的光頻梳(光孤子微梳)實現(xiàn)并行光子內(nèi)存計算。計算被簡化為測量可重構(gòu)和非諧振無源元件的光傳輸那槽,并且可以在超過14 GHz 的帶寬下運行悼沿,僅受調(diào)制器和光電探測器速度的限制。鑒于微波線速光孤子微梳骚灸、超低損耗氮化硅波導以及高速片上探測器和調(diào)制器的混合集成的最新進展糟趾,此文的方法為光子張量核心的完全互補金屬氧化物半導體 (CMOS) 晶圓級集成提供了可行途徑。 盡管此文專注于卷積運算甚牲,但更一般地說拉讯,文章的結(jié)果表明集成光子學在數(shù)據(jù)密集型AI 應用程序(如自動駕駛、實時視頻處理和下一代云計算服務)中具有并行鳖藕、快速和高效計算的硬件潛力。

正文


博覽:2021 Nature 使用集成光子張量核的并行卷積運算


摘要:

隨著超高速移動網(wǎng)絡和互聯(lián)網(wǎng)連接設備的激增只锭,以及人工智能(AI) 的興起著恩,我們的世界正在生成大量需要以快速有效方式處理的數(shù)據(jù)。因此蜻展,高度并行化喉誊、快速和可擴展的硬件變得越來越重要。在這里纵顾,作者展示了一個計算特定的集成光子硬件加速器(張量核)伍茄,它能夠以每秒數(shù)萬億次乘法累加運算(乘法累加運算是矩陣矢量乘法(matrix-vector multiplication,MVM)運算所需的基本數(shù)學元素,目前執(zhí)行此任務的硅基計算硬件有FPGA、ASICs施逾、GPUs)的速度運行敷矫。張量核心可以被視為專用集成電路(ASIC) 的光學模擬。它使用相變材料(phase-change material,PCM)存儲陣列和基于光子芯片的光頻梳(光孤子微梳)實現(xiàn)并行光子內(nèi)存計算汉额。計算被簡化為測量可重構(gòu)和非諧振無源元件的光傳輸曹仗,并且可以在超過14 GHz 的帶寬下運行,僅受調(diào)制器和光電探測器速度的限制蠕搜。鑒于微波線速光孤子微梳怎茫、超低損耗氮化硅波導以及高速片上探測器和調(diào)制器的混合集成的最新進展,此文的方法為光子張量核心的完全互補金屬氧化物半導體 (cmos) 晶圓級集成提供了可行途徑妓灌。 盡管此文專注于卷積運算轨蛤,但更一般地說蜜宪,文章的結(jié)果表明集成光子學在數(shù)據(jù)密集型AI 應用程序(如自動駕駛、實時視頻處理和下一代云計算服務)中具有并行祥山、快速和高效計算的硬件潛力圃验。


潛在用途:

(1)替代電子計算,應用于需要并行枪蘑、快速损谦、高效計算的場


關鍵圖示:

(1)片上矩陣乘法引擎岳颇,使用基于光子芯片的光頻梳生成多個波長執(zhí)行并行乘法累加(MAC)運算照捡,在利用相變材料的波導網(wǎng)絡中進行非相干相加(此處的光頻梳利用了工作在耗散克爾孤子態(tài)(dissipative Kerr soliton states, DKS)的芯片級微梳,因為其可以生成寬帶话侧、低噪栗精、完全集成的光頻梳)。a瞻鹏,數(shù)字和模擬電子架構(gòu)與我們的光子張量核心架構(gòu)的比較悲立。數(shù)字電子(左)需要分布在多個內(nèi)核上的許多連續(xù)處理步驟來計算圖像的卷積運算,而整個 MVM 可以使用模擬電子內(nèi)存計算(中)一步執(zhí)行新博。光子內(nèi)存計算(右)將波長復用作為額外的自由度薪夕,在單個時間步長內(nèi)實現(xiàn)多個 MVM 操作。b赫悄,用于計算卷積運算的完全集成光子架構(gòu)的概念圖原献。片上激光器(此處未使用)泵浦集成的 Si3N4 微諧振器以生成寬帶孤子頻率梳。形成輸入向量的單個梳齒被高速調(diào)制埂淮,與非易失性相變存儲單元矩陣相乘姑隅,并沿光電探測器上的每一列求和。c倔撞,通過將卷積操作映射到一系列 MVM運算讲仰,將具有 din 通道的輸入圖像(左)與大小為 k × k 的 dout 核進行卷積。輸入圖像被映射到一系列大小為 (din × k2) × 1(中)的 (n ? k + 1)2 個輸入向量痪蝇,并乘以維度為 (din × k2) × dout(右)的濾波矩陣鄙陡。每條梳狀線對應輸入向量的一個元素(entry),并根據(jù)輸入矩陣的像素值進行調(diào)制躏啰。



(2)輸入矢量使用具有不同振幅強度的不同波長編碼后柔吼,送入不同的矩陣輸入口。(PCM處于晶體態(tài)時丙唧,吸收絕大部分光愈魏,表示“0”;處于無定形態(tài)時,大部分光被傳輸培漏,表示“1”溪厘;中間的傳輸態(tài)通過可控切換 PCM 單元中無定形部分和結(jié)晶部分的比例,獲得正和負的矩陣元素牌柄。)多波長的應用允許同時執(zhí)行多個計算畸悬。a, 基本 MVM:矢量在具有波長(X1到Xm)的氮化硅 (Si3N4) 光子集成孤子頻率梳(微梳)的單個梳齒的振幅中編碼,并發(fā)送到相應的矩陣輸入波導珊佣。矩陣元素由PCM的狀態(tài)決定蹋宦,PCM貼在波導上。選擇定向耦合器的分光比咒锻,使得每個輸入的相同比例的光到達輸出口冷冗。b,用于頻率梳生成的基于高Q Si3N4 光子芯片的微諧振器的光學顯微照片惑艇。c蒿辙,制造的 16 × 16 的光學顯微照片。插圖顯示了一個 4 × 4 矩陣滨巴,帶有 3D 打印的輸入和輸出耦合器思灌,以實現(xiàn)寬帶操作。右側(cè)的特寫 SEM 圖像更詳細地顯示了 3D 打印的耦合器(底部)和波導與 PCM(頂部)的交叉恭取。d泰偿,多路復用全光MVM 的示意圖。輸入向量是由連續(xù)波 (CW) 激光器驅(qū)動的光子芯片級 DKS 頻率梳的行產(chǎn)生的蜈垮,使用波分復用器 (MUX) 和可變光衰減器 (VOA)甜奄。不同輸入向量的條目再次使用波長復用組合在一起,并發(fā)送到執(zhí)行計算的片上MAC 單元窃款。將正確的波長與光波分解復用器 (DEMUX) 結(jié)合后,乘法結(jié)果從光電探測器 (PD) 獲得牍氛,然后進行數(shù)字信號處理 (DSP)晨继。請注意,在給定的示例中搬俊,一次操作四個內(nèi)核和四個輸入向量紊扬,導致每個時間步長 64 個 MAC 操作。e唉擂,單孤子頻率梳的測量頻譜餐屎。



參考文獻:Feldmann, J., Youngblood, N., Karpov, M. et al. Parallel convolutional processing using an integrated photonic tensor core. Nature 589, 52–58 (2021).

DOI:https://doi.org/10.1038/s41586-020-03070-1


關于昊量光電

上海昊量光電設備有限公司是國內(nèi)知名光電產(chǎn)品專業(yè)代理商,代理品牌均處于相關領域的發(fā)展前沿玩祟;產(chǎn)品包括各類激光器腹缩、光電調(diào)制器、光學測量設備、精密光學元件等藏鹊,涉及應用領域涵蓋了材料加工润讥、光通訊、生物醫(yī)療盘寡、科學研究楚殿、國防及更細分的前沿市場如量子光學、生物顯微竿痰、物聯(lián)傳感脆粥、精密加工、先進激光制造等影涉;可為客戶提供完整的設備安裝变隔,培訓,硬件開發(fā)常潮,軟件開發(fā)弟胀,系統(tǒng)集成等優(yōu)質(zhì)服務。

 

您可以通過昊量光電的官方網(wǎng)站www.wjjzl.com了解更多的產(chǎn)品信息喊式,或直接來電咨詢4006-888-532孵户。

 

本文章經(jīng)光學前沿授權(quán)轉(zhuǎn)載,商業(yè)轉(zhuǎn)載請聯(lián)系獲得授權(quán)。

国产福利姬视频在线观看,国产原创激情在线观看网站,亚洲欧美日韩激色国产精品,日韩精品亚洲国产