無需明確指令即可快速朱巨、高效地學習、組合和分析大量信息的計算機正在成為處理大型數(shù)據(jù)集的強大工具枉长〖叫“深度學習”算法因其在圖像識別、語言翻譯必峰、決策問題等方面的實用性而在學術(shù)界和工業(yè)界引起了很大的興趣洪唐。傳統(tǒng)的中央處理單元 (central processing unit,CPU)不是實現(xiàn)這些算法的好選擇,學術(shù)界和工業(yè)界越來越致力于開發(fā)針對人工神經(jīng)網(wǎng)絡(luò)(artificial neural network, ANN)和深度學習中的應(yīng)用程序量身定制的新硬件架構(gòu)吼蚁。如圖形處理單元(graphical processing unit, GPU)凭需、專用集成電路(application-specific integrated circuit, ASIC)、現(xiàn)場可編程門陣列(field-programmable gate array, FPGA)肝匆、IBM TrueNorth和Google TPU等粒蜈,提高了學習任務(wù)的能效和速度。同時旗国,實現(xiàn)尖峰處理和儲層計算的混合光電系統(tǒng)也已得到證明枯怖。
展示全部
博覽:2017 NaturePhotonics 使用相干納米光子電路進行深度學習
技術(shù)背景:
無需明確指令即可快速、高效地學習能曾、組合和分析大量信息的計算機正在成為處理大型數(shù)據(jù)集的強大工具度硝。“深度學習”算法因其在圖像識別寿冕、語言翻譯蕊程、決策問題等方面的實用性而在學術(shù)界和工業(yè)界引起了極大的興趣。傳統(tǒng)的中央處理單元 (central processing unit,CPU)不是實現(xiàn)這些算法的好選擇驼唱,學術(shù)界和工業(yè)界越來越致力于開發(fā)針對人工神經(jīng)網(wǎng)絡(luò)(artificial neural network, ANN)和深度學習中的應(yīng)用程序量身定制的新硬件架構(gòu)藻茂。如圖形處理單元(graphical processing unit, GPU)、專用集成電路(application-specific integrated circuit, ASIC)、現(xiàn)場可編程門陣列(field-programmable gate array, FPGA)捌治、IBM TrueNorth和Google TPU等岗钩,提高了學習任務(wù)的能效和速度。同時肖油,實現(xiàn)尖峰處理和儲層計算的混合光電系統(tǒng)也已得到證明。
全光神經(jīng)網(wǎng)絡(luò) (optical neural network, ONN) 為微電子和混合光電子實現(xiàn)提供了一種有前途的替代方法臂港。出于多種原因森枪,人工神經(jīng)網(wǎng)絡(luò)很適合使用全光計算實現(xiàn)。(1) 它們嚴重依賴于固定的矩陣乘法审孽。線性變換(和某些非線性變換)可以以光速執(zhí)行县袱,并在光子網(wǎng)絡(luò)中以超過100GHz的速率進行檢測,并且在某些情況下佑力,功耗低式散。例如,普通鏡頭進行傅立葉變換時無需任何功耗打颤,某些矩陣運算也可以在不耗費功耗的情況下以光學方式進行暴拄。(2)它們對非線性的要求較弱。事實上编饺,許多固有的光學非線性可以直接用于在ONN中實現(xiàn)非線性操作乖篷。(3) 一旦神經(jīng)網(wǎng)絡(luò)被訓練,其將在沒有額外能量輸入的情況下對光信號進行計算透且。這些功能可以使ONN比電子同類產(chǎn)品更節(jié)能撕蔼、速度更快。然而秽誊,迄今為止鲸沮,由于需要相位穩(wěn)定性和大量神經(jīng)元,使用大塊光學元件(如光纖和透鏡)實現(xiàn)此類轉(zhuǎn)換一直是一個主要障礙锅论。集成光子通過為大型讼溺、相位穩(wěn)定的光學轉(zhuǎn)換提供可擴展的解決方案來解決這個問題。
當前不足:
人工神經(jīng)網(wǎng)絡(luò)是受大腦信號處理啟發(fā)的計算網(wǎng)絡(luò)模型棍厌。這些模型顯著提高了許多機器學習任務(wù)的性能(如語音和圖像識別)肾胯。然而,受限于馮·諾伊曼計算架構(gòu)耘纱,今天的計算硬件在實現(xiàn)神經(jīng)網(wǎng)絡(luò)方面效率低下敬肚。
文章創(chuàng)新點:
基于此,美國麻省理工學院的Yichen Shen(一作兼通訊)和Nicholas C.Harris(共一束析,共通訊)提出了一種全光神經(jīng)網(wǎng)絡(luò)架構(gòu)艳馒,在處理傳統(tǒng)的推理任務(wù)時,能夠在計算速度和能效上的電子架構(gòu)更優(yōu)越。
原理解析:
(1) ONN的一般架構(gòu)弄慰。如圖1a所示第美,ANN一般由輸入層、至少一個隱藏層陆爽、一個輸出層組成什往。每一層包含輸入的線性組合和隨后的非線性激活函數(shù)輸出,具體到ONN架構(gòu)里慌闭,每一層可以分解為由光學干涉單元(optical interference unit, OIU)執(zhí)行光學矩陣乘法和光學非線性單元(optical nonlinearity unit, ONU)執(zhí)行非線性激活(ONU可以使用常見的光學非線性來實現(xiàn)别威,如飽和吸收和雙穩(wěn)態(tài)),見圖1b驴剔、c省古。執(zhí)行任務(wù)時,需要處理的數(shù)據(jù)首先在計算機上預處理成高維向量丧失,預處理的信號隨后編碼成在光子集成電路中傳播的光脈沖幅度豺妓,從而實現(xiàn)多層ONN,見圖1d布讹。每一層ONN由OIU和ONU組成琳拭。原則上,ONN可以完全在光域中實現(xiàn)任意深度和維度的ANN炒事。
(2) OIU實現(xiàn)臀栈。由于一個一般的實值矩陣(M)可以通過奇異值分解(SVD)分解為 M=UΣV?,其中U是一個m×m酉矩陣挠乳,Σ是一個m×n的矩形對角矩陣(對角線上為非負實數(shù))权薯,V?是n×n酉矩陣V的復共軛。任何酉變換U,V? 都可以用光學分束器和移相器實現(xiàn)睡扬,Σ可以使用光衰減器來實現(xiàn)(也可以使用光放大材料盟蚣,如半導體或染料)。 以上述方式實現(xiàn)的酉矩陣的矩陣乘法原則上無功耗(ANN計算主要涉及矩陣乘積卖怜,因此屎开,ONN架構(gòu)具有極高的能效)。
具體實現(xiàn):
構(gòu)建一個兩層的神經(jīng)網(wǎng)絡(luò)用于元音識別马靠。
(1) OIU使用一個由56個可編程的馬赫-曾德爾干涉儀(MZI)組成的可編程納米光子處理器(programmable nanophotonic processor, PNP)實現(xiàn)奄抽。每一個MZI包含在兩個50%倏逝波定向耦合器之間的熱-光移相器(θ),隨后是另一個移相器(φ)甩鳄,見圖2c逞度、d。如圖2a妙啃、b档泽,激光耦合進OIU單元完成矩陣變換俊戳,隨后被光電二極管陣列探測,然后被計算機讀取并模擬非線性激活函數(shù)馆匿,激光重新注入OIU執(zhí)行下一層(兩個OIU完成一次奇異值分解)抑胎。
(2) 片上訓練。通常渐北,神經(jīng)網(wǎng)絡(luò)的參數(shù)使用梯度下降的方法訓練得到阿逃,在計算機上,常見的方式是使用反向傳播方法計算梯度腔稀,這個過程非常耗時盆昙。在ONN上使用前向傳播和有限差方法(finite difference method)可以直接獲得每一個不同參數(shù)的梯度(即無需反向傳播),速度極快且功耗低焊虏。
實驗結(jié)果:
參考文獻:Shen, Y., Harris, N., Skirlo, S. et al. Deep learning with coherent nanophotonic circuits. Nature Photon 11, 441–446 (2017).
DOI:https://doi.org/10.1038/nphoton.2017.93
更多詳情請聯(lián)系昊量光電/歡迎直接聯(lián)系昊量光電
關(guān)于昊量光電:
上海昊量光電設(shè)備有限公司是光電產(chǎn)品專業(yè)代理商蒋院,產(chǎn)品包括各類激光器稽鞭、光電調(diào)制器、光學測量設(shè)備咪惠、光學元件等澎嚣,涉及應(yīng)用涵蓋了材料加工疏尿、光通訊、生物醫(yī)療易桃、科學研究褥琐、國防、量子光學晤郑、生物顯微敌呈、物聯(lián)傳感、激光制造等造寝;可為客戶提供完整的設(shè)備安裝磕洪,培訓,硬件開發(fā)诫龙,軟件開發(fā)析显,系統(tǒng)集成等服務(wù)。
您可以通過我們昊量光電的官方網(wǎng)站www.wjjzl.com了解更多的產(chǎn)品信息签赃,或直接來電咨詢4006-888-532谷异。
本文章經(jīng)光學前沿授權(quán)轉(zhuǎn)載,商業(yè)轉(zhuǎn)載請聯(lián)系獲得授權(quán)。