深度學(xué)習(xí)是發(fā)展最快的機器學(xué)習(xí)方法之一硕勿,它利用在計算機中實現(xiàn)的多層人工神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)的表示和抽象進行數(shù)字化學(xué)習(xí)哨毁,并執(zhí)行高級任務(wù),與人類專家的表現(xiàn)相當(dāng)甚至優(yōu)于人類專家源武。深度學(xué)習(xí)的最新應(yīng)用進展主要包括醫(yī)學(xué)圖像分析扼褪、語音識別、語言翻譯粱栖、圖像分類等话浇。除了這些主流應(yīng)用之外,深度學(xué)習(xí)方法也被用于解決逆成像問題闹究。
博覽:2018 Science使用衍射深度神經(jīng)網(wǎng)絡(luò)的全光機器學(xué)習(xí)
技術(shù)背景:
深度學(xué)習(xí)是發(fā)展最快的機器學(xué)習(xí)方法之一幔崖,它利用在計算機中實現(xiàn)的多層人工神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)的表示和抽象進行數(shù)字化學(xué)習(xí),并執(zhí)行高級任務(wù)渣淤,與人類專家的表現(xiàn)相當(dāng)甚至優(yōu)于人類專家赏寇。深度學(xué)習(xí)的最新應(yīng)用進展主要包括醫(yī)學(xué)圖像分析、語音識別价认、語言翻譯嗅定、圖像分類等。除了這些主流應(yīng)用之外用踩,深度學(xué)習(xí)方法也被用于解決逆成像問題渠退。
當(dāng)前不足:
當(dāng)前的深度學(xué)習(xí)框架主要是在計算機中訓(xùn)練及執(zhí)行的,而受限于摩爾定律接近其物理極限脐彩,硅基計算機的性能增長已經(jīng)逐漸達到不可持續(xù)的水平碎乃,急需新一代的計算模式。
文章創(chuàng)新點:
基于此丁屎,美國加州大學(xué)洛杉磯分校(UCLA)Aydogan Ozcan組的Xing Lin和Yair Rivenson(共同一作)提出了一種全光衍射深度學(xué)習(xí)框架荠锭。通過計算機訓(xùn)練出其每一層的參數(shù)旱眯,然后使用3D打印加工晨川,組裝完成后可以光速完成特定的任務(wù)。作者展示了全光衍射深度學(xué)習(xí)網(wǎng)絡(luò)在分類任務(wù)和單位放大率成像應(yīng)用中的能力删豺。
原理解析:
(1) 衍射深度神經(jīng)網(wǎng)絡(luò)共虑。如圖1a所示,衍射深度神經(jīng)網(wǎng)絡(luò)由多個透射(或反射)層組成呀页,每一層上的每一個點(可以理解為尺寸較大的像素,如300um尺寸妈拌,它也可以更小,從而增大單位面積上的像素數(shù),即增加網(wǎng)絡(luò)的復(fù)雜性)都是一個神經(jīng)元(具體物理原理是尘分,下一層的任一神經(jīng)元所接收的光場是上一層每一個神經(jīng)元所傳遞的帶有不同權(quán)重的相干球面子波的線性疊加猜惋。這個權(quán)重由衍射理論決定,求解過程使用角譜法求解)培愁。這個神經(jīng)元具有復(fù)數(shù)值的透射(或反射)系數(shù)著摔。每層的這些透射/反射系數(shù)通過在計算機上使用深度學(xué)習(xí)的方法訓(xùn)練得到。然后由3D打印制造出每一層定续,用于以光速執(zhí)行特定的任務(wù)谍咆。圖1b是用于分類任務(wù)的衍射深度神經(jīng)網(wǎng)絡(luò),圖1c是用于成像任務(wù)的衍射深度神經(jīng)網(wǎng)絡(luò)私股。圖1d是衍射深度神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)之間的比較摹察。衍射深度神經(jīng)網(wǎng)絡(luò)是乘性偏置項,即每一層每一個像素的調(diào)制系數(shù)倡鲸,衍射深度神經(jīng)網(wǎng)絡(luò)的權(quán)重基于自由空間衍射傳播供嚎,電子神經(jīng)網(wǎng)絡(luò)是指在計算機中虛擬實現(xiàn)的傳統(tǒng)神經(jīng)網(wǎng)絡(luò)。
(2) 物理實現(xiàn)旦签。衍射深度神經(jīng)網(wǎng)絡(luò)在計算機上訓(xùn)練完成后查坪,需要3D打印的網(wǎng)絡(luò)層的3D模型用泊松表面重建(Poisson surface reconstruction,此法可以獲得較為平滑的表面模型,對噪聲有一定容忍度宁炫,是表面重建領(lǐng)域的主流方法)生成偿曙。最終,神經(jīng)元的相位值在物理實現(xiàn)上轉(zhuǎn)化為這個神經(jīng)元的物理厚度羔巢,3D打印材料使用VeroBlackPlus RGD875望忆。Meshlab軟件用于計算3D結(jié)構(gòu),并將其作為3D打印機(Objet30 Pro 3D, Stratasys Ltd, USA)的輸入竿秆。如圖2A和B是訓(xùn)練出的網(wǎng)絡(luò)層及其3D打印的實物启摄。圖2C和D是實驗用太赫茲裝置。
(3) 網(wǎng)絡(luò)訓(xùn)練幽钢。如圖3A歉备,使用TensorFlow框架訓(xùn)練網(wǎng)絡(luò)結(jié)構(gòu)。因為使用相干照明匪燕,輸入信息可以在輸入平面被振幅和/或相位編碼蕾羊。自由空間傳播模塊使用衍射計算中常用的角譜法完成。為了便于網(wǎng)絡(luò)的3D打印和加工帽驯,每一個神經(jīng)元的相位值被sigmoid函數(shù)限制在0-2π(成像任務(wù))和0-π(分類任務(wù))龟再。每一層的神經(jīng)元大小設(shè)為400um(分類任務(wù))和300um(成像任務(wù))。如果使用更高精度的3D打印機或加工方法尼变,可以使用更小的神經(jīng)元來學(xué)習(xí)更復(fù)雜的任務(wù)利凑。在探測器/輸出平面,測量網(wǎng)絡(luò)的輸出強度,用其與Ground Truth之間的均方根誤差作為損失函數(shù)哀澈,來訓(xùn)練網(wǎng)絡(luò)牌借。使用Adam優(yōu)化器來反向傳播誤差,并更新網(wǎng)絡(luò)的每一層割按,從而最小化損失函數(shù)走哺。
附錄:
(1) 前向傳播模型
由上一層坐標(biāo)為(xi,yi,zi)的神經(jīng)元到下一層坐標(biāo)為(x,y,z)的神經(jīng)元,子波傳輸?shù)墓鈱W(xué)模型為(L的小寫字母l代表第l層)
其中
每個神經(jīng)元的透射系數(shù)可以表示為
每一神經(jīng)元接收到的子波疊加光場為
因此哲虾,第l層第i個神經(jīng)元的輸出光場是其接收光場與透射系數(shù)和子波傳遞光學(xué)模型的乘積丙躏,可以寫為
將(2)簡寫為
p代表下一層的第p個神經(jīng)元。
第0層
最終檢測到的輸出平面測量值為
(2)誤差反向傳播
使用輸出平面的測量強度值和目標(biāo)的均方根誤差作為損失函數(shù)
要求解的優(yōu)化問題為
計算損失函數(shù)相對于所有可訓(xùn)練網(wǎng)絡(luò)變量的梯度束凑,然后用于在訓(xùn)練階段的每個周期更新網(wǎng)絡(luò)層晒旅。
參考文獻:X. Lin, Y. Rivenson, N. T. Yardimci, M. Veli, Y. Luo, M. Jarrahi, A. Ozcan, All-optical machine learning using diffractive deep neural networks. Science 361, 1004–1008 (2018).
DOI:https://www.science.org/doi/abs/10.1126/science.aat8084
關(guān)于昊量光電:
上海昊量光電設(shè)備有限公司是國內(nèi)知名光電產(chǎn)品專業(yè)代理商,代理品牌均處于相關(guān)領(lǐng)域的發(fā)展前沿汪诉;產(chǎn)品包括各類激光器废恋、光電調(diào)制器、光學(xué)測量設(shè)備扒寄、精密光學(xué)元件等鱼鼓,涉及應(yīng)用領(lǐng)域涵蓋了材料加工、光通訊该编、生物醫(yī)療迄本、科學(xué)研究、國防及更細分的前沿市場如量子光學(xué)课竣、生物顯微嘉赎、物聯(lián)傳感、精密加工于樟、先進激光制造等公条;可為客戶提供完整的設(shè)備安裝,培訓(xùn)迂曲,硬件開發(fā)靶橱,軟件開發(fā),系統(tǒng)集成等優(yōu)質(zhì)服務(wù)路捧。
您可以通過昊量光電的官方網(wǎng)站www.wjjzl.com了解更多的產(chǎn)品信息关霸,或直接來電咨詢4006-888-532。
本文章經(jīng)光學(xué)前沿授權(quán)轉(zhuǎn)載,商業(yè)轉(zhuǎn)載請聯(lián)系獲得授權(quán)鬓长。