據外媒報道,維也納理工大學光子學研究所的一個研究小組通過應用于模擬數據的傳感器計算,開發出一種加速機器視覺的方法,用圖像傳感器將圖像處理速度提升至傳統技術的數千甚至上萬倍。據悉,其視覺系統設計模仿了大腦對信息處理的方式,只用納秒級時間就能完成簡單圖像的分類。
在目前的技術中,機器視覺是使用一個基本系統來實現的,該系統包括一個帶有對光做出響應的圖像傳感器的裝置,來自圖像傳感器的數據通過另一個設備從模擬信號轉換為數字信號,然后,數字數據由另一臺設備處理,無論是本地設備還是云端設備。雖然該系統在目前的應用中運行良好,但由于在讀取和處理大量圖像數據時存在滯后,因此可能不適合未來的應用。在這項新的工作中,研究人員提出了一種新型的圖像傳感器,能夠在有限的范圍內處理模擬數據。
該小組設想的圖像傳感器是將三個光電二極管嵌入芯片上,以允許使用外加電壓增加或降低其對光的靈敏度,該設置允許每個二極管單獨調諧或加權。在這種情況下,二極管的作用類似于人眼中的神經,當圖像呈現給設備時,所有二極管都會根據它們的調諧一起做出反應,它們充當網絡視覺處理器。當光到達傳感器時,通過添加構成傳感器陣列的每個列和行的光強度來處理。然后,通過根據期望的結果分別調整每個成員,對二極管陣列進行任務訓練。最初的學習階段需要很短的時間,但是一旦網絡經過訓練,處理的速度就等于光電二極管的反應時間。
研究人員設想的設備并非用來產生圖像。相反,它過濾掉不必要的數據并執行一些初始排序。為了測試它,研究人員教他們的設備對三個簡化字母進行排序。他們還用它來做一些非常基本的基于給定圖像關鍵特征的自動編碼。研究人員指出,他們的設計和設備仍處于概念驗證階段,但他們說,迄今為止的發現令人鼓舞。
研究人員介紹說:“我們的圖像傳感器在工作時不會消耗任何電能,被檢測的光子本身就可以作為電流供能。”他著重提到,傳統的機器視覺技術通常能夠每秒處理100幀圖像,一些更快的系統則可以每秒處理1000幀,相比之下,“我們的系統每秒可以處理2000萬幀。”