利用被稱為 CDNN 的框架對網絡生成策略進行改進。經過改進的策略采用在高功耗浮點計算平臺上(利用諸如 Caffe 的傳統(tǒng)網絡生成器)開發(fā)的受訓網絡結構和權重,并將其轉化為基于定點運算,結構緊湊的輕型的定制網絡模型。接下來,此模型會在一個基于專門優(yōu)化的成像和視覺 DSP 芯片的低功耗嵌入式平臺上運行。圖 1 顯示了輕型嵌入式神經網絡的生成過程。與原始網絡相比,這種技術可在當今量產型車輛的有限功率預算下帶來高性能的神經處理表現(xiàn),而圖像識別精確度降低不到1%。
圖 1. CDNN 將通過傳統(tǒng)方法生成的網絡權重轉化為一個定點網絡
一個由低功耗嵌入式平臺托管的輸入大小為 224x224、卷積過濾器分別為 11x11、5x5 及 3x3 的 24 層卷積神經網絡, 其性能表現(xiàn)幾乎是一個在典型的 GPU/CPU 綜合處理引擎上運行的類似 CNN 的三倍,盡管其所需的內存帶寬只是后者的五分之一且功耗大幅降低。
下一代深度學習神經網絡
汽車制造業(yè)進入神經網絡領域所習得的經驗不斷推動技術的發(fā)展,并因此開發(fā)出了更先進的網絡架構及更復雜的拓撲,如每級多層拓撲、多入/多出及全卷積網絡。新推出的重要網絡類型不僅可用來識別物體,也可用來識別場景,從而提供用以解決汽車領域應用程序(如自動駕駛功能)所需的圖像分割。
當然,中國 40 家左右的汽車制造商并不會在此道路上踽踽獨行。他們會與百度等技術公司進行密切合作。技術公司是這些網絡和架構發(fā)展的核心。CNN 網絡生成器功能的完善也為新的網絡架構和拓撲提供了支持,如 SegNet 及 GoogLeNet 與 ResNet 等其它網絡結構以及高級網絡層(圖 2)。此外,一鍵啟用也讓預訓網絡轉換成優(yōu)化的實時網絡執(zhí)行更為便捷。為確保給常用的網絡生成器提供支持,CDNN 框架與 Caffe 和 TensorFlow (谷歌的機器學習軟件庫)都有合作。
圖 2網絡生成器的發(fā)展為新網絡層及更深的架構提供了支持
由于最新推出的嵌入式處理平臺在可擴展性及靈活性上都有了很大改進,因此嵌入式部署也可以利用這些改進來完善自身。由于深度學習領域的發(fā)展越來越多樣化,因此擁有一個不僅能滿足當今處理需求,也具有適應未來的技術創(chuàng)新的靈活架構非常重要。
神經網絡在自動駕駛的應用