一、人工智能的高速發(fā)展催生AI芯片
隨著大數(shù)據(jù)的發(fā)展,計(jì)算能力的提升,人工智能近兩年迎來(lái)了新一輪的爆發(fā)。而人工智能的實(shí)現(xiàn)依賴(lài)三個(gè)要素:算法是核心,硬件和數(shù)據(jù)是基礎(chǔ),芯片就是硬件的最重要組成部分。它其實(shí)包括兩個(gè)計(jì)算過(guò)程:1、訓(xùn)練(Train);2、應(yīng)用(Inference)。
為什么需要人工智能芯片?神經(jīng)網(wǎng)絡(luò)算法應(yīng)用的不斷發(fā)展,使得傳統(tǒng)的 CPU 已經(jīng)無(wú)法負(fù)擔(dān)幾何級(jí)增長(zhǎng)的計(jì)算量。深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的分支,是當(dāng)前人工智能研究的主流方式。簡(jiǎn)單說(shuō)就是用數(shù)學(xué)方法模擬人腦神經(jīng)網(wǎng)絡(luò),用大量數(shù)據(jù)訓(xùn)練機(jī)器來(lái)模擬人腦學(xué)習(xí)過(guò)程,其本質(zhì)是把傳統(tǒng)算法問(wèn)題轉(zhuǎn)化為數(shù)據(jù)和計(jì)算問(wèn)題。所以對(duì)底層基礎(chǔ)芯片的要求也發(fā)生了根本性改變:人工智能芯片的設(shè)計(jì)目的不是為了執(zhí)行指令,而是為了大量數(shù)據(jù)訓(xùn)練和應(yīng)用的計(jì)算。
AI芯片的誕生之路
資料來(lái)源:公開(kāi)資料整理
二、人工智能芯片三種技術(shù)路線分析
目前適合深度學(xué)習(xí)的人工智能芯片主要有GPU、FPGA、ASIC三種技術(shù)路線。三類(lèi)芯片代表分別有英偉達(dá)(NVIDIA)的Tesla系列GPU、賽靈思(Xilinx)的FPGA和Google的TPU。GPU 最先被引入深度學(xué)習(xí),技術(shù)最為成熟;FPGA具有硬件可編程特點(diǎn),性能出眾但壁壘高。ASCI 由于可定制、低成本是未來(lái)終端應(yīng)用的趨勢(shì)。
1、DPU
GPU使用SIMD(單指令多數(shù)據(jù)流)來(lái)讓多個(gè)執(zhí)行單元以同樣的步伐來(lái)處理不同的數(shù)據(jù),原本用于處理圖像數(shù)據(jù),但其離散化和分布式的特征,以及用矩陣運(yùn)算替代布爾運(yùn)算適合處理深度學(xué)習(xí)所需要的非線性離散數(shù)據(jù)。作為加速器的使用,可以實(shí)現(xiàn)深度學(xué)習(xí)算法。
GPU由并行計(jì)算單元和控制單元以及存儲(chǔ)單元構(gòu)成GPU擁有大量的核(多達(dá)幾千個(gè)核)和大量的高速內(nèi)存,擅長(zhǎng)做類(lèi)似圖像處理的并行計(jì)算,以矩陣的分布式形式來(lái)實(shí)現(xiàn)計(jì)算。同CPU不同的是,GPU的計(jì)算單元明顯增多,特別適合大規(guī)模并行計(jì)算。
GPU與CPU的比較
資料來(lái)源:中商產(chǎn)業(yè)研究院
2、FPGA
FPGA是用于解決專(zhuān)用集成電路的一種方案。專(zhuān)用集成電路是為特定用戶(hù)或特定電子系統(tǒng)制作的集成電路。人工智能算法所需要的復(fù)雜并行電路的設(shè)計(jì)思路適合用FPGA實(shí)現(xiàn)。FPGA計(jì)算芯片布滿(mǎn)“邏輯單元陣列”,內(nèi)部包括可配置邏輯模塊,輸入輸出模塊和內(nèi)部連線三個(gè)部分,相互之間既可實(shí)現(xiàn)組合邏輯功能又可實(shí)現(xiàn)時(shí)序邏輯功能的獨(dú)立基本邏輯單元。
FPGA相對(duì)于CPU與GPU有明顯的能耗優(yōu)勢(shì),主要有兩個(gè)原因。首先,在FPGA中沒(méi)有取指令與指令譯碼操作,在Intel的CPU里面,由于使用的是CISC架構(gòu),僅僅譯碼就占整個(gè)芯片能耗的50%;在GPU里面,取指令與譯碼也消耗了10%~20%的能耗。其次,FPGA的主頻比CPU與GPU低很多,通常CPU與GPU都在1GHz到3GHz之間,而FPGA的主頻一般在500MHz以下。如此大的頻率差使得FPGA消耗的能耗遠(yuǎn)低于CPU與GPU。
3、ASIC
ASIC(專(zhuān)用定制芯片)是為實(shí)現(xiàn)特定要求而定制的芯片,具有功耗低、可靠性高、性能高、體積小等優(yōu)點(diǎn),但不可編程,可擴(kuò)展性不及FPGA,尤其適合高性能/低功耗的移動(dòng)端。
目前,VPU和TPU都是基于ASIC架構(gòu)的設(shè)計(jì)。針對(duì)圖像和語(yǔ)音這兩方面的人工智能定制芯片,目前主要有專(zhuān)用于圖像處理的VPU,以及針對(duì)語(yǔ)音識(shí)別的FAGA和TPU芯片。
圖像應(yīng)用和語(yǔ)音應(yīng)用人工智能定制芯片
資料來(lái)源:中商產(chǎn)業(yè)研究院