【儀器儀表商情網(wǎng) 核心技術】最近幾年數(shù)據(jù)量和可訪問性的迅速增長,使得人工智能的算法設計理念發(fā)生了轉變。人工建立算法的做法被計算機從大量數(shù)據(jù)中自動習得可組合系統(tǒng)的能力所取代,使得計算機視覺、語音識別、自然語言處理等關鍵領域都出現(xiàn)了重大突破。深度學習是這些領域中所最常使用的技術,也被業(yè)界大為關注。然而,深度學習模型需要極為大量的數(shù)據(jù)和計算能力,只有更好的硬件加速條件,才能滿足現(xiàn)有數(shù)據(jù)和模型規(guī)模繼續(xù)擴大的需求。現(xiàn)有的解決方案使用圖形處理單元(GPU)集群作為通用計算圖形處理單元(GPGPU),但現(xiàn)場可編程門陣列(FPGA)提供了另一個值得探究的解決方案。日漸流行的FPGA設計工具使其對深度學習領域經(jīng)常使用的上層軟件兼容性更強,使得FPGA更容易為模型搭建和部署者所用。FPGA架構靈活,使得研究者能夠在諸如GPU的固定架構之外進行模型優(yōu)化探究。同時,FPGA在單位能耗下性能更強,這對大規(guī)模服務器部署或資源有限的嵌入式應用的研究而言至關重要。本文從硬件加速的視角考察深度學習與FPGA,指出有哪些趨勢和創(chuàng)新使得這些技術相互匹配,并激發(fā)對FPGA如何幫助深度學習領域發(fā)展的探討。
1.簡介
機器學習對日常生活影響深遠。無論是在網(wǎng)站上點擊個性化推薦內容、在智能手機上使用語音溝通,或利用面部識別技術來拍照,都用到了某種形式的人工智能技術。這股人工智能的新潮流也伴隨著算法設計的理念轉變。過去基于數(shù)據(jù)的機器學習大多是利用具體領域的專業(yè)知識來人工地“塑造”所要學習的“特征”,計算機從大量示例數(shù)據(jù)中習得組合特征提取系統(tǒng)的能力,則使得計算機視覺、語音識別和自然語言處理等關鍵領域實現(xiàn)了重大的性能突破。對這些數(shù)據(jù)驅動技術的研究被稱為深度學習,如今正受到技術界兩個重要群體的關注:一是希望使用并訓練這些模型、從而實現(xiàn)極高性能跨任務計算的研究者,二是希望為現(xiàn)實世界中的新應用來部署這些模型的應用科學家。然而,他們都面臨著一個限制條件,即硬件加速能力仍需加強,才可能滿足擴大現(xiàn)有數(shù)據(jù)和算法規(guī)模的需求。