亚洲日韩久久|国偷自产一区二区三区蜜臀国|国产一区二区日韩|99热这里只亚洲无码,无码

AI加速器,實現(xiàn)人工智能創(chuàng)新的核心引擎

日期:2021-04-02 來源:新思科技閱讀:253
核心提示:軟件一直是智能應用領域的創(chuàng)新助推器,而硬件正迅速成為人工智能(AI)領域的核心引擎,值得一提的是,在這個數(shù)據量巨大的環(huán)境中,AI加速器等硬件系統(tǒng)占據了舞臺中心。
軟件一直是智能應用領域的創(chuàng)新助推器,而硬件正迅速成為人工智能(AI)領域的核心引擎。人臉識別、自動駕駛、虛擬輔助,以及眾多其他應用都要依賴AI硬件。預計到2025年,AI的市場規(guī)模將達到650億美元。
 
 
神經網絡等并行計算系統(tǒng)對于能夠處理海量數(shù)據并執(zhí)行自我迭代訓練有著巨大的需求,硬件也因此成為這一領域的主導力量。在這個數(shù)據量巨大的環(huán)境中,AI加速器等硬件系統(tǒng)占據了舞臺中心。
 
AI加速器具有如下眾多優(yōu)勢:
 
● 能效相較于通用型計算設備顯著提高
 
● 降低計算延遲以支持實時應用
 
● 具備可擴展性,能夠取得性能速度改善,其程度甚至能與所用的內核數(shù)達成線性擴展
 
● 異構架構支持系統(tǒng)容納多個專用處理器以執(zhí)行特定任務
 
AI加速器支持數(shù)據中心和邊緣
 
AI加速器主要在兩大領域發(fā)揮作用:數(shù)據中心和邊緣。現(xiàn)在的數(shù)據中心需要大規(guī)模的可拓展計算架構,尤其是那些可支持多達數(shù)千臺物理服務器和數(shù)百萬臺虛擬機的超大規(guī)模數(shù)據中心,對大規(guī)??蓴U展計算架構的需求極為迫切,這一市場需求使得一些企業(yè)憑借加速AI工作負載這一業(yè)務發(fā)展壯大。例如,Cerebras為Cerebras CS-1深度學習系統(tǒng)創(chuàng)造了晶圓級引擎(WSE)。WSE面積為46,225mm²,擁有1.2 萬億個晶體管和40萬個經過AI優(yōu)化的內核,是迄今為止最大的芯片。WSE可提供更大的算力、存儲和通信帶寬,能夠支持AI研究達到前所未有的速度和規(guī)模。與之相對的是硬件基板面有限且節(jié)能至為關鍵的邊緣應用。如果邊緣SoC內部集成了AI加速器IP ,則它可以快速提供必要的智能功能從而支持各種應用,例如智能手機或自動化工廠機器人中運行的交互式程序。對于在邊緣提供智能應用,支持它們的 AI加速器必須經過優(yōu)化,以具備諸如實時計算延遲、超高能效、失效安全運行以及高度可靠性等特征。
 
并不是所有AI應用都需要像WSE這么大的芯片,例如以下類型的硬件AI加速器:
 
● 能夠執(zhí)行時間神經網絡處理的圖形處理單元 (GPU)
 
● Google張量處理單元 (TPU) 等空間加速器
 
● Sambanova的DataScale等粗粒度可重構計算架構 (CGRA)
 
● 經過向量處理擴展的大規(guī)模多核標量處理器
 
所有此類芯片均可以幾十個或幾百個組合使用,形成更大的系統(tǒng),處理更大型的神經網絡。比如說,如果將Google的TPU合并到pod配置中,那么可以帶來超過100 petaFLOPS的處理能力來訓練神經網絡模型。NVIDIA旗下應用深度學習研究團隊推出的Megatron創(chuàng)造了一個帶有83億參數(shù)轉換器的語言模型,可提供8路模型并行和64路數(shù)據并行功能用于自然語言處理。要執(zhí)行這一模型,就必須開發(fā)出具有 312 teraFLOP FP16計算能力的NVIDIA A100 GPU。另一種新興的硬件類型是 CGRA,它能在編程不同網絡時,在性能、能效與靈活性方面巧妙地實現(xiàn)權衡。
 
在這場關于AI硬件的討論中,軟件棧是不容忽視的存在,因為它能實現(xiàn)系統(tǒng)級性能表現(xiàn),并確保充分利用硬件。TensorFlow等開源軟件平臺為開發(fā)人員提供各類工具、庫和其他資源,幫助他們輕松構建和部署機器學習應用。Facebook Glow等機器學習編譯器不斷涌現(xiàn),有助于促成高級軟件框架與各種AI加速器的連接。
 
種類全面的AI設計產品組合
 
硬件已經成為AI應用的關鍵組件,但此類組件仍然面臨特有的設計難題,在云和邊緣應用想要突破當前硅技術的功耗、性能和面積(PPA)極限時尤其如此。對數(shù)據中心來說,件設計呈現(xiàn)多級物理分層、局部同步和全局異步架構、尺寸龐大和布局分散等特征。在邊緣應用中, AI設計必須能夠處理數(shù)以百計的設計角,以滿足超低功耗要求,實現(xiàn)異構集成并具備超乎尋常的多變性。
 
新思科技能夠為AI硬件設計人員提供業(yè)內最為全面的AI設計產品組合,幫助他們攻克此類難題。我們的產品,以邊緣設備IP、Zebu® Server 4仿真系統(tǒng),全面輻射整個范圍,并能快速將載復雜的工作負載引入到Fusion Design Platform,實現(xiàn)全流程的、且經AI改進結果質量(QoR)和結果轉化時間(TTR)的IC設計。
 
新思科技還推出DSO.ai™(設計空間優(yōu)化AI),這是業(yè)內首款針對芯片設計的自主AI應用。DSO.ai™ 在非常大的芯片設計解決方案范圍內尋找優(yōu)化目標。它減少了設計工作流中自動執(zhí)行的間接決策,從而大幅加快了專用AI加速器的設計進度。
 
隨著AI應用更加深入地融入我們的生活,AI加速器等硬件將會繼續(xù)發(fā)揮關鍵作用,實現(xiàn)實時響應,為智能設備和系統(tǒng)創(chuàng)造更大價值。 
打賞
聯(lián)系客服 投訴反饋  頂部