醉愛琳兒提示您:看後求收藏(品書網www.vodtw.tw),接著再看更方便。
存算一體晶片將在垂直細分領域迎來規模化商用。
存算一體旨在計算單元與儲存單元融合,在實現資料儲存的同時直接進行計算,以消除資料搬移帶來的開銷, 極大提升運算效率,以實現計算儲存的高效節能。存算一體非常符合高訪存、高並行的人工智慧場景計算需求。在產業和投資的驅動下,基於 SRAm,dRAm,Flash 儲存介質的產品進入驗證期,將優先在低功耗、小算力的端側如智慧家居、可穿戴裝置、泛機器人、智慧安防等計算場景落地。 未來,隨著存算一體晶片在雲端推理大算力場景落地,或將帶來計算架構的變革。它推動傳統的以計算為中心的架構向以資料為中心的架構演進,並對雲端計算、人工智慧、物聯網等產業發展帶來積極影響。
著 AI 在各領域的應用逐漸廣泛, 以深度學習為代表的神經網路演算法需要系統高效處理海量的非結構化資料,例如文字、影片、影象、語音等。而傳統馮· 諾依曼體系下執行的計算機通常包括儲存單元和計算單元兩部分,資料需要在處理器與儲存器之間進行頻繁遷移,如果記憶體的傳輸速度跟不上 cpU的效能,就會導致計算能力受到限制,出現“記憶體牆” “功耗強”。這就對晶片的並行運算、低延遲、頻寬提出了更高的要求。
近年來,產業界領軍企業在存算一體的前沿技術研究上持續發力。三星在頂級學術期刊 Nature 上發表了全球首個基於 mRAm(磁性隨機儲存器)的存內計算研究;臺積電在 ISScc 上合作發表了六篇關於存內計算儲存器 Ip 的論文, 大力推進基建 ReRAm 的存內計算方案;SK 海力士則發表了基於 GddR 介面的dRAm 存內計算研究。學術界和產業界普遍認為存算一體有望成為突破算力效能和功耗瓶頸的技術方向之一。特別是在大規模平行計算場景中,例如 VR\/AR、無人駕駛、天文資料計算、遙感影像資料分析等,存算一體晶片具備高頻寬、低功耗的顯著優勢。微觀上,算力是一個具體的技術指標。算的快(高吞吐、低延遲)、算的準(高精準度)、算的省(低成本、低功耗)是對算力的基本要求。存算一體是從微觀層面進行架構的最佳化,面臨儲存器設計和生產工藝的挑戰,需要整個產業鏈的參與支援。
實現存算一體的技術路徑主要有以下三個:技術較成熟的是近存計算,利用先進封裝技術把計算邏輯晶片和儲存器封裝到一起,透過減少記憶體和處理單元的路徑,以高 I\/o 密度來實現高記憶體頻寬以及較低的訪問開銷。近存計算主要透過 2.5d、3d 堆疊來實現,廣泛應用在各類 cpU 和 GpU 上;近期投資熱度較高的是存內計算,透過傳統的儲存介質如dRAm、SRAm、NoR Flash、NANdFlash 來實現。計算操作由位於儲存晶片\/ 區域內部的獨立計算單元完成,更適用於演算法固定的場景;技術尚處於探索期的是基於非易失性儲存器技術做的新型儲存原件,比如透過憶阻器 ReRAm 電阻調製來實現資料儲存。其他如相變儲存器(pcm)、自旋磁儲存器 (mRAm) 等,也作為存算一體新的技術路徑。存算一體的計算方式分為數字計算和模擬計算。數字計算主要以SRAm 作為儲存器件,具有高效能、高精度的優勢,更適合大算力高能效場景。模擬計算通常使用 FLASh、ReRAm 等非易失性介質作為儲存器件, 儲存密度大,並行度高,更適合小算力, 計算精度要求不高的場景。
目前,存算一體已經在產業細分領域掀起了創業浪潮,並受到投資界和產業界的關注和投入。存算一體在技術上向著高精度、高算力和高能效的方向發展。在資本和產業雙輪驅動下,基於 SRAm、NoR Flash 等成熟儲存器的存內