快科技報道:2023年11月28日,北京國傢會議中心,主題為“到中流擊水”的龍芯產品發佈暨用戶大會盛大上演。
在4000多位合作夥伴、權威媒體、專傢學者、主管部門領導的見證下,新一代通用處理器龍芯3A6000、打印機主控芯片龍芯2P0500重磅發佈,眾多圍繞龍芯3A6000的整機產品登場亮相,龍芯處理器核IP、龍芯自主指令系統架構授權計劃公佈。
多年後如果回望半導體國產化之路,這無疑是一個關鍵的時刻。
極具革命色彩的開幕式
“龍芯之母”黃令儀院士今年4月離開瞭我們,大屏幕上打出的她的豪言壯語令人動容
一、龍芯3A6000:硬件性能飛躍、終於基本完成
龍芯中科董事長胡偉武發表主題演講《將自主進行到底》,而大會主題“到中流擊水”,代表龍芯走到瞭一個關鍵的時刻,正在經歷第二次轉型,從政策性市場為主轉向開放性市場為主。
龍芯3A6000處理器由龍芯中科基於自主的LoongArch龍架構指令集,完全自主設計,有著優異的性能表現,堪稱我國自主桌面處理器設計的又一個裡程碑。
龍芯3A6000龍芯第四代微架構LA64的首款產品,采用自主成熟工藝制造,4個物理核心,支持同時多線程技術(SMT2),因此有8個邏輯核心,主頻為2.5GHz。
內存還是雙通道DDR4-3200,而在安全方面集成可信模塊,支持安全啟動方案和SM2、SM3、SM4國密算法。
龍芯微架構已經演進瞭四代,第一代GS464曾用於龍芯3A1000、龍芯3B1500,第二代GS464E曾用於龍芯3A2000、龍芯3A3000,第三代GS464V/LA464曾用於龍芯3A4000、龍芯3A5000。
可以看到,每代微架構都對應兩代產品,整體采用架構、工藝交替升級的策略,十分類似Intel當年的Tick-Tock策略。
第四代微架構LA664全面提升瞭各項指標,尤其是首次將4發射提升到6發射,同時在ROB、定點/向量物理寄存器、發射隊列、功能部件、載入/存儲隊列等各項指標上,都實現瞭50%到100%的提升,幅度相當之大。
這一代架構上,龍芯終於突破瞭同時多線程技術,追上瞭Intel、AMD,而且從官方數據還是實測看效率也是相當高的。
性能方面大傢見過不少數據瞭。根據中國電子技術標準化研究院賽西實驗室的測試結果,龍芯3A6000 SPEC CPU 2006、SPEC CPU 2017、Stream、Unixbench各項測試的成績都非常突出,無論單核性能還是多核性能,無論整數性能還是浮點性能,都實現瞭大幅度的跨越,甚至遠遠超過Intel、AMD幾代產品的提升。
綜合相關測試結果,龍芯3A6000處理器總體性能與Intel 2020年上市的第10代酷睿i3-10100四核處理器基本相當。
要知道,現在很多用戶還是八九代酷睿的配置。
胡偉武強調,經過多年的“補課”,龍芯3A6000終於基本完成瞭這一任務,與當今主流處理器的差距已經基本全部補齊。
要知道,2002年的龍芯一號,和當時主流的奔騰4差距有20多倍。
2021年的龍芯3A5000已經將這一差距縮小到不到1倍,相當於第三代酷睿i3四核心,而僅僅兩年後,我們就幾乎完全追瞭上來!
龍芯3A6000還隻是全新微架構的第一站,未來一兩年我們還將看到面向服務器的龍芯3C6000、龍芯3D6000、龍芯3E6000,分別支持16核心32線程、32核心64線程、64核心128線程,大大縮小和世界領先產品的差距,無論單核性能還是多核性能。
針對移動終端,下一步將是龍芯2K3000,微架構有所不同采用LA364,當然也是自主的LoongArch龍架構指令集,最多8核心8線程。
龍芯3C6000目前已經完成設計,單芯片放入16個核心,內存支持四通道DDR4-3200,擴展連接支持64條PCIe 4.0,實現成倍乃至數量級的提升。
雖然和世界最先進的十二通道DDR5、128條PCIe 5.0還有一代的差距,但也並非不可逾越的鴻溝。
再通過龍鏈技術(Loongson Coherent Link),將兩顆、四顆龍芯3C6000整合在一起,就可以得到龍芯3D6000、龍芯3E6000。
這是一項支撐Chiplet晶粒設計的關鍵技術,可以對標Intel CXL、NVIDIA NVLink、AMD Infinity Fabric等先進互連技術,相比於傳統PCIe總線可以大大提高效率、降低延遲。
同時,龍鏈技術支持高速緩存一致性協議傳輸,可以保證CPU與GPU、CPU與GPGPU、GPGPU與GPGPU之間高速、穩定互相連接,完全擴展開來。
最關鍵的是,這一切都基於龍芯全自研的物理接口,無論標準性、性能和效率,還是擴展性、升級性都可以自主掌握。
針對筆記本、雲終端的新一代龍芯2K3000,目前已經完成前端設計,後續還有不少工作要做,包括內核、後端、外圍等等。
它最多可以做到8核心,單核性能可媲美上代桌面級的龍芯3A6000,集成自研密碼模塊,支持PCIe 4.0、SATA 3、USB 3、HDMI等豐富的擴展和輸入輸出。
很關鍵的一點,它會集成新一代自研的LG200 GPGPU核心,不但能用來做圖形渲染,還能做到計算加速、AI加速,是一個統一高效的新架構。
作為龍芯自研的第二代圖形核心,LG200已經突破瞭GPGPU的關鍵技術,圖形渲染支持OpenGL 4.0,通用計算支持OpenCL 3.0,AI加速支持INT8整數張量加速。
它還支持多節點互連,結合龍鏈技術,未來會有同樣架構的專用獨立GPGPU芯片!
在路線圖上,服務器級的龍芯3D7000、龍芯3E7000,桌面級的龍芯3B6000、龍心3B7000也都安排上瞭,它們都會是LA664微架構的升級版本。
責任編輯:上方文Q
發表評論 取消回复