圖:華為加入AI大模型行列,據報大模型命名為“盤古CHAT”。
【大公報訊】人工智能(AI)聊天機器人程式ChatGPT的出現,令各科網企業加快拓展AI應用,繼百度(09888)的“文心一言”、商湯(00020)的“日日新SenseNova”大模型體系,以及阿裡巴巴(09988)的“通義千問”等之後,華為亦加入AI大模型的行列,據報將於下月公佈詳情。
內地媒體消息指出,華為AI大模型命名為“盤古CHAT”,早於2020年11月通過華為雲內部立項。據報,趁7月7日舉行的華為雲開發者大會(HDC. Cloud),華為將對外正式發佈詳情及內測,產品主要面對商業(To B)及政企(To G)客戶。
命名為“盤古CHAT”
根據華為公佈的一份論文數據顯示,華為盤古PanGu-Σ大模型參數最多為1.085萬億,基於華為自研AI計算框架MindSpore開發。消息指出,整體而言,PanGu-Σ大模型在對話方面可能已接近GPT-3.5的水平。
華為雲官網顯示,盤古大模型由自然語言處理(NLP)大模型、計算機視覺(CV)大模型、多模態大模型、科學計算大模型等多項構成,通過模型泛化,解決傳統AI作坊式開發模式下不能解決的AI規模化、產業化難題,可以支持多種自然語言處理任務,包括文本生成、文本分類、問答系統等。
另外,根據浙商證券的信息顯示,華為在訓練千億參數的盤古大模型時,調用超過2000片昇騰910芯片,進行超過兩個月的數據訓練能力。
華為內部人士透露,集團每年在大模型訓練調用處理器超過4000片,3年間的大模型算力成本達9.6億元人民幣。
發表評論 取消回复