華為推AI大模型擬下月公佈詳情

47 閱讀 0 評論 0 點讚

　　圖：華為加入AI大模型行列，據報大模型命名為“盤古CHAT”。

　　【大公報訊】人工智能（AI）聊天機器人程式ChatGPT的出現，令各科網企業加快拓展AI應用，繼百度（09888）的“文心一言”、商湯（00020）的“日日新SenseNova”大模型體系，以及阿裡巴巴（09988）的“通義千問”等之後，華為亦加入AI大模型的行列，據報將於下月公佈詳情。

　　內地媒體消息指出，華為AI大模型命名為“盤古CHAT”，早於2020年11月通過華為雲內部立項。據報，趁7月7日舉行的華為雲開發者大會（HDC. Cloud），華為將對外正式發佈詳情及內測，產品主要面對商業（To B）及政企（To G）客戶。

　　命名為“盤古CHAT”

　　根據華為公佈的一份論文數據顯示，華為盤古PanGu-Σ大模型參數最多為1.085萬億，基於華為自研AI計算框架MindSpore開發。消息指出，整體而言，PanGu-Σ大模型在對話方面可能已接近GPT-3.5的水平。

　　華為雲官網顯示，盤古大模型由自然語言處理（NLP）大模型、計算機視覺（CV）大模型、多模態大模型、科學計算大模型等多項構成，通過模型泛化，解決傳統AI作坊式開發模式下不能解決的AI規模化、產業化難題，可以支持多種自然語言處理任務，包括文本生成、文本分類、問答系統等。

　　另外，根據浙商證券的信息顯示，華為在訓練千億參數的盤古大模型時，調用超過2000片昇騰910芯片，進行超過兩個月的數據訓練能力。

　　華為內部人士透露，集團每年在大模型訓練調用處理器超過4000片，3年間的大模型算力成本達9.6億元人民幣。

點讚(0) 打賞

暫無評論

﻿華為推AI大模型 擬下月公佈詳情