2024 被視作 AI(人工智能)硬件元年,所有手機、個人電腦甚至傢電公司都需要向用戶證明,他們能通過 AI 提升設備體驗。
在今年的 CES 上,AI 與消費電子品的結合是一大亮點:冰箱、洗烘一體機都加入瞭 AI 能力。除瞭與原有設備融合,也開始有新形態的 AI 硬件出現,如備受關註的 AI PIN 和 Rabbit R1 等。OpenAI 創始人山姆·阿爾特曼(Sam Altman)也在去年下半年成立新的 AI 硬件公司,志在研發能取代手機的新一代硬件終端。
手機公司不會錯過這波浪潮。
在 1 月 8 日 OPPO Find X7 系列的發佈會前,OPPO 高級副總裁劉作虎給理想汽車創始人李想打瞭個電話,聊瞭聊兩傢的產品進展,並相約去北京體驗理想新車。
發佈會上,劉作虎展示瞭 OPPO Find X7 給這通電話生成的智能摘要,裡面記錄瞭雙方本次通話的主要內容以及待辦事項,還可以一鍵定位到對應的通話音頻。
Find X7 的智能通話摘要功能
除瞭一貫主打的影像能力外,這次發佈會最多的時間給瞭 AI:OPPO Find X7 系列首次在端側部署瞭一個約 7B(70 億)參數規模的模型,它帶來瞭智能摳圖、路人消除和通話摘要等實用功能。
高通 CEO 克裡斯蒂亞諾·阿蒙(Cristiano Amon)在本月接受采訪時說,計算機的發展史,就是從算力集中於超算等大型設備上到算力一步步轉移至個人電腦和手機等終端設備上的過程。
如今,大模型與生成式 AI 也在重復這條路:從雲端的大規模模型逐步進入一部部掌上的手機。
劉作虎在接受采訪時說,生成式 AI 和大模型是他做手機以來看到過的最激動人心的新技術:“2024 年,不佈局大模型的手機企業未來沒戲。”
從拍人更美到理解用戶意圖,手機 AI 步步升級
2011 年,智能助手 Siri 與 iPhone 4s 一同發佈,用戶可以用語音定鬧鐘、查天氣,這是 AI 技術在手機上的最早應用。
隨著 2016 年 Google AlphaGo 擊敗圍棋世界冠軍李世石,一批 AI 公司成立、人才湧入,AI 也開始加速進入手機:
用 AI 拍月亮、智能摳圖、優化畫質的視覺能力被普及;人臉識別替代瞭指紋解鎖;AI 還能學習用戶使用習慣,更合理地調度內存與處理器資源、降低功耗。
手機芯片也開始在 CPU 和 GPU 等常規模塊外額外搭載一顆 NPU(嵌入式神經網絡處理器),以專門處理 AI 運算。
2018 年,OPPO 發佈語音助手小佈,它可識別更長的指令,幫用戶設置手機、搜索知識或陪用戶閑聊;同年發佈的 R15 上,OPPO 嵌入瞭可識別人物面部輪廓、分區美顏的算法;AI 還能幫助識別照片主題和人物,自動歸類照片。
但在大語言模型之前,AI 給手機帶來的體驗升級大多被框在單個 App 內,手機仍無法理解用戶更復雜的需求。
大語言模型引起瞭質變:用 AI 寫文案、提重點、生成圖像等應用湧現,手機等硬件等到瞭一個新的升級機會。
OPPO 早在 2020 年就推出瞭預訓練模型 OBERT,同年 11 月,OPPO 語音語義研究部又推出瞭參數為 30 億的中文預訓練大模型 CHAOS,這些嘗試幫 OPPO 快速跟上瞭去年初爆發的大模型熱潮。2023 年底 OPPO 在開發者大會上正式發佈瞭安第斯大模型(AndesGPT),包括從十億參數至千億參數的多個版本。
OPPO Find X7 系列上第一次在端上部署瞭約 70 億參數的安第斯大模型,通過端雲協同的部署,它帶來瞭如下的體驗提升:
一是用大模型技術實現過去做不到的功能:比如自動生成通話摘要和待辦事項;幫用戶在瀏覽公眾號文章時快速總結文章重點內容。
二是優化已有功能。
在手機影像上,Find X7 上的 AI 有更強的識別圖像和分割物體的能力,能增強摳圖和人像消除的體驗。過去手機隻能識別人體這一個元素,現在 Find X7 支持超過 120 類主體的識別與分割,可以實現發絲級的分割和在同一張照片中一次分割 6 個主體。
安第斯大模型強化瞭圖像分割、消除的能力。
憑借大模型帶來的更多知識儲備,OPPO 的小佈現在也更懂用戶瞭,用戶想用什麼直接說給小佈即可。
OPPO 軟件創新中心總經理張峻說,大模型帶來最大的變革之一就是交互,即使用戶說的是語法沒那麼規整的口語,語音助手也能理解,用戶會覺得自己是在和一位助手交流,而不是機器。
除瞭提升單個應用的體驗,OPPO 還想提供跨手機、平板和車機等多終端的 AI 整體體驗,這需要 AI 與系統軟件的配合。
2022 年的開發者大會上,OPPO 發佈瞭系統 “中間件” 潘塔納爾,可提供跨端的服務推薦功能,比如用戶到機場,就會自動推送登機牌信息、機場有什麼美食等,而無需跳轉到一個個 App 中;這些服務,如機場內的登機口導航也可以推送到手表等其它終端上。大模型進一步提高瞭智能推薦服務的準確性和效率。
張峻說,OPPO 從去年開始思考大模型的未來規劃,最核心的出發點是提升用戶的實際體驗而不是秀技術。
他們希望打造的 AI 手機是:用戶完全習慣與小佈交互,不僅能用小佈調用 OPPO 自己的系統應用,也能調用與 OPPO 合作的第三方應用,從用戶去應用裡找服務變為服務來找人。
把大模型帶入手機,總共分幾步?
大模型部署在端側有幾項不可替代的優勢。
一是隱私保護,用戶會擔心雲端數據泄露和被竊取,而端側的數據則是本地存儲、本地處理,如安第斯大模型就是將數據經過硬件級加密存儲在終端本地。為進一步提高安全性,Find X7 Ultra 還使用瞭匯頂科技供應的獨立安全芯片,獲得行業內最高等級的國密二級安全認證。
二是網絡要求低,不需要頻繁上傳和下載,Find X7 上基於大模型的新功能都可以在弱網或無網的情況下使用。
最後是節省成本和功耗。如今規模較大的大模型參數均突破千億,訓練與推理需要消耗巨量計算資源,OpenAI 每天的算力成本高達 70 萬美元,有機構測算 OpenAI 每月的用電量是 17 萬個丹麥傢庭的全年用電量。
高通 CEO 阿蒙在本月接受采訪時說,考慮到數據中心在運行生成式 AI 時的高成本和高能耗,端雲協同的混合模型將變得重要。
OPPO 安第斯大模型有三個不同規格:最小的是 Tiny 模型,參數規模在 70 億以下;此外還有百億參數的 Turbo 模型和千億參數以上的 Titan 模型。Find X7 端側部署的是 Tiny 模型,平衡瞭功耗與性能。
安第斯大模型的三個不同規格。
相比較其他手機公司已推出的 10 億參數大模型,約 70 億參數的安第斯 Tiny 大模型可以提供更準確的回答。同時,OPPO 表示在手機端側部署的安第斯大模型的時延目前在行業裡最低,200 字的摘要可在 0.2 秒內輸出第一個字;把時長在 10-15 分鐘、約 2000 字的通話記錄生成摘要,可在 2.9 秒內輸出第一個字。
越大的模型成本就越高,也越難壓縮和部署到端側。為瞭把它部署到手機上,OPPO 針對性地優化瞭算法和硬件。
首先是壓縮,OPPO 技術團隊通過蒸餾、壓縮等技術手段,把模型從 28 GB(吉字節)壓縮到瞭最小 3.9 GB。OPPO 軟件創新中心總經理張峻說,通過多年的數據積累,他們對關鍵場景做瞭精調和預訓練,保障壓縮後模型的精度和效果。
OPPO 也自研瞭推理引擎 AI Boost 和 Transfomer 加速庫,通過內存管理減少內存搬運,可降低一半的功耗。
其次是與芯片廠的深度合作,OPPO 已與高通和聯發科等芯片廠商深度合作,基於 NPU 並行計算能力提升性能,降低時延和優化功耗。劉作虎說 OPPO 做過芯片,所以知道在端側部署大模型需要定制什麼樣的芯片。
OPPO 與芯片廠商聯發科合作在端側部署大模型。
張峻表示,端側大模型性能目前還做不到與雲側相同,但它有隱私保護和不依賴網絡的優勢。OPPO 也在嘗試更靈活的端雲協同架構,讓旗艦機以外的新機和舊手機也有機會體驗最新的 AI 能力。
不容錯過的新機會
從 2023 年開始,整個硬件行業都在思考同一件事:如何將 AI 能力更好地引入設備,以及這會是一個多大的機會?
手機與個人電腦品牌商、芯片廠商、軟件服務商都在積極為 AI 硬件的起量做準備。三星為 S24 預熱,喊出 AI for All 的口號,小米、榮耀和 vivo 等國產廠商也紛紛宣佈把大模型引入手機;蘋果也預計會在今年 6 月的 WWDC(蘋果全球開發者大會)上為 Siri 等產品引入一系列基於大模型的 AI 體驗。
上遊的高通、聯發科等芯片公司,都認為 2024 年會是 AI 手機元年,2023 年底發佈的驍龍 8 Gen3 平臺,NPU 速度提升 98%,支持超過 100 億參數的模型;聯發科的天璣 9300 也宣稱支持端側部署最高 330 億參數的模型。
浦銀國際報告認為,AIGC 普及有望刺激智能手機等消費電子終端需求重回增長,預計 2024 年全球和中國智能手機出貨量將分別同比增長 5.0% 和 5.1%,結束過去超過五年的下行周期。Counterpoint Research 稱,2024 年 AI 智能手機出貨量初估將超過 1 億部、2027 年預估達 5.22 億部,期間的平均復合年增率達 83%。
參與者需要快速決策、快速行動。OPPO 安第斯大模型首席架構師楊振宇說,2022 年,生成式 AI 給 OPPO 技術團隊帶來瞭相當大的震撼,但他們還不太確定,這項技術是否會快速走向商業化;到 2023 年 3 月,他們明確,大模型是變革性技術,OPPO 迅速成立瞭安第斯 GPT 項目組,抽調瞭各部門的技術人才,包括產品規劃、交互設計、研發、算法、雲平臺和大數據等,集中攻堅。
到 2023 年 8 月,OPPO 推送瞭小佈助手嘗鮮版,讓用戶能用上類似於 ChatGPT 的通用問答能力。
楊振宇說,嘗鮮版用戶每天喚醒智能語音助手的次數相較過去版本有成倍提升。
今年 1 月,OPPO 把公司所有 AI 相關資源集中在一起成立瞭 AI 中心,包括軟件工程、數智工程和 OPPO 研究院的相關人員。OPPO 軟件創新中心總經理張峻稱, OPPO 目前 AI 業務的招人數量不設限。劉作虎評價說,AI 中心就是戰鬥部隊,快速響應、快速抓住新趨勢、滿足用戶需求。
上一個卷入瞭所有手機廠商,開啟瞭長達數年軍備競賽的賽道是影像。幾年之間,手機影像能力有瞭實質性提升。
AI 是類似的新機會,它對技術積累和技術投入的要求更高,看起來也更容易做出差異化。但要明確的是,AI 對手機帶來的提升可能仍是優化和迭代,而不是代際和革命性變化。張峻認為,現階段大模型與手機的結合,還沒有到顛覆性的程度,用戶的習慣也還需要培養。需要逐步去提升用戶體驗,這最終會讓用戶形成依賴。
AI 體驗接下來也將成為高端手機的競爭重點。2023 年,全球每賣出 4 部手機,就有 1 部是批發價超過 600 美元的高端手機,高端機銷售額占整個市場的比例更是高達 60%,這是如今手機市場的核心驅動力。2024 年,手機公司會更激進地投入 AI 競賽中。
談及 AI 帶來的機會與競爭,劉作虎在接受采訪時說,大模型無非是帶來瞭一個前所未有的能力,手機廠商要利用好這個能力,思考如何服務好目標用戶。“最核心的競爭力,還是對用戶的洞察。誰對用戶最理解,誰真正地懂產品,誰就能在競爭中保持差異化。”
發表評論 取消回复