2024 開年,去年全球最暢銷的 i 智能手機 iPhone ,在中國的銷量就經歷瞭罕見大跌。

研究公司 Counterpoint 的數據顯示,2024 年的前六周,蘋果 iPhone 在中國的銷量出現大幅下滑,同比下降 24%。華為的復蘇是其中一個原因,華為同期的銷量暴漲 64%。

天風證券分析師郭明錤此前表示,蘋果下調 2024 年 iPhone 出貨預估量至約 2 億部,較上一年下降瞭 15%,這可能是全球主要手機品牌中降幅最大的。

郭明錤進一步預測,iPhone 15 系列與新款 iPhone 16 系列的出貨量預計將分別在 2024 年上半年和 2024 年下半年同比降低 10-15%。

他認為,iPhone「滯銷」的原因可能與高端手機需求逐漸轉向 AI 和折疊屏有關。郭明錤甚至認為,如果蘋果今年無法推出超出預期的 GenAI 服務,英偉達的市值很有可能超過蘋果。

前不久,蘋果最強勁對手的三星,便是把 AI 功能作為全新旗艦 Galaxy S24 系列手機的最大賣點,兜售「AI 手機」概念。

在此之前,Google、微軟已高調宣佈自己要在手機端部署 AI 大語言模型的計劃,而華為、OPPO、vivo、小米等國產手機廠商也先後公佈瞭自己 AI 化的戰略,OPPO 更是直接宣佈進入 AI 手機時代。

手機廠商們在「AI 會給智能手機帶來新鮮感」這個觀點上達成瞭高度一致的共識,而上一次出現這樣步伐一致的局面,可能要追溯到七年前的全面屏浪潮。

不過到瞭 2024 年,蘋果不打算再繼續當「局外人」。

最近,庫克罕見地多次透露蘋果在 AI 方面的雄心。庫克表示,公司將在 2024 年在生成式人工智能領域「開天辟地」

我們堅信,這將為我們的用戶帶來革命性的機會。

蘋果決定取消長達十年的造車計劃的同時,也將更多資源投入到 AI 項目,造車項目組裡的部分員工將被調到由 John Giannandrea 領導的機器學習和 AI 部門,轉向生成式 AI 項目。

在這周發佈新款 MacBook Air 的官方新聞稿,蘋果更是直接用瞭「全球最佳的 AI 消費級筆記本電腦」(World’s Best Consumer Laptop for AI)這樣的表述。

結合此前彭博社記者 Mark Gurman 的爆料,蘋果的 AIGC 新功能這很可能會出現在 6 月份公佈的 iOS 18 上。並表示 iOS 18 很有可能會是 iPhone 歷史上「最重磅」的軟件更新。

目前消費者對 AI 手機還沒完全接受,小米品牌總經理盧偉冰最近還表示「AI 手機是噱頭」,引發瞭不少討論。

可以肯定是,AIGC 與硬件設備的結合也會越來越快,智能手機這幾年被認為隻有擠牙膏式的微創新,未來幾年內可能改變這一局面的變量,可能也隻有 AI 瞭。

iOS 18 要把 Siri 變成 ChatGPT?

關於 iOS 18 的最有力的爆料並非出自我們熟悉的科技記者們,而是來自庫克。

在最近一次財報電話會議中,庫克在接受采訪時透露,蘋果一直在密切關註生成性 AI 技術,並在團隊內部進行瞭大量的探索與實踐。

他強調,蘋果一貫的做法是先確保工作達到一定標準後,再公開討論相關成果。庫克還提到,蘋果將在今年晚些時候分享一些讓人興奮的新進展。

此前有報道指出,蘋果正在自主研發大語言模型,並已在內部使用它作為人工智能助手進行回答。結合這些信息,蘋果有可能會在 iOS 18 中集成大語言模型,以提升 Siri 的性能並引入新的功能。

蘋果的機器學習團隊最近發表的一篇論文《LLM in a flash : Efficient Large Language Model Inference with Limited Memory》也在側面印證瞭這個消息的真實性。。

在這篇論文中,研究團隊討論瞭手機和平板等設備上內存限制對運行大型語言模型的影響,並提出瞭兩種解決計算瓶頸的方法,為將來部署大型語言模型鋪平瞭道路。

繼續翻閱這一年來蘋果機器學習研究團隊發表的論文,你會發現蘋果團隊尤其關註如何把大語言模型與自然語言處理結合。

例如,一篇發表於 12 月的論文《Federated Learning for Speech Recognition: Revisiting Current Trends Towards Large-Scale ASR》指出,雖然大型語言模型在多項自然語言處理任務中表現出色,但在口語理解任務上的性能還依賴於準確的自動語音識別轉錄(ASR)或內置理解模塊。

因此,研究團隊提出瞭新的解決方案,以提高模型在理解自然語言識別內容方面的準確性。

而在另一篇論文《Leveraging Large Language Models for Exploiting ASR Uncertainty》中,蘋果團隊則在研究如何將大語言模型與網絡搜索、機器翻譯結合,以提高生成內容的準確性和質量。

盡管這些研究成果不一定直接應用於產品設計中,但足以顯示蘋果在結合大型語言模型和 Siri 投入瞭大量精力。

在 Siri 問世之前,iPhone 的人機交互主要依賴於觸控操作。Siri 的加入為交互方式增加瞭新的維度,但精確的語音識別一直是個挑戰。

彼時,不夠成熟的語音識別技術難以給用戶帶來自然流暢的交互體驗,號稱「革命性產品」的錘子 TNT 便是前車之鑒。

現在,大語言模型的出現或許能解決掉一些「技術障礙」。

也許你已經在社交平臺上刷到過人與 ChatGPT 手機端 app 語音聊天的視頻。在這些視頻裡,對答如流的 ChatGPT 不僅顯示出其強大的思考和回答能力,還能模仿人類語氣和口音的能力,幾乎可以通過圖靈測試,展現瞭語音助手真正的潛力。

ChatGPT 強大的理解能力給瞭人們進一步的想象空間。近期,北京交通大學和阿裡巴巴的研究團隊發表的論文《Mobile-Agent: Autonomous Multi-Modal Mobile Device Agent with Visual Perception》開始探討使用 AI 實現手機操作的可能性。

他們基於 GPT-4V 設計瞭一個名為 Mobile-Agent 的多模態代理,能夠通過自然語言指令自動執行像搜索視頻、評論,甚至鬥地主等操作。

Mobile-Agent 的操作依賴 GPT-4V 的視覺識別作定位,因此經常會有識別出錯導致操作失敗,如果把這個這個過程替換為自動化機制,成功率將大幅提升,而這正是蘋果在研究的應用方向。

據 Mark Gurman 透露,蘋果正在考慮將 Siri 與快捷方式結合,以提供更靈活的自動化操作。這表明蘋果不僅想要打造一個更智能的語音助手,而且可能改變語音交互模式,為用戶帶來全新的交互體驗。

如果以上爆料成真,那麼 iOS 18 很可能就是蘋果自 2018 年重組 Siri 團隊以來一直在憋的大招。

用 AI 再次改變改變人機交互

再來看看對手,AI 優等生 Google 已經在一年時間內完成瞭在 Android 上的 AI 佈局。

自 Google 去年發佈其自研大模型 Gemini 以來,他們就一直在想方設法把最新的 AI 技術應用到所有產品陣列上,手機自然也不例外。

首個用上 Gemini 大模型的產品是親兒子 Pixel 8 系列,基於 Gemini Nano 模型,Google 帶來瞭許多創新功能。

例如輸入法可以根據當前對話內容的自動回復消息功能,或者能夠實時轉錄錄音為文字並自動總結錄音內容的功能等等。

最近,隨著三星最新的旗艦手機 Galaxy S24 系列的發佈,三星和 Google 宣佈合作,共同打造 Galaxy AI 體驗,再次展示瞭 Google 自研模型的強大。

現在,這些功能不僅限於錄音轉文字,甚至在電話通話中的對話也能實時轉換為文字,並進一步翻譯。如果你在與外國人通話,系統還能將對話翻譯成你所使用的語言。

Google 擅長的 AI 圖像編輯功能也被引入到三星設備中。當用戶拍攝的圖片需要重新構圖時,AI 可以自動生成畫面中未捕捉到的內容,提供一個全新的視角和比例,完善圖片。

你還可以抹去圖片中的路人或重新調整物體的位置,AI 將根據選定的內容重新填充圖片。

Google 還推出瞭一個強大新功能「畫圈搜索」。當你對圖片中的某個物品或文本句子感興趣時,隻需長按 Home 鍵激活畫圈界面,在圖片上圈出物體,系統便會自動執行搜索,提供相關信息和購買鏈接。

這徹底改變瞭以往繁瑣的圖像搜索和在線購物體驗。

搜索是 Google 的核心業務,而「畫圈搜索」的引入實際上是 AI 能力和 Google 的搜索技術的結合,是一次自我革新的嘗試。

過去,搜索依賴於輸入框,現在,用戶可以通過簡單地在手機屏幕上畫一個圈來進行搜索,無需復雜的關鍵詞輸入和篩選過程。

這不僅縮短瞭用戶與服務體驗之間的距離,而且標志著搜索領域的一次革命,並且這種革命是 AI 與設備硬件結合帶來的,是互聯網時代無法實現的。

這同時也意味著,雖然現階段 AI 能力可能僅被視為一個添頭功能,但隨著越來越多的應用程序對 AI 開放接口,結合 AI 的強大理解和圖像識別能力,實現自動化操作,AI 很可能在未來某個時刻爆發,為人們帶來創新的體驗,實現更便捷、更快速的交互。

這是手機上 AI 應用的真正潛力,也為 AI 時代提供瞭新的人機交互模式的思路。

AI 終將成為智能手機的「新基建」

AI 的突然爆火給瞭手機行業很大的想象空間,高通、聯發科等硬件廠商將 AI 算力作為新的角力點,開始新的算力競賽;軟件開發商集思廣益,爭取復刻 ChatGPT 和妙鴨相機的破圈傳播。

2024 年,無疑會成為手機系統的大年。

但回歸「AI 到底能給用戶帶來什麼」這個靈魂拷問上,少有廠商能給出讓人信服的答案。用戶真的需要在手機上每天跟機器人聊天、用 AI 生成不一樣自拍照嗎?把過往火爆經驗硬套在手機圈的敘事模式上不一定行得通。

蘋果和 Google 給出的答案是回歸用戶體驗,隻有當 AI 手機讓智能手機變得更好用,AI 的加入才有意義。

在 ChatGPT 引領 AI 浪潮和各大手機制造商紛紛宣佈 AI 戰略之前,AI 技術已經悄無聲息地融入到我們日常使用手機的各個方面。每當你解鎖手機、使用人臉支付,甚至每次拿起手機拍照時,AI 技術都在其中發揮著作用。

在華為 Mate 60 系列剛發佈時,其可以直接刷碼的智感支付功能在短視頻平臺上迅速走紅,引起瞭用戶之間的熱烈分享。

這一功能實際上是調用瞭華為麒麟芯片的 NPU 模塊,通過專門用於識別物品並實現快速跳轉。

這種自發分享行為恰恰說明,用戶更關註的是 AI 技術帶來的直接體驗提升,而非 AI 計算過程本身,AI 不僅背後的重點在於系統體驗的潛在提升。

隨著手機制造商在屏幕和相機硬件上達到瓶頸,智能手機競爭很快將會從硬件層面轉向系統層面,廠商們通過創新交互和提升用戶體驗作為其核心競爭力。

智能手機在經歷瞭智能化升級之後,下一步的體驗革命可能會是更加人性化的升級。這種理解能力將與圖形計算一樣重要,並有望成為智能設備的新標配。而這一切的核心,可能正是我們目前正在經歷的大語言模型的爆發。

華為在 8 月宣佈 HarmonyOS 4 系統全面接入盤古大模型,兩個月後,小米宣佈澎湃 OS 接入「MiLM-6B」模型;vivo 宣佈 vivo X100 內置藍心大模型,OPPO 隨後官宣 Find X7 系列內置 AndesGPT。

過去,相冊識圖、摳圖功能還是少數廠商的「獨門絕技」,而現在有瞭大模型加持後,這類 AI 功能已經成瞭旗艦手機標配。而隨著大模型應用的普及和深度整合,會促成更高效的計算硬件、優化的算法湧現,提高算力利用率和性能,從而降低單位計算成本。

在接下來的時間裡,高通、聯發科等硬件廠商不斷提高芯片算力,而手機廠商持續精進模型壓縮和量化技術,以減少模型的大小和運行時資源需求。通過軟硬件協同進化,手機端側大模型有望突破智能拐點,實現算力爆發。

屆時,語音助手可能成為擬真人類助手,拍攝照片變成一鍵掃描 3D 空間映像,識圖就能實現全網比價……AI 終將和移動通信、LBS 服務一樣,成為我們生活不可割舍的一部分。

AI 作為營銷熱詞總有一天會冷卻,但 AI 帶來的體驗革新,將會深刻改變人們使用手機的方式。

點讚(0) 打賞

评论列表 共有 0 條評論

暫無評論

微信小程序

微信扫一扫體驗

立即
投稿

微信公眾賬號

微信扫一扫加關注

發表
評論
返回
頂部