如果你有關註十月的手機新品發佈會,那你或多或少有聽到過“比果更果”、“果味十足”這些詞。
這個說法源於 2024 年第四季度,從九月到十一月發佈的這批國產旗艦手機所搭載的 AI 大模型功能中,或多或少都涉及到像素級致敬蘋果在 iOS 中內嵌的 AI 能力框架——Apple Intelligence 的設計;其中有些實在是與蘋果過於相似,因此在相關的體驗內容中,類似的評語層出不窮。
但比起你爭我趕的模仿者們,反而是蘋果在最先介紹瞭 Apple Intelligence 要發佈哪些功能之後,重新回歸沉寂——即使目前公開的功能中,其實並沒有太多新鮮的內容。這些都直到上周發佈的 iOS18.2 Beta 測試版中,AI 才算揭曉帷幕,並在北京時間 10 月 29 日凌晨,正式版 Apple Intelligence 隨著新 iMac 一起發佈,推送給大多數普通 iPhone 用戶。
目前,Apple Intelligence 的中文譯名為“Apple 智能”,在中國官網的介紹目前還是“為 Apple 智能預備好”,庫克也在近期多次吹風,表示國行版 Apple Intelligence“即將到來”;眼下 Apple Intelligence 相關功能也不支持中文:對中文的支持將在明年正式發佈。
Apple Intelligence 設置界面|圖片來源:極客公園
一、Apple Intelligence 上手
之所以說本次更新才是 Apple Intelligence 的正式亮相,是因為其推送的更新,其實全部都是 iPhone16 發佈會上已經介紹過的內容,現在才終於將發佈會上關於 Apple Intelligence 畫的不少餅,端出來給用戶。
由於 Apple Intelligence 對設備內存有著更嚴格的要求,因此目前隻有搭載 8GB RAM 的 iPhone 才能使用——這意味著隻有 iPhone15 Pro 以及 iPhone 16 全系。
對於 iPhone 16 系列,本次更新最重要的一個“硬件更新”,是原本設計用於相機縮放/光圈等功能控制的側邊按鍵,現在隻需要長按,就可以啟動 iOS18.2 新增的“視覺智能”功能。
此前一直隻存在於傳聞中的“iPhone AI 按鍵”,此次更新後才算正式落地,雖然 AI 專屬按鍵這個概念也已經不再新鮮。
iPhone 16 的側邊相機控制按鍵,此時才終於變身“AI 按鍵”|圖片來源:極客公園
在過去一周我的實際使用中,圖像識別這部分功能是目前 Apple Intelligence 對於中文用戶體驗最友好的一部分:即使識別的原文是中文,也能準確地理解其中的內容,並判斷出其中的電話、地址、日期時間等元素,搭配系統 App 實現基礎的自動化服務:如果是地址可以自動跳轉進地圖 App,日期/時間可以一鍵在日歷中生成對應事項、電話自動跳轉到撥號頁面等。
圖像識別功能|圖片來源:極客公園
在拍攝完成後,你還可以借助集成 ChatGPT 的 Siri 提問,Siri 能夠準確地識別出你拍攝的各種中文信息,並且給出諸如“這個展板介紹瞭什麼內容”這樣問題的回答。
圖像識別通過 ChatGPT 給出的識別內容反饋|圖片來源:極客公園
對於類似手機殼這樣的商品內容,點擊搜索按鈕後,會自動抓取電商平臺中相關商品的鏈接,同時起到介紹物品細節以及購買的作用,屬於是一步直達瞭。
自動識別內容並從電商平臺抓取相關商品|圖片來源:極客公園
按照蘋果的介紹,今年十二月,蘋果還將圍繞圖像識別功能,加入多模態能力的整合:例如快速幫用戶熟悉地點周圍的風景,以及餐廳評分以及當天推薦特色菜品之類的服務。這個能力未來也將開放給第三方 App。
當然,以上的交互回答目前都還是以英文為主——即使 ChatGPT 本身顯然是支持中文並且能夠直接輸出中文內容的,當前的 Apple Intelligence 也不能使用中文來回復。
本次更新還加入瞭系統級的文本大模型能力,除瞭之前已經在 iOS18 中已經出現過的通知要點總結,郵箱自動整理郵件緊急排序等功能,在系統自帶的備忘錄中,現在還加入瞭 AI 優化相關的選項,除瞭推薦的幾個改寫方向,你還能直接提出你的要求,讓備忘錄幫你自動生成一份文稿。
iOS18.2 備忘錄中的寫作工具|圖片來源:極客公園
當然,這個功能目前也不支持中文:即使它調用的 ChatGPT 處理類似的中文需求時已經非常遊刃有餘;另外蘋果還宣佈過這個功能的“完全體”將會在十二月發佈,屆時能處理包括“幫我將晚會邀請改寫為一首藏頭詩”、“幫我風格化處理我的簡歷”之類的復雜需求。
對瞭,如果你是尊貴的 ChatGPT 付費訂閱用戶,現在蘋果還在設置中提供瞭一個接口,可以用於登錄你自己的 OpenAI 賬號,獲得更多模型的使用權限;當然免費版用戶也能在與 Siri 的對話中調用 ChatGPT 能力。
iOS18.2 中還新增瞭一個名為 Playground 的 App,其中收納瞭 iOS 當前所有關乎於圖像生成相關的功能,例如使用 Apple Pencil 進行粗略的手繪草圖,並讓 Image Wand 將其轉換成更精美的圖像;Genmoji 顧名思義,就是借助於大模型能力,實現的繪制類似 Emoji 效果的頭像,並以 Emoji 的方式來分享。
Playground 圖像生成功能|圖片來源:Apple
聽起來很美好,但目前 playground 需要用戶在系統級的 Beta 系統更新之外,單獨申請這個 App 的測試權;這種“測試版裡內嵌測試版”的套娃體驗,在過去的蘋果軟件服務中並不多見,不少海外用戶也吐槽“申請之後 N 天瞭還沒通過”。
不過倒也不用太過著急,蘋果官方宣佈的消息,Playground 的測試申請會在“未來數周內”逐步通過當前用戶的測試申請。
雖然集成瞭 ChatGPT,但 Siri 本身“弱智”其實改善並不明顯:準確來講集成瞭 Apple Intelligence 後的 Siri,在請求語言的理解以及上下文的連續對話能力部分,相比此前還是有明顯提升的,隻是近兩年我們過去已經看過眾多包括 ChatGPT 高級對話模式這樣一次次震驚世界的大模型連續對話體驗,如今“升級”過後的 Siri,在綜合體驗上落後於同類產品。
ChatGPT 高級對話模式|圖片來源:極客公園
在對話中,當你提出的問題涉及到調用 ChatGPT 能力時,SIri 會彈出一個確認,當然你也可以在設置中關閉這個確認請求的選項,但這個過程仍然等同於直接將你的問題“抄送給 ChatGPT”。
“抄送給 ChatGPT”|圖片來源:極客公園
圖片內容識別上,當前的 Siri 訓練數據庫仍然存在檢索能力匱乏的問題:我拿起手機拍我的愛車,並問 Siri“這是什麼車”,Siri 也能自動調用 ChatGPT,給出一個對話結果,告訴我“這是一輛藍色的斯巴魯 Levorg”。
iOS18.2 圖像識別能直接以對話的方式給出結果|圖片來源:極客公園
但這其實並不是正確的車型識別結果:同樣的問題,即使是問已經發佈數年、當時“多模態”這個概念還不被世人所知時發佈的 Google Lens 智能識圖,都能給出更加準確的關聯識別結果:告訴我這其實是一輛力獅而非外觀接近的 Levorg。
綜合來講,在概念上並無太多新意的 Apple 智能,比起今年十月發佈的、隔壁 vivo 藍心小 V 以及“像素級致敬 Apple Intelligence”的 OPPO ColorOS15,如今的姍姍來遲的正式版 Apple Intelligence,反而更像是“後來者”。
“體驗倒掛”成為瞭 iOS 與當前其他強調 AI 的智能手機操作系統,甚至是獨立 App 之間的對比中的常態。
那蘋果在 AI 領域的“首輪競爭”,真的止步於此瞭嗎?
二、保守的背後
有 ChatGPT 珠玉在前,Siri 當前展現出的“低能”,顯然並不能簡單理解為技術上遇到瞭難題:甚至在體驗上 ChatGPT 本身都能實現的能力,當前的 Apple Intelligence 都不支持。
蘋果的“保守”,或許可以被理解為蘋果對於新技術一貫的“謹慎”,不僅不急於拓展 AI 能力在智能手機上的邊界,還在主動為 AI 設置圍欄。
不僅在備忘錄中的 AI 改寫功能中,對於改寫寫作風格的調性偏向保守;在用於創建風格化自定義圖像的 Playground 中,用戶很明顯就能察覺到它與其他大廠發佈圖像生成工具的不同之處:它完全無法像今年爆火的預訓練圖像生成模型 Lora 那樣,用於生成那些和真人幾乎無異、讓人真假難辨的圖像。
Playground 生成 Genmoji 效果|圖片來源:Apple
實際上這種謹慎不無道理:即使多模態大模型已經出現幾年,但包括內容幻覺、AI 生成內容用於犯罪,都是當下伴隨著大模型應用“蒙眼狂奔”伴隨而來的問題,近年來 AI 生成的虛假內容充斥網絡。
除瞭內容泛濫,如何保護用戶的私有數據,在 AI 時代也成為瞭一個重要的命題:不少創作者也因為擔心自己的素材被拿去訓練,在網絡上變得謹小慎微;這些現象都說明瞭當前對於 AI 內容的監管,一直處於嚴重缺位的狀態。
早在 Apple Intelligence 發佈之前,蘋果就已經著手進行瞭“圍欄”的搭建:今年九月,Apple 邀請隱私和安全研究人員測試蘋果宣佈的“私有雲計算”對於用戶數據隱私的保護承諾。同時致力於建立對虛假內容的安全聲明機制,向著建立 AI 虛假內容的公共問責機制邁出一步。
在硬件上,為瞭更好地服務 Apple Intelligence,蘋果已經啟動瞭全系硬件產品的升級換代:不僅 iPhone16 內存全系升級至 8GB,在十月正在更新中的新款 Mac 產品線陣容,也終於把牙膏擠爆,內存全系 16GB 起跳,為瞭支持端側 Apple Intelligence 模型能力的應用。
新 iMac,全系 16GB 內存起步|圖片來源:Apple
在硬件之外,面向開發者的趁手工具也已經在路上:在 iOS18.2 Beta 測試版發佈後,蘋果隨即更新瞭三個關鍵 Apple Intelligence 功能的 API:編寫工具 API、Genmoji API 和 Image Playground API。
這三個 API 接口,都旨在幫助開發人員將 Apple Intelligence 集成到他們的應用程序中,換言之:隨著越來越多這樣的 API 接口加入,開發者都能夠在所有 Apple 生態的硬件設備上調用端側模型計算能力,無需額外的服務器成本,加上當前 Apple 生態數以億計的用戶,這無論對於中小開發者還是巨頭來講都是一項極具誘惑力的條件。
由此可見,蘋果的第一方應用目前並不謀求短暫的效果取勝,而是通過構建軟硬件深度整合、搭建原生 AI 硬件生態平臺的方式,為開發者提供一個適合 AI 時代超級 App 生長的土壤。
這些問題,與其說是隻有蘋果邁出瞭第一步,不如說這是長期來看,隻有諸如蘋果、華為這樣,有自有生態/硬件以及掌控能力的廠商,才有機會參與的深度競爭;擁有生態的平臺級的玩傢,與隻有“硬件制造商”單一標簽的廠商,或許從這場競爭的一開始,就拉開瞭巨大差距。
AI 時代智能手機競賽這場“馬拉松”中,並不隻有一開始就“全力沖刺”這一個選項。
發表評論 取消回复