圖:至今年5月底,內地已發佈79個10億級參數規模以上大模型,而自建模型的應用也在努力構建著自己的壁壘。
之前一直備受追捧的生成式人工智能(Generative Artificial Intelligence, GenAI,亦即人工智慧生成內容,AI Generated Content,AIGC),近日突然遭唱淡,ChatGPT開發商OpenAI被質疑入不敷支,可能在2024年底前破產。聽到這些言論,不禁憶起互聯網面世之初,也經歷過相同質疑,如今已成瞭人類生活中不可或缺的一部分。創新科技歷來需要打持久戰,過程中有高有低,亦必定會出現贏傢及輸傢,關鍵是能否識別出具潛力的目標。
生成式人工智能2.0(AIGC 2.0)的生態包括瞭基礎設施層、模型層與應用層。簡單來說,基礎設施層主要提供GPU晶片、AI晶片、超級電腦等演算法基礎設施,以及機器學習框架、雲作業系統等軟體。模型層專註於研發大模型,並對外提供AI模型服務或者API(應用編程接口)服務。應用層則專註於解決某一特定領域需求,為終端使用者帶來新的功能、產品、服務和應用。
至於ChatGPT正是OpenAI基於GPT 4通用大模型開發的一款應用,作為首個面向普羅用戶開放的聊天機器人,它不但懂得用人類自然語言來互動,完成自動生成文字、自動問答、自動摘要等任務,並在許多知識領域給出詳細和清晰的回答。
在上述三層體系中,目前中國市場普遍看好從模型出發的公司。大模型技術沿各技術路線迅速發展,在自然語言處理、機器視覺和多模態等領域湧現不同的預訓練大模型。據不完全統計,至今年5月底,內地已發佈瞭79個10億級參數規模以上大模型,通用大模型和垂直大模型的創業如火如荼,而自建模型的應用也在努力構建著自己的壁壘。
比起過去AI系統需要先定義一個特定的目標,再去收集足夠的相應資料來優化模型和解決問題,AI 2.0通用大模型最大特點是無需定義一個特定的目標,機器可以通過無監督預訓練學習,大大增強瞭通用性和泛化性。經過海量通用資料訓練出的底座模型,通過零樣本或小樣本精調直接可供下遊任務使用,讓各行各業以更低成本、更低門檻,把AI 2.0應用在不同的場景。
內地科技巨頭幾乎每周都會宣佈大模型的研發進展與行業合作動態,最矚目當屬百度推出“文心”大模型,其宣稱要把所有的產品都重做一遍。阿裡雲有ModelScope開源社區,而坐擁最多用戶的騰訊則決定先聚焦產業。另外,前美團聯合創始人王慧文、曾任搜狗公司CEO的王小川、創新工場董事長李開復等產業領軍者,都在籌組團隊致力打造新一代的底座大模型。
但與獲微軟支持的OpenAI、谷歌的Bard等美國科技巨擘相比,中國在這方面起步比較晚,研究主體數量多並不意味研發水準高。如百度的聊天機器人在支持多語種能力方面,還是不如ChatGPT,中文對話回應速度也有差距。
加快處理繁瑣文檔
慶幸的是,中美對於AI通用底座大模型的生態環境非常不同,中國擁有獨特的機會。中國制造業門類最全,但一般企業進行智能制造升級,通常面臨資源有限、算力投資難度大、高水準人才稀缺等發展瓶頸。大模型作為解決上述問題的最優路徑之一,可極大降低企業的技術門檻和開發成本。未來大模型將帶動新的產業和服務應用范式,在深度學習平臺的支撐下,成為產業智慧化基座,打造可面向跨場景或行業服務的“元能力引擎”。
此外,還有一些公司在做自建垂類模型的應用,從擁有垂直行業的特有資料、到訓練模型、到特定的強化學習、到外掛知識圖譜、到開發終端應用,針對某一類場景建立閉環訓練模型,最終基於這個模型開發出應用。
以AI於醫療場景的應用為例,過去的科技公司大多隻做簡單的病歷審核,用於給保險理賠時判斷用藥和操作規范,審核報銷和保單等。雖然也有醫療版語音病歷錄入,但隻能醫生說什麼 寫什麼。有瞭大模型框架之後,這個領域就能擁有瞭生成式的能力,未來可引入類似於自動生成會議紀要,並為紀要自動做摘要和翻譯的功能,醫生隻需輸入關鍵的內容,比如病人的血壓值,後面的東西AI就可以自動補全。在醫生和患者對話的過程中,大模型亦可以自動提取有效資訊,並自動生成病歷。
當然,目前基礎大模型距離大規模產業應用還有很長的一段路要走,但生成式人工智能經已是明確趨勢。聊天機器人的應用是訓練與檢驗人工智能生成內容的一種直觀方式,惟聊天不是剛需,所以不必擔心OpenAI是否會破產,未來隻需集中火力強化大模型發展,打造標桿專案,輔以行業專有訓練資料集為基礎,打造金融、醫療、電力等領域的專業大模型,長遠前景必然是一片光明。
發表評論 取消回复