創科宇宙/中國AI專業應用前景可期\創業投資者聯盟召集人梁颕宇

16 閱讀 0 評論 0 點讚

　　圖：至今年5月底，內地已發佈79個10億級參數規模以上大模型，而自建模型的應用也在努力構建著自己的壁壘。

　　之前一直備受追捧的生成式人工智能（Generative Artificial Intelligence， GenAI，亦即人工智慧生成內容，AI Generated Content，AIGC），近日突然遭唱淡，ChatGPT開發商OpenAI被質疑入不敷支，可能在2024年底前破產。聽到這些言論，不禁憶起互聯網面世之初，也經歷過相同質疑，如今已成瞭人類生活中不可或缺的一部分。創新科技歷來需要打持久戰，過程中有高有低，亦必定會出現贏傢及輸傢，關鍵是能否識別出具潛力的目標。

　　生成式人工智能2.0（AIGC 2.0）的生態包括瞭基礎設施層、模型層與應用層。簡單來說，基礎設施層主要提供GPU晶片、AI晶片、超級電腦等演算法基礎設施，以及機器學習框架、雲作業系統等軟體。模型層專註於研發大模型，並對外提供AI模型服務或者API（應用編程接口）服務。應用層則專註於解決某一特定領域需求，為終端使用者帶來新的功能、產品、服務和應用。

　　至於ChatGPT正是OpenAI基於GPT 4通用大模型開發的一款應用，作為首個面向普羅用戶開放的聊天機器人，它不但懂得用人類自然語言來互動，完成自動生成文字、自動問答、自動摘要等任務，並在許多知識領域給出詳細和清晰的回答。

　　在上述三層體系中，目前中國市場普遍看好從模型出發的公司。大模型技術沿各技術路線迅速發展，在自然語言處理、機器視覺和多模態等領域湧現不同的預訓練大模型。據不完全統計，至今年5月底，內地已發佈瞭79個10億級參數規模以上大模型，通用大模型和垂直大模型的創業如火如荼，而自建模型的應用也在努力構建著自己的壁壘。

　　比起過去AI系統需要先定義一個特定的目標，再去收集足夠的相應資料來優化模型和解決問題，AI 2.0通用大模型最大特點是無需定義一個特定的目標，機器可以通過無監督預訓練學習，大大增強瞭通用性和泛化性。經過海量通用資料訓練出的底座模型，通過零樣本或小樣本精調直接可供下遊任務使用，讓各行各業以更低成本、更低門檻，把AI 2.0應用在不同的場景。

　　內地科技巨頭幾乎每周都會宣佈大模型的研發進展與行業合作動態，最矚目當屬百度推出“文心”大模型，其宣稱要把所有的產品都重做一遍。阿裡雲有ModelScope開源社區，而坐擁最多用戶的騰訊則決定先聚焦產業。另外，前美團聯合創始人王慧文、曾任搜狗公司CEO的王小川、創新工場董事長李開復等產業領軍者，都在籌組團隊致力打造新一代的底座大模型。

　　但與獲微軟支持的OpenAI、谷歌的Bard等美國科技巨擘相比，中國在這方面起步比較晚，研究主體數量多並不意味研發水準高。如百度的聊天機器人在支持多語種能力方面，還是不如ChatGPT，中文對話回應速度也有差距。

　　加快處理繁瑣文檔

　　慶幸的是，中美對於AI通用底座大模型的生態環境非常不同，中國擁有獨特的機會。中國制造業門類最全，但一般企業進行智能制造升級，通常面臨資源有限、算力投資難度大、高水準人才稀缺等發展瓶頸。大模型作為解決上述問題的最優路徑之一，可極大降低企業的技術門檻和開發成本。未來大模型將帶動新的產業和服務應用范式，在深度學習平臺的支撐下，成為產業智慧化基座，打造可面向跨場景或行業服務的“元能力引擎”。

　　此外，還有一些公司在做自建垂類模型的應用，從擁有垂直行業的特有資料、到訓練模型、到特定的強化學習、到外掛知識圖譜、到開發終端應用，針對某一類場景建立閉環訓練模型，最終基於這個模型開發出應用。

　　以AI於醫療場景的應用為例，過去的科技公司大多隻做簡單的病歷審核，用於給保險理賠時判斷用藥和操作規范，審核報銷和保單等。雖然也有醫療版語音病歷錄入，但隻能醫生說什麼寫什麼。有瞭大模型框架之後，這個領域就能擁有瞭生成式的能力，未來可引入類似於自動生成會議紀要，並為紀要自動做摘要和翻譯的功能，醫生隻需輸入關鍵的內容，比如病人的血壓值，後面的東西AI就可以自動補全。在醫生和患者對話的過程中，大模型亦可以自動提取有效資訊，並自動生成病歷。

　　當然，目前基礎大模型距離大規模產業應用還有很長的一段路要走，但生成式人工智能經已是明確趨勢。聊天機器人的應用是訓練與檢驗人工智能生成內容的一種直觀方式，惟聊天不是剛需，所以不必擔心OpenAI是否會破產，未來隻需集中火力強化大模型發展，打造標桿專案，輔以行業專有訓練資料集為基礎，打造金融、醫療、電力等領域的專業大模型，長遠前景必然是一片光明。

點讚(0) 打賞