史丹福大學團隊被揭抄襲中國AI模型

28 閱讀 0 評論 0 點讚

　　圖：備受關註的AI大模型、不同地方申請AI專利情況

　　近日，來自美國史丹福大學一傢人工智能（AI）學生團隊疑似抄襲中國面壁智能的MiniCPM AI模型，引發瞭業界關註和網友熱議。史丹福的團隊已在網上向中方團隊道歉。專傢表示，目前中國湧現出大批知名AI大模型企業，中國擁有龐大的互聯網用戶基數，提供瞭豐富的場景等數據資源，這對於訓練大模型來說是重要優勢，中國已快速成長為人工智能科技創新的重要推動者。\大公報記者郭瀚林凱雷實習記者蘇雨潤

　　人工智能大模型是指擁有超大規模參數（通常在十億個以上）和超強計算資源的機器學習模型，能夠處理海量數據，完成各種復雜任務，如自然語言處理、圖像識別等。5月29日，史丹福大學三名學生組成的AI團隊發佈瞭一款大模型名為Llama3-V，並聲稱其比OpenAI的GPT-4V、谷歌的Gemini Ultra以及Anthropic的Claude Opus性能更強，隻花瞭500美元就能訓練出一個最優模型。不久，有使用者揭露，史丹福團隊開發的Llama3-V的模型結構、配置文件與一款中國大模型MiniCPM-Llama3-V 2.5模型完全相同，隻是進行瞭部分簡單修改。

揭矽谷“不光彩文化”

　　　　MiniCPM由中國初創企業“面壁智能”和清華大學自然語言處理實驗室於5月中旬聯合推出。清華和面壁智能團隊隨後證實，史丹福大模型項目與MiniCPM一樣，可識別出“清華簡”（清華大學收藏的一批戰國中晚期竹簡）中的戰國古文字，“不僅對得一模一樣、連錯得都一模一樣”。由於此古文字數據並未對外公開，最終證實瞭抄襲事實。

　　史丹福Llama3-V團隊的兩位作者Siddharth Sharma和Aksh Garg本月初在社交平臺上發帖道歉，並將Llama3-V模型悉數撤下。該團隊裡主要負責撰寫代碼、來自南加大的Aljadery Mustafa已註銷自己的社交平臺賬號。

　　在上述團隊道歉前，史丹福人工智能實驗室主任曼寧（Christopher David Manning）發文譴責瞭抄襲行為，並稱MiniCPM“是很好的開源作品”，“作假直至成功（Fake it before you make it）這是矽谷不光彩的文化。”谷歌DeepMind研究員Lucas Beyer則針對此事評價，中國開源大模型擁有像MiniCPM這樣好的模型，卻沒有得到與技術實力相當的國際關註。

構建開放技術社區環境

　　面壁智能成立於2022年8月，其核心技術團隊源於清華自然語言處理實驗室，是在國內較早開展大模型研究的團隊之一。抄襲事件發酵後，面壁智能的聯合創始人兼CEO李大海在朋友圈發文表示，希望團隊的努力和優秀工作能夠吸引更多人的關註和認可，但並非以這種被模仿甚至抄襲的方式。他進一步強調，應該構建一個開放、協作且充滿信任的技術社區環境。

　　面壁智能首席科學傢、清華大學長聘副教授劉知遠也在知乎上發文表示，這次事件讓他感慨“過去十幾年科研經歷的鬥轉星移”：“從橫向來看，我們顯然仍與國際頂尖工作如Sora和GPT-4o有顯著差距；同時，從縱向來看，我們已經從十幾年的無名之輩（nobody），快速成長為人工智能科技創新的關鍵推動者。面向即將到來的通用人工智能（AGI）時代，我們應該更加自信積極地投身其中。”

專傢：數據和應用中國有優勢

　　盡管中國在AI大模型的研發上起步稍晚，但其發展速度快。清華大學人工智能學院教授沈陽在接受大公報采訪時說，OpenAI在2022年推出ChatGPT，讓大眾真切感受到AI領域國內外的差距，近年來一度有“國外一開源、國內就自研”的說法。但國內從業者們“知恥而後勇”，開始進行追趕，中國湧現出一大批知名AI大模型企業，雙方在這一領域的差距正在縮小。

　　“抄襲事件之所以引起廣泛大傢關註，主要在於‘反向抄襲’此前比較少見，過去國內AI團隊基於國外開源大模型來開發的情況比較多。”沈陽表示，中國國產大模型已經出現瞭越來越多的可圈可點之處，當前中美在大模型技術層面上至少可以做到“你中有我、我中有你”。“這件事可能是史丹福的學生團隊希望盡快拿到融資，因此抄襲中國數據訓練過的大模型進行‘套殼’。”

　　沈陽認為，中國在大模型研發領域有多項優勢，尤其是中國具備龐大的數據資源和應用場景。例如在制造業層面，從傳統產業到“新三樣”，中國形成瞭大批優勢產業集群；在服務業層面，中國的短視頻、電子商務，以及網文、移動遊戲等，都已經做到世界第一。這為中國大模型的訓練提供瞭強有力的支持，讓中國在AI大模型領域的發展更加迅速，具備在不遠的將來實現“彎道超車”的可能性。

點讚(0) 打賞

本文分类：國際政情
本文标签：無
浏览次数：28 次瀏覽
发布日期：2024-06-22 04:03:20
本文链接：https://shuohk.com/cms/guojizhengqing/133415.html

上一篇 > 記者測試：圖片識別強細節待完善
下一篇 > TikTok向法院申訴斥華府“政治煽動”

史丹福大學團隊被揭抄襲中國AI模型

评论列表共有 0 條評論

發表評論取消回复

﻿史丹福大學團隊 被揭抄襲中國AI模型

港三原來喜歡錄取這些雙非學生！

世界海鮮飯日 | 最正宗的海鮮飯Paella，找到瞭！

這幾款葷素搭配的涼菜，經典永不過時！

曾志伟的四个孩子：一个名导，一个败家，一个远嫁，一个50岁未婚

评论列表 共有 0 條評論

發表評論 取消回复

史丹福大學團隊被揭抄襲中國AI模型

评论列表共有 0 條評論

發表評論取消回复