快科技5月9日消息,阿裡雲正式發佈瞭通義千問2.5,模型性能全面趕超GPT-4 Turbo,聲稱地表最強中文大模型。

阿裡雲發佈通義千問2.5 全面趕超GPT-4 Turbo

據瞭解,通義千問2.5最新開源的1100億參數模型在多個基準測評中均取得瞭最佳成績,成功超越瞭Meta的Llama-3-70B模型,成為開源領域的新標桿。

相比通義千問2.1版本,通義千問2.5在上述四項能力上分別提升瞭9%、16%、19%和10%,其中中文能力更是持續領先業界。

在權威基準OpenCompass上,通義千問2.5的得分追平瞭GPT-4 Turbo,這是該基準首次有國產大模型取得如此出色的成績。這一成績不僅證明瞭通義千問2.5在中文語境下的卓越性能,也展示瞭阿裡雲在人工智能領域的創新能力。

除瞭通義千問2.5外,阿裡雲還發佈瞭最新款開源模型Qwen1.5-110B。這款擁有1100億參數的模型在MMLU、TheoremQA、GPQA等基準測評中均超越瞭Meta的Llama-3-70B模型,並在HuggingFace推出的開源大模型排行榜Open LLM Leaderboard上榮登榜首,進一步鞏固瞭通義開源系列在業界的領先地位。

通義的多模態模型和專有能力模型也展現出瞭業界頂尖的影響力。其中,通義千問視覺理解模型Qwen-VL-Max在多個多模態標準測試中超越瞭Gemini Ultra和GPT-4V,目前已在多傢企業落地應用,為各行各業帶來瞭實質性的幫助。

阿裡雲發佈通義千問2.5 全面趕超GPT-4 Turbo

此外,通義千問代碼大模型CodeQwen1.5-7B也是值得一提的亮點。這款模型在HuggingFace代碼模型榜單Big Code上位居前列,同時還是國內用戶規模第一的智能編碼助手通義靈碼的底座。

點讚(0) 打賞

评论列表 共有 0 條評論

暫無評論

微信小程序

微信扫一扫體驗

立即
投稿

微信公眾賬號

微信扫一扫加關注

發表
評論
返回
頂部