如今AI大時代,世界各大巨頭都有自己的特色AI產品計劃,日前據英偉達官方消息,英偉達聯合 Georgia Tech、UMD 和 HKPU 的研究團隊推出瞭全新的視覺語言模型 ——NVEagle。

英偉達推全新視覺AI語音模型 可以直接看圖聊天

據悉,NVEagle 能夠理解復雜的現實場景,通過視覺輸入進行更好的解讀和回應。它的設計核心在於將圖像轉化為視覺標記,再與文本嵌入相結合,進而提升瞭對視覺信息的理解。

NVEagle包括瞭三個版本:Eagle-X5-7B、Eagle-X5-13B 以及 Eagle-X5-13B-Chat。其中,7B 和13B 版本主要用於一般的視覺語言任務,而13B-Chat 版本則專門針對對話式 AI 進行瞭微調,能夠更好地進行基於視覺輸入的互動。

NVEagle 的一個亮點在於采用瞭混合專傢(MoE)機制,能夠根據不同任務動態選擇最合適的視覺編碼器,這極大提升瞭對復雜視覺信息的處理能力。該模型已在 Hugging Face 上發佈,方便研究人員和開發者使用。

英偉達推全新視覺AI語音模型 可以直接看圖聊天

點讚(0) 打賞

评论列表 共有 0 條評論

暫無評論

微信小程序

微信扫一扫體驗

立即
投稿

微信公眾賬號

微信扫一扫加關注

發表
評論
返回
頂部