圖:商湯AI新應用 相片生成1分鐘短片

  【大公報訊】商湯(00020)昨宣佈,推出首個向用戶開放的可控人物視頻生成大模型Vimi,基於商湯日日新大模型(SenseNova)的能力,一張照片可生成長達1分鐘的人物短片,突破目前市面上隻能生成3至4秒的技術。

  2024世界人工智能大會昨日上海揭幕,商湯推出的生成大模型Vimi成為大會最創新展品。

  目前,行業中80%短片都以人物為主要題材,加上短片、直播平臺崛起,以人物為主體的短片需求大幅增長。Vimi的特點在於隻需一張任何風格的照片,便能生成與目標動作一致的人物類短片,並支持多種驅動方式,包括通過已有人物影片、動畫、聲音、文字等元素進行驅動。

  目前,市場上有不少讓照片中人物動起來的技術,惟仍然受制於多項因素,例如人物動作、表情動作無法精準控制,需要頻繁輸入多項“指令”,務求提升結果精準度。據介紹,Vimi可實現精準的人物表情控制,還可控制照片中人物上半身的自然肢體動作,並自動生成與人物相符的頭發、服飾及背景變化。同時,光影變化亦能做到合理生成,讓人物動作和視覺效果流暢自然。

  Vimi已在商湯網開放預約,將於今日商湯舉辦的“大愛無疆.向新力”人工智能論壇上披露更多細節。用戶現可上傳不同角度的高清人物照片,即可自動生成數字分身和不同風格的寫真短片。

點讚(0) 打賞

评论列表 共有 0 條評論

暫無評論

微信小程序

微信扫一扫體驗

立即
投稿

微信公眾賬號

微信扫一扫加關注

發表
評論
返回
頂部