商湯AI新應用相片生成1分鐘短片

28 閱讀 0 評論 0 點讚

　　圖：商湯AI新應用相片生成1分鐘短片

　　【大公報訊】商湯（00020）昨宣佈，推出首個向用戶開放的可控人物視頻生成大模型Vimi，基於商湯日日新大模型（SenseNova）的能力，一張照片可生成長達1分鐘的人物短片，突破目前市面上隻能生成3至4秒的技術。

　　2024世界人工智能大會昨日上海揭幕，商湯推出的生成大模型Vimi成為大會最創新展品。

　　目前，行業中80%短片都以人物為主要題材，加上短片、直播平臺崛起，以人物為主體的短片需求大幅增長。Vimi的特點在於隻需一張任何風格的照片，便能生成與目標動作一致的人物類短片，並支持多種驅動方式，包括通過已有人物影片、動畫、聲音、文字等元素進行驅動。

　　目前，市場上有不少讓照片中人物動起來的技術，惟仍然受制於多項因素，例如人物動作、表情動作無法精準控制，需要頻繁輸入多項“指令”，務求提升結果精準度。據介紹，Vimi可實現精準的人物表情控制，還可控制照片中人物上半身的自然肢體動作，並自動生成與人物相符的頭發、服飾及背景變化。同時，光影變化亦能做到合理生成，讓人物動作和視覺效果流暢自然。

　　Vimi已在商湯網開放預約，將於今日商湯舉辦的“大愛無疆．向新力”人工智能論壇上披露更多細節。用戶現可上傳不同角度的高清人物照片，即可自動生成數字分身和不同風格的寫真短片。

點讚(0) 打賞