百度日前官方宣佈文心一言語音定制功能上線,隻需2秒鐘,AI 就能完美重建任何一個人的聲音,每個人都能擁有自己的AI聲優。
用戶隻需打開文心一言App,選擇創建智能體,點擊創建自己的聲音,隨後系統會給出一句話,隻需用平時說話的語氣念一遍。
約2秒左右即可獲得媲美真人、流暢自然的合成效果,並且合成的音頻完美保持瞭朗讀這句話時的情感、風格和自然度。
不僅如此,用戶還能構建自己的個性化音庫,再匹配上虛擬形象,即可快速打造出一個數字分身。
此外,該功能對不同性別、不同年齡的人均適用,尤其是小孩和重口音的兼容效果非常出色,能很好的保留相應的風格和口音,適合中國社會地域分佈廣泛,口音眾多的特點。
而且相比於傳統學術領域的語音合成技術,百度新技術有較強的抗噪能力,即使原始錄制音頻背景嘈雜,依然能夠獲得流暢的、音質幹凈的合成效果。
據介紹,之所以能在2秒鐘內復刻聲音,是因為百度的語音合成新技術,可以讓AI真正理解文本和聲音的對應關系。
很多時候甚至能理解文本中的情緒,最大程度上保持原聲的情感、風格和自然度,因此隻需要極短的樣本,幾秒鐘就能完成。
發表評論 取消回复