IT之傢4月9日消息,根據美國商標和專利局(USPTO)近日公示的清單,微軟攜手OpenAI構想瞭一個聲音識別AI技術專利,不僅能夠識別門鈴、狗叫或嬰兒啼哭等日常聲音,還能檢測地震和風暴等自然災害的跡象。
微軟構想的該系統通過處理環境聲音,可以提醒用戶註意潛在的危險,可以在公共安全、備災工作發揮重要作用。
微軟這項聲音AI專利的核心在於對音頻信號的復雜處理。
系統首先將聲音信號分解成較小的片段,在經過獨立處理之後創建聲音在時域中的規范化表示,本質上是聲音在時間軸上的映射。
然後該系統映射數據輸入神經網絡,進一步匹配和評估聲音片段,識別出的每一類聲音事件的分配得分(assigning scores)和發生概率。
系統再調用算法進行後期處理之後,完善這些分數和概率,為每種聲音類型生成置信度值(confidence values)。這一細致的過程使人工智能能夠準確識別從普通到潛在危險的各種聲音。
發表評論 取消回复