賓夕法尼亞大學(xué)開發(fā)AI音頻編輯器SmartDJ只需簡單指令即可重塑音頻體
蓋世汽車訊 據(jù)外媒報(bào)道,賓夕法尼亞大學(xué)的工程師開發(fā)出人工智能(AI)音頻編輯器SmartDJ,用戶只需使用日常語言的簡單指令即可修改沉浸式音頻環(huán)境,其潛在應(yīng)用領(lǐng)域包括虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)、游戲和聲音設(shè)計(jì)。SmartDJ無需用戶指定具體的編輯內(nèi)容,即可響應(yīng)諸如“讓這里聽起來像繁忙的辦公室”之類的高級(jí)指令,然后規(guī)劃并執(zhí)行實(shí)現(xiàn)該效果所需的步驟。
該系統(tǒng)解決了早期AI音頻編輯工具的兩大局限性:首先,大多數(shù)先前的系統(tǒng)更適用于僵化的、模板式的命令,需要用戶識(shí)別要添加或刪除的聲音;其次,這些工具通常處理的是單聲道或“單軌”音頻,失去了沉浸式音頻體驗(yàn)所必需的空間線索。
相比之下,SmartDJ能夠理解高級(jí)指令,并且專為立體聲音頻設(shè)計(jì),因此能夠進(jìn)行編輯,從而更好地保留或重塑場景的空間結(jié)構(gòu)。
計(jì)算機(jī)與信息科學(xué)系助理教授Mingmin Zhao表示:“使用SmartDJ,用戶可以用自然語言描述他們想要的結(jié)果,系統(tǒng)會(huì)自動(dòng)找出實(shí)現(xiàn)的方法。這證明AI可以幫助人們使用簡單的語言以直觀的方式編輯音頻。”
語言模型與擴(kuò)散模型的結(jié)合
免責(zé)聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),與本網(wǎng)無關(guān)。僅供讀者參考,并請自行核實(shí)相關(guān)內(nèi)容。
最新內(nèi)容
- 東風(fēng)汽車:從產(chǎn)品出口到體系出?!獤|風(fēng)商用
- 4月新能源車市:零跑坐穩(wěn)新勢力王位比亞迪海
- 廣西“五一”假期文旅盛宴齊綻放特色活動(dòng)嗨不
- 千年商脈通古今,《城市風(fēng)華錄》走進(jìn)文明城市
- CHINAPLAS2026國際橡塑展在上海
- 甘肅文旅高校研學(xué)行:青春逐夢隴原,研學(xué)邂逅
- 電競粵超·惠州站總決賽決出“最強(qiáng)戰(zhàn)隊(duì)”
- E周看點(diǎn)|理想正式進(jìn)入阿聯(lián)酋、沙特阿拉伯市
- 移動(dòng)支付開啟海外消費(fèi)新體驗(yàn)
- 小城藏大美——縣域旅游成為“五一”出游新風(fēng)




