二区三区少妇,变态夫妇 波多野结衣,日本欧美久久久久久,久久久婷婷热,69欧美精品,色色亚洲无码色色热热,亚洲中文字幕在线刺激,久久久久久66,性感美女131视频

車(chē)訊網(wǎng) - 專(zhuān)業(yè)汽車(chē)新聞資訊門(mén)戶(hù)
當(dāng)前位置: 車(chē)訊網(wǎng) -> 熱點(diǎn)

MIT與英偉達(dá)聯(lián)手:HART工具革新圖像生成技術(shù)

時(shí)間:2025-04-11 10:32  |  責(zé)任編輯:匡章  |  來(lái)源: 中國(guó)廣告網(wǎng)  |  關(guān)鍵詞:  |  閱讀量:13997  |  會(huì)員投稿

MIT攜手英偉達(dá)推出HART工具,為圖像生成技術(shù)帶來(lái)全新變革

近日,外媒報(bào)道了一則令人矚目的科技成果:美國(guó)麻省理工學(xué)院與英偉達(dá)公司(NVIDIA)的研究人員成功研發(fā)出一種創(chuàng)新方法,巧妙融合了兩種常見(jiàn)圖像生成方式的優(yōu)勢(shì),打造出一款名為 HART(混合自回歸轉(zhuǎn)換器的縮寫(xiě))的混合圖像生成工具。

HART:圖像生成新利器

HART 運(yùn)用自回歸模型,能夠迅速勾勒出圖像的整體輪廓,隨后借助小型擴(kuò)散模型對(duì)圖像細(xì)節(jié)進(jìn)行精細(xì)優(yōu)化。它生成的圖像質(zhì)量,與當(dāng)前頂尖擴(kuò)散模型所生成的不相上下,甚至更勝一籌,而生成速度卻提升了九倍之多。更為突出的是,HART 在圖像生成過(guò)程中,消耗的計(jì)算資源比典型擴(kuò)散模型要少,這使得它可以在普通商用筆記本電腦或智能手機(jī)上本地運(yùn)行。用戶(hù)只需在 HART 界面輸入自然語(yǔ)言提示,就能輕松獲得生成的圖像。其應(yīng)用前景十分廣闊,比如助力研究人員訓(xùn)練機(jī)器人執(zhí)行復(fù)雜現(xiàn)實(shí)任務(wù),幫助設(shè)計(jì)師為視頻游戲構(gòu)建更具吸引力的場(chǎng)景。

創(chuàng)新融合,突破傳統(tǒng)局限

像 Stable Diffusion 和 DALL - E 這類(lèi)流行的擴(kuò)散模型,雖能生成細(xì)節(jié)豐富的圖像,但生成過(guò)程較為繁瑣。它們通過(guò)迭代,對(duì)每個(gè)像素預(yù)測(cè)隨機(jī)噪聲并減去,這一 “去噪” 過(guò)程可能需重復(fù) 30 步甚至更多,導(dǎo)致整體速度緩慢且計(jì)算成本高昂,不過(guò)多次修正機(jī)會(huì)保證了圖像的高質(zhì)量。自回歸模型在文本預(yù)測(cè)中廣泛應(yīng)用,它通過(guò)依次預(yù)測(cè)圖像塊來(lái)生成圖像,順序預(yù)測(cè)過(guò)程比擴(kuò)散模型快很多,但其采用自動(dòng)編碼器壓縮原始圖像像素為離散標(biāo)記,在重建圖像時(shí),因壓縮導(dǎo)致的信息丟失可能引發(fā)錯(cuò)誤,且無(wú)法回溯修正。

HART 創(chuàng)新性地采用混合方法,先用自回歸模型預(yù)測(cè)壓縮的離散圖像標(biāo)記,再用小型擴(kuò)散模型預(yù)測(cè)殘差標(biāo)記,以此彌補(bǔ)信息損失。由于擴(kuò)散模型只需處理自回歸模型完成后的剩余細(xì)節(jié),僅需八步就能完成任務(wù),而標(biāo)準(zhǔn)擴(kuò)散模型通常需要 30 步以上。額外引入的擴(kuò)散模型,在幾乎不增加計(jì)算量的情況下,保留了自回歸模型的速度優(yōu)勢(shì),還極大提升了生成復(fù)雜圖像細(xì)節(jié)的能力。

在研發(fā) HART 時(shí),研究人員克服了高效整合擴(kuò)散模型以增強(qiáng)自回歸模型的難題。他們發(fā)現(xiàn),在自回歸過(guò)程早期集成擴(kuò)散模型會(huì)導(dǎo)致誤差累積,所以最終設(shè)計(jì)僅在最后一步應(yīng)用擴(kuò)散模型預(yù)測(cè)剩余標(biāo)記,顯著提高了圖像生成質(zhì)量。研究人員結(jié)合了 7 億參數(shù)的自回歸轉(zhuǎn)換器模型和 3700 萬(wàn)參數(shù)的輕量級(jí)擴(kuò)散模型,生成圖像質(zhì)量與 20 億參數(shù)擴(kuò)散模型相當(dāng),速度卻快九倍,計(jì)算量還少約 31%。

未來(lái)可期

HART 因采用自回歸模型承擔(dān)大量工作,更易于與新型統(tǒng)一視覺(jué) - 語(yǔ)言生成式模型集成。未來(lái),人們或許能與這類(lèi)模型互動(dòng),比如讓其展示組裝家具的中間步驟。展望后續(xù),研究人員計(jì)劃基于 HART 架構(gòu)打造視覺(jué) - 語(yǔ)言模型,并憑借其擴(kuò)展性和多模態(tài)通用性,嘗試將其應(yīng)用于視頻生成和音頻預(yù)測(cè)任務(wù),持續(xù)拓展其應(yīng)用邊界。

免責(zé)聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),與本網(wǎng)無(wú)關(guān)。僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

巴楚县| 鹿邑县| 惠州市| 秦皇岛市| 麻阳| 五华县| 连江县| 贵定县| 化隆| 开远市| 遂宁市| 建平县| 伊通| 甘谷县| 辽宁省| 苏尼特左旗| 临洮县| 凌云县| 中宁县| 方山县| 泰安市| 邵武市| 锡林郭勒盟| 永寿县| 建阳市| 辽阳县| 芜湖市| 阿克| 万山特区| 玉田县| 密云县| 那坡县| 奈曼旗| 东乌| 驻马店市| 天峨县| 出国| 淄博市| 金寨县| 渭源县| 娄烦县|