人人都能做導(dǎo)演?Sora2的幻象與真相
國(guó)慶假期,全球AI圈被一枚“重磅炸彈”炸醒。
OpenAI發(fā)布新一代AI視頻模型Sora 2及其配套應(yīng)用Sora App,即使需要填寫(xiě)邀請(qǐng)碼才能使用,也沒(méi)有減弱網(wǎng)友的熱情,社交平臺(tái)上充滿(mǎn)了尋求邀請(qǐng)碼的信息。短短四天內(nèi),這款A(yù)pp便空降美區(qū)App Store免費(fèi)榜榜首,力壓ChatGPT、Google Gemini等一眾頭部AI產(chǎn)品,迅速成為海外創(chuàng)作者、內(nèi)容營(yíng)銷(xiāo)人和TikTok賣(mài)家的新寵。
社交平臺(tái)瞬間被AI生成的“同人宇宙”刷屏:動(dòng)漫角色穿越現(xiàn)實(shí)街道,游戲角色在都市中穿行,甚至連OpenAI CEO山姆·奧爾特曼也被網(wǎng)友“玩出花”——他出現(xiàn)在東北炕頭吃飯、在阿里會(huì)議室講“閉環(huán)”“賦能”,甚至化身外賣(mài)騎手穿梭于城市街頭。
奧爾特曼本人將Sora 2稱(chēng)為“創(chuàng)意領(lǐng)域的ChatGPT 3.5時(shí)刻”。從官方演示到網(wǎng)上用戶(hù)實(shí)測(cè),Sora 2在物理邏輯、畫(huà)面連貫性、真實(shí)感和音畫(huà)同步等方面實(shí)現(xiàn)了質(zhì)的飛躍,被多家媒體譽(yù)為“將AI視頻生成推向新高度”。
DoNews在進(jìn)行了體驗(yàn)后認(rèn)為:Sora 2確實(shí)強(qiáng)大,但距離“現(xiàn)實(shí)不存在了”的預(yù)言,還是有一定距離。
01.
創(chuàng)造力炸裂,細(xì)節(jié)仍存“AI感”
Sora App以Sora 2為技術(shù)基礎(chǔ),Sora 2直接內(nèi)置了對(duì)話(huà)、音效和背景音樂(lè)的自動(dòng)生成能力,可以實(shí)現(xiàn)音頻和視頻同步生成,改變了以往AI視頻生成工具沒(méi)有聲音的狀況。
進(jìn)入Sora App后,主頁(yè)底部設(shè)有功能欄,從左到右依次為「視頻推薦」「靈感廣場(chǎng)」「生成器」「消息」「?jìng)€(gè)人主頁(yè)」。很多人將其稱(chēng)為“AI版抖音”,正是因?yàn)榻缑婕笆醉?yè)推薦邏輯與之相似——App主頁(yè)為垂直視頻流,用戶(hù)可上下滑動(dòng)瀏覽其他用戶(hù)發(fā)布的內(nèi)容。

其中,靈感廣場(chǎng)用于展示熱門(mén)作品。由于Sora App生成視頻后,提示詞會(huì)默認(rèn)成為視頻配文,因此熱門(mén)視頻的提示詞可直接復(fù)制修改后使用。
生成器是用戶(hù)制作視頻的核心功能區(qū),有兩點(diǎn)值得注意:一是不支持上傳用戶(hù)自制視頻素材,僅能通過(guò)AI生成視頻;二是不支持單獨(dú)撰寫(xiě)短視頻文案——用戶(hù)輸入的文案會(huì)默認(rèn)作為生成視頻的提示詞。
此外,也可使用他人的虛擬數(shù)字形象,通過(guò)文生視頻或圖生視頻功能創(chuàng)作,但前提是對(duì)方將形象設(shè)為公開(kāi)。具體操作是:撰寫(xiě)提示詞時(shí)點(diǎn)擊他人頭像,其ID會(huì)自動(dòng)填入提示詞;因此,使用他人形象發(fā)布視頻時(shí),系統(tǒng)會(huì)自動(dòng)該用戶(hù)——這也意味著,形象設(shè)為公開(kāi)即默認(rèn)允許App內(nèi)其他用戶(hù)使用。
不過(guò),并非每次生成都能一次成功。DoNews再次嘗試生成奧爾特曼剝獼猴桃的視頻時(shí),剝獼猴桃的細(xì)節(jié)就出現(xiàn)了錯(cuò)誤,有明顯的AI痕跡。
DoNews又以?shī)W爾特曼和另一用戶(hù)的數(shù)字形象創(chuàng)建了一段多角色視頻,提示詞是:“samathomasdimson扮演《后宮甄嬛傳》里面的華妃娘娘和皇后娘娘,穿著清朝的妃嬪服制,用中文吵架。”系統(tǒng)檢測(cè)到版權(quán)問(wèn)題無(wú)法生成,刪除提示詞中的《后宮甄嬛傳》后,生成就不再被拒絕。
在這段雙人互動(dòng)視頻中,提示詞只提到“用中文吵架”,而Sora再次為角色添加了臺(tái)詞,二人的吵架內(nèi)容也符合清宮戲的背景。但細(xì)節(jié)仍有瑕疵,比如中間有一句臺(tái)詞的聲音沒(méi)有對(duì)口型,后面皇后的臺(tái)詞錯(cuò)誤地對(duì)應(yīng)到了華妃的嘴型。
這種臺(tái)詞錯(cuò)位的情況在多角色視頻中發(fā)生的概率似乎較高,在DoNews之后生成的另一段多人對(duì)話(huà)視頻中也出現(xiàn)了類(lèi)似問(wèn)題。
整體來(lái)看,Sora 2在物理世界理解方面確實(shí)表現(xiàn)不俗,用戶(hù)數(shù)字人的物理效果和唇型同步效果良好,基本的一致性做得不錯(cuò)。但涉及到多元素的物體交互時(shí),仍會(huì)出現(xiàn)多角色臺(tái)詞錯(cuò)位、物體交互bug的問(wèn)題,保留了明顯的“AI感”。
“AI配音”本身也存在缺陷:語(yǔ)氣生硬、情感適配度低,若提示詞未明確語(yǔ)調(diào),生成的對(duì)話(huà)會(huì)顯得機(jī)械。同時(shí),“構(gòu)思提示詞”的門(mén)檻依然存在——普通用戶(hù)可能因描述不細(xì)致,導(dǎo)致生成的視頻偏離預(yù)期,而專(zhuān)業(yè)創(chuàng)作者則需花費(fèi)時(shí)間優(yōu)化提示詞,才能彌補(bǔ)AI的細(xì)節(jié)不足。
02.
創(chuàng)意ChatGPT時(shí)刻未到,娛樂(lè)版抖音還差口氣
OpenAI在官方聲明中,將Sora 2定位為“*進(jìn)的視頻和音頻生成模型”,更明確對(duì)比:2024年2月發(fā)布的初代Sora是視頻領(lǐng)域的“GPT-1時(shí)刻”,而Sora 2直接邁入了“GPT-3.5時(shí)刻”。
從音畫(huà)同步、人物ID一致性到多鏡頭敘事的技術(shù)突破來(lái)看,Sora 2確實(shí)刷新了AI視頻生成的上限,但距離“重塑創(chuàng)意領(lǐng)域”和“成為新一代娛樂(lè)社交平臺(tái)”,它顯然還差點(diǎn)火候。
“Sora 2生成的音頻真實(shí)感、清晰度,把之前的AI音效工具甩開(kāi)好幾條街,甚至比谷歌Veo 3還略勝一籌?!毙⌒褚魳?lè)創(chuàng)始人兼CEO、AIGC藝術(shù)家小旭的評(píng)價(jià),點(diǎn)出了Sora 2的核心優(yōu)勢(shì)——易用性。它把復(fù)雜的視頻生成流程簡(jiǎn)化成“輸入提示詞+選形象”,尤其是Cameo功能,用戶(hù)錄幾秒臉部視頻就能克隆專(zhuān)屬虛擬形象和聲音,門(mén)檻低到普通用戶(hù)也能上手。
但優(yōu)勢(shì)之外,硬傷同樣明顯?!澳壳吧傻囊曨l時(shí)長(zhǎng)比較短,只有10秒鐘,這個(gè)在正規(guī)的創(chuàng)作中還是顯得略短了一些?!贝送?,分辨率也不太行,App里沒(méi)法調(diào)畫(huà)質(zhì),默認(rèn)只有480P或360P,橫版還得用PC端才能生成。在小旭看來(lái),Sora2是瞄準(zhǔn)AI社交去的,并不是一個(gè)純粹的AI工具。
Sora App目前采用的邀請(qǐng)制也可以驗(yàn)證他的看法,當(dāng)一個(gè)邀請(qǐng)碼注冊(cè)成功后,可以再生出4個(gè)邀請(qǐng)碼,分享給其他用戶(hù)后,這些用戶(hù)激活賬號(hào)又能獲得4個(gè)新的邀請(qǐng)碼,如此形成裂變循環(huán)。而且一旦使用他人的邀請(qǐng)碼,系統(tǒng)會(huì)自動(dòng)關(guān)注邀請(qǐng)方,逐步構(gòu)建起好友社交網(wǎng)絡(luò)。
用戶(hù)車(chē)車(chē)體驗(yàn)后認(rèn)為,其娛樂(lè)性“遠(yuǎn)不如抖音”:“Sora上的內(nèi)容更像‘自?shī)首詷?lè)’——每個(gè)人生成的視頻都是圍繞自己的虛擬形象或簡(jiǎn)單場(chǎng)景,沒(méi)有抖音那樣的話(huà)題挑戰(zhàn)、達(dá)人生態(tài),也缺乏能引發(fā)大眾共鳴的內(nèi)容,刷幾條就會(huì)覺(jué)得單調(diào)?!?/p>
這種“娛樂(lè)性短板”,和Sora 2嚴(yán)格的限制掛鉤。為規(guī)避版權(quán)、肖像權(quán)風(fēng)險(xiǎn),它會(huì)直接拒絕生成多數(shù)真實(shí)名人、影視角色,甚至普通人物形象的創(chuàng)作也有諸多約束。用戶(hù)能發(fā)揮的題材空間被壓縮,自然難以產(chǎn)出多樣化、有傳播力的內(nèi)容——反觀(guān)抖音,從生活記錄到創(chuàng)意短劇,內(nèi)容邊界寬泛,再加上評(píng)論互動(dòng)、合拍、話(huà)題榜等功能,社交粘性遠(yuǎn)非Sora2可比。
綜上,Sora 2無(wú)疑是一次技術(shù)飛躍,它顯著降低了AI視頻創(chuàng)作的門(mén)檻,將此前分散的視頻、音頻生成步驟整合,讓普通用戶(hù)也能輕松體驗(yàn)創(chuàng)作的樂(lè)趣。
然而,無(wú)論是從其有限的畫(huà)質(zhì)與時(shí)長(zhǎng)、純AI生成內(nèi)容導(dǎo)致的同質(zhì)化傾向,還是技術(shù)上尚未克服的細(xì)節(jié)瑕疵來(lái)看,它距離成為引發(fā)創(chuàng)意領(lǐng)域革命的“ChatGPT時(shí)刻”以及媲美抖音的娛樂(lè)平臺(tái),仍差一口氣。
對(duì)于普通用戶(hù),Sora 2是一款有趣、易上手的新玩具;但對(duì)于追求高質(zhì)量、長(zhǎng)序列和強(qiáng)一致性的專(zhuān)業(yè)創(chuàng)作者而言,它仍不是一個(gè)成熟可靠的生產(chǎn)力工具。OpenAI的這枚“炸場(chǎng)”新星,優(yōu)點(diǎn)與缺點(diǎn)同樣突出,它的真正成熟,或許還需要等待下一個(gè)版本的迭代。
免責(zé)聲明:此文內(nèi)容為本網(wǎng)站轉(zhuǎn)載企業(yè)宣傳資訊,僅代表作者個(gè)人觀(guān)點(diǎn),與本網(wǎng)無(wú)關(guān)。僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。
最新內(nèi)容
- 特斯拉正在「始祖鳥(niǎo)化」
- 洞庭湖區(qū)收糧忙
- 防住風(fēng)王!廣東貢獻(xiàn)“教科書(shū)級(jí)”案例央視專(zhuān)題
- 《得物戶(hù)外運(yùn)動(dòng)白皮書(shū)》:6成用戶(hù)年消費(fèi)超8
- LG新能源第三季度利潤(rùn)預(yù)計(jì)增長(zhǎng)34%
- 體驗(yàn)再進(jìn)階問(wèn)界M92024款華為ADS小藍(lán)
- 長(zhǎng)城汽車(chē)澳洲GWMTECHDAY技術(shù)自信再
- 大洋洲市場(chǎng)爆發(fā),比亞迪、上汽通用五菱增速超
- 阿維塔加入品牌強(qiáng)國(guó)工程成為“CCTV.央企
- 比豪華更野,比越野更奢!縱橫G700首發(fā)試




